專利名稱:一種基于數(shù)字家庭的地理信息的可聽化表達(dá)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)字家庭技術(shù)領(lǐng)域,具體涉及一種基于數(shù)字家庭的地理信息的可聽化 表達(dá)方法。
背景技術(shù):
地理信息系統(tǒng)(Geographic Information System,簡稱GIS)作為獲取、整理、分析 和管理地理空間數(shù)據(jù)的重要工具、技術(shù)和學(xué)科,近年來得到了廣泛關(guān)注和迅猛發(fā)展。由于信 息技術(shù)的發(fā)展,數(shù)字時代的來臨,到今天已經(jīng)逐漸成為一門相當(dāng)成熟的技術(shù),并且得到了極 廣泛的應(yīng)用。尤其是近些年,GIS更以其強(qiáng)大的地理信息空間分析功能,在GPS及路徑優(yōu)化 中發(fā)揮著越來越重要的作用。GIS地理信息系統(tǒng)是以地理空間數(shù)據(jù)庫為基礎(chǔ),在軟硬件的支 持下,運(yùn)用系統(tǒng)工程和信息科學(xué)的理論,科學(xué)管理和綜合分析具有空間內(nèi)涵的地理數(shù)據(jù),以 提供管理、決策、以及應(yīng)用服務(wù)等所需信息的技術(shù)系統(tǒng)??梢暬瘧?yīng)用(Visualization Application)以數(shù)字家庭應(yīng)用為基礎(chǔ),建立城市、區(qū) 域、或大型建筑工程、著名風(fēng)景名勝區(qū)的可視化模型,與數(shù)字電視應(yīng)用后臺結(jié)合,實(shí)現(xiàn)實(shí)景 模型瀏覽實(shí)時瀏覽地理環(huán)境、地理信息查詢以及購物等一些互動應(yīng)用服務(wù)功能??陕牷?究起源于20世紀(jì)50年代,21世紀(jì)初因計(jì)算機(jī)信息技術(shù)的發(fā)展成為研究熱點(diǎn)。狹義的可聽 化是指用非語音信號表達(dá)信息,它立足于計(jì)算機(jī)信息論,側(cè)重于科學(xué)數(shù)據(jù)聽覺表達(dá);廣義的 可聽化是為了信息交流或數(shù)據(jù)解釋,將某科學(xué)領(lǐng)域的數(shù)據(jù)聯(lián)系轉(zhuǎn)化為以聽覺信號表現(xiàn)的感 知聯(lián)系,用人類可辨析的聲音信號表達(dá)信息??陕牷欣谌藗儶?dú)立獲取或幫助理解從視 覺通道獲取的信息,是一門涉及認(rèn)知、聲學(xué)、藝術(shù)、工程學(xué)等方面的交叉學(xué)科。20世紀(jì)90年 代可聽化開始應(yīng)用于地理信息表達(dá),除可為有視覺障礙的用戶提供表達(dá)替代方式外,還廣 泛應(yīng)用于地理信息系統(tǒng)和多媒體圖集中的音視頻和文本注記解說、3維虛擬仿真、車輛語音 導(dǎo)航、少兒地理教育等諸多系統(tǒng)和產(chǎn)品中。在對此方法的研究和實(shí)踐過程中,本發(fā)明的發(fā)明人發(fā)現(xiàn)雖然可視化一直是表達(dá) 空間信息強(qiáng)有力的工具,網(wǎng)絡(luò)通信、多媒體以及三維圖像等高新科技的融入更使地理信息 可視化表達(dá)異彩紛呈。但是,海量數(shù)據(jù)呈現(xiàn)于方寸屏幕間,造成了視覺顯示繁雜、地圖視覺 載負(fù)量巨增等矛盾。計(jì)算機(jī)可聽化技術(shù)的發(fā)展,使聽覺獲取數(shù)據(jù)成為可能,并為地理信息提 供了新的表達(dá)方式。在現(xiàn)實(shí)世界中,人類視聽覺相得益彰,聽覺也是獲取信息的重要途徑, 重要性僅次于視覺。有聲信息時刻潛移默化被接收,人類多通道的感知避免了信息單通道 過載和信息獲取單一化。聽覺具有本能或自發(fā)感知的獨(dú)特功效,一些可聽化的研究領(lǐng)域正 在證明或已經(jīng)證明聽覺通道在某些領(lǐng)域的應(yīng)用中優(yōu)于其他通道,特別是在重要的信息突 變狀態(tài)以及視覺通道負(fù)荷過重等場合??陕牷?dú)立表達(dá)或輔助視覺表達(dá),對地理信息傳遞、 表達(dá)及認(rèn)知具有重大意義和實(shí)踐價值,在解決視覺感知過載,多重界面、大屏幕顯示以及信 息突發(fā)、臨界表達(dá)等問題方面尤為重要。于是本發(fā)明的發(fā)明人決定使用一種基于數(shù)字家庭 的地理信息的可視可聽化方法,結(jié)合可視可聽的優(yōu)點(diǎn)來設(shè)計(jì)。
發(fā)明內(nèi)容
本發(fā)明提供一種基于數(shù)字家庭的地理信息的可聽化方法,能夠獨(dú)立表達(dá)或輔助視 覺表達(dá),對地理信息傳遞、表達(dá)及認(rèn)知具有重大意義和實(shí)踐價值,在解決視覺感知過載,多 重界面、大屏幕顯示以及信息突發(fā)、臨界表達(dá)等問題方面尤為重要,這樣使可視可聽達(dá)到平 衡。本發(fā)明實(shí)施例提供了一種基于數(shù)字家庭的地理信息的可聽化表達(dá)方法,包括步驟1 信息的獲取,即進(jìn)行聲源的確定;步驟2 信息的處理,將各種信息作規(guī)范化處理,形成后續(xù)處理的應(yīng)用數(shù)據(jù),即特 征數(shù)據(jù);步驟3 信息映射;允許各種輸入信號找到相應(yīng)的映射規(guī)則,達(dá)到可聽化的目的, 根據(jù)特征數(shù)據(jù)的不同采用不同的映射模型得到參數(shù)化聲音;步驟4 聲音合成,形成參數(shù)化聲音;步驟5:聲音的播放。所述聲音的合成采用的方法分直接合成和間接合成,其中直接合成參照的是傅 立葉分析,間接合成則是收到ChernofT模型的影響。所述聲音的播放通過Window API、DirectSouncU DirectSound3D中的一種或者多 種來實(shí)現(xiàn)。由于本發(fā)明實(shí)施例采用一種基于數(shù)字家庭的地理信息的可聽化表達(dá),聽覺具有本 能或自發(fā)感知的獨(dú)特功效。因此多通道的感知避免了信息單通道過載和信息獲取單一化, 計(jì)算機(jī)等高新技術(shù)提供的良好平臺為可聽化表達(dá)提供了新契機(jī)。它的獨(dú)立表達(dá)或輔助表 達(dá),在信息突變狀態(tài)以及視覺通道負(fù)荷過重等場合優(yōu)于其他通道,其表達(dá)在地理信息的語 音閱讀、氛圍營造、沉浸表達(dá)等方面表現(xiàn)優(yōu)異。
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可 以根據(jù)這些附圖獲得其他的附圖。圖1為本發(fā)明實(shí)施例中的地理信息可視化和可聽化表達(dá)實(shí)現(xiàn)流程圖;圖2是本發(fā)明實(shí)施例中的地理信息可聽化表達(dá)實(shí)現(xiàn)流程圖;圖3是本發(fā)明實(shí)施例中的地理信息的可聽化應(yīng)用分類示意圖;圖4是本發(fā)明實(shí)施例中的離散無結(jié)構(gòu)映射示意圖;圖5是本發(fā)明實(shí)施例中的結(jié)構(gòu)化離散信息映射示意圖;圖6是本發(fā)明實(shí)施例中的高維點(diǎn)數(shù)據(jù)直接映射法示意圖;圖7是本發(fā)明實(shí)施例中的高維點(diǎn)數(shù)據(jù)間接映射法示意圖。
具體實(shí)施例方式本發(fā)明實(shí)施例提供一種基于數(shù)字家庭的地理信息的可聽化表達(dá)方法,能為各單位 之間的電子政務(wù)信息提供共享。以下分別進(jìn)行詳細(xì)說明。
本發(fā)明實(shí)施例提供一種數(shù)字家庭的地理信息的可聽化方法,能夠獨(dú)立表達(dá)或輔助 視覺表達(dá),對地理信息傳遞、表達(dá)及認(rèn)知具有重大意義和實(shí)踐價值,在解決視覺感知過載, 多重界面、大屏幕顯示以及信息突發(fā)、臨界表達(dá)等問題方面尤為重要。本發(fā)明實(shí)施例還提供 相應(yīng)地理信息可聽化表達(dá)實(shí)現(xiàn)系統(tǒng)。以下分別進(jìn)行詳細(xì)說明。完整的地理信息的可視可聽流程圖如圖1所示,其中完整的地理信息的可聽表達(dá) 流程如圖2所示。地理數(shù)據(jù)通過可聽化映射出符合人類聽覺認(rèn)知的聲音,由聽覺感知通道 被聆聽者所獲取。地理信息可聽化應(yīng)用廣泛、前景廣闊,對此綜述如圖3所示。一個完整的 可聽化表達(dá)體系包括信息提取、信息處理、聲音映射、聲音合成和聲音播放等5部分。從地 理專題數(shù)據(jù)中提取所需數(shù)據(jù)后,由等級數(shù)值過濾干擾信息并提取特征數(shù)據(jù),然后通過數(shù)據(jù) 到聲音映射輸出聲音參數(shù),最后參數(shù)合成聲音,輸出采樣值。
地理信息的可聽表達(dá)各步驟具體如下步驟1 信息的獲取(聲源的確定)聲源的確定即聲音數(shù)據(jù)的存儲及與空間實(shí)體的對應(yīng)關(guān)系的確定。聲音數(shù)據(jù)一般是 以文件或資源的方式存儲的,原則上不同的聲音對象分別對應(yīng)不同的空間實(shí)體,因此數(shù)據(jù) 獲取模塊是采集各種數(shù)據(jù)源的數(shù)據(jù),這些數(shù)據(jù)可以是離散的,也可以是連續(xù)的,可以是一維 的也可以是高維的。步驟2:信息的處理經(jīng)過步驟1我們得到了各種原始數(shù)據(jù),由于各種原始數(shù)據(jù)的結(jié)構(gòu)不盡相同,我們 需要將各種信息作規(guī)范化處理,形成我們可以做后續(xù)處理的的應(yīng)用數(shù)據(jù),即特征數(shù)據(jù)。步驟3:信息映射在可聽化應(yīng)用最重要的是有關(guān)的映射模型,所謂映射模型如圖一所示,是允許各 種輸入信號無結(jié)構(gòu)離散的,結(jié)構(gòu)離散的、圖形的圖象的。他們都可以在這個模型中找到相 應(yīng)的映射規(guī)則,達(dá)到可聽化的目的。輸出的則是各種參數(shù)化的聲音這些聲音可以是連續(xù)的, 也可以是離散的,即它們的分辨顆粒度可以改變。不同的輸入數(shù)據(jù)集,其映射的規(guī)則不相 同。其最重要的檢驗(yàn)標(biāo)準(zhǔn)就是,要使聲音信息表達(dá)的能力得到最大發(fā)揮。一般映射模型如 下所述無結(jié)構(gòu)離散化信息的映射是各種映射中最簡單的。相當(dāng)于點(diǎn)對點(diǎn)的映射,例如事 件A對應(yīng)為聲音a,事件B對應(yīng)與聲音η。諸如此類,最簡單也是最常見的就是windows系 統(tǒng)中經(jīng)常出現(xiàn)的伴隨警告信息出現(xiàn)的警告聲音。聽標(biāo)是這一類映射的典型例子。這種映射 最大的要求就是要是這種一對一的映射盡量自然符合人們交互的習(xí)慣。圖4所示的是離散 無結(jié)構(gòu)信息的映射模型。對于結(jié)構(gòu)化離散信息的映射,首先必須指定一套對應(yīng)于結(jié)構(gòu)化信息的映射規(guī)則, 當(dāng)任意一個屬于該信息集的信息輸入時,可以按照這種規(guī)則自動的生成參數(shù)化的可聽信 號。耳標(biāo)就是明顯的例子。這種映射方法應(yīng)該在符合人們交互習(xí)慣的同時,具備更強(qiáng)的自 適應(yīng)能力,即如果結(jié)構(gòu)發(fā)生了一定的變化,應(yīng)該可以根據(jù)規(guī)則生成器生成新的映射規(guī)則。例 如目錄增加了一層,那么構(gòu)成耳標(biāo)的映射規(guī)則應(yīng)該自動發(fā)生改變,構(gòu)造出新的映射規(guī)則,同 時又要對用戶產(chǎn)生較小的影響。圖5所示的是結(jié)構(gòu)化離散信息映射模型。一維連續(xù)信息的表達(dá)在可聽化中是最簡單的,因?yàn)槁曇舯旧砭涂梢钥醋鞣入S時 間的變化,因此可以直接將連續(xù)信號的值直接映射到聲音的幅度或者頻率上。一維連續(xù)數(shù)據(jù)從數(shù)據(jù)集本質(zhì)上來講是多維點(diǎn)信號的一種特例。那么多維點(diǎn)數(shù)據(jù)的可聽化可以使用我們 在參數(shù)化聲音章中所采用的加法合成的直接映射法、也可以使用參照Chernoff模型的間 接映射法,選擇合適的中間參數(shù)來控制標(biāo)準(zhǔn)的聲音以達(dá)到映射的目的。圖6、圖7分別為多 維點(diǎn)數(shù)據(jù)的直接映射模型和間接映射模型。從步驟2中根據(jù)特征數(shù)據(jù)的不同采用不同的映射模型得到參數(shù)化聲音。步驟4:聲音合成經(jīng)過步驟3之后形成的參數(shù)化聲音,聲音的合成采用的方法分直接合成和間接合 成。直接合成參照的是傅立葉分析,間接合成則是收到ChernofT模型的影響。直接合成利用傅立葉變換的譜線合成聲音相當(dāng)于使用正弦信號線性合成原來的時域波形, 比如我們通過奇次整數(shù)頻率來合成原來的聲音信號的話,可以使用原信號頻率的奇次整數(shù) 倍正弦信號來合成原來的方波信號。使用傅立葉分析聲音信號將產(chǎn)生一個頻譜,在物理世界的任意一個聲音信號都可 以使用正弦曲線的組合來表示,但是組成這種組合的正弦曲線的數(shù)目可能趨向無窮大,我 們需要在精度和計(jì)算量上作一個折中。如果一個數(shù)字采樣信號的長度為N個采樣點(diǎn),需要 使用N/2個正弦曲線來表示這個這個信號。聲音信號按照他們的不同頻譜分為分為和聲, 非和聲和噪聲,和聲從頻譜來看,他們的譜線只包括基頻的整數(shù)倍,它給人強(qiáng)烈的頻率的感 覺,非和聲的頻譜,給人比較微弱的頻率的感覺。很多打擊樂器例如鼓、鑼、和鐘產(chǎn)生的都 是非和聲,噪聲在頻譜上表現(xiàn)沒有明顯的譜線,在聽覺上給人的感覺就是沒有固定的音高 (頻率)某些打擊樂器和輔音都是這些噪音的代表。真實(shí)世界的聲音都是由這三種聲音按 照不同的組成比例構(gòu)成的。如果我們要合成一個聲音的話,可以模擬上面的過程,也可以使用不同的振蕩器 發(fā)出不同的頻率〔當(dāng)然頻率可以固定也可以在一定范圍內(nèi)改動),再使用幅度控制設(shè)備對幅 度進(jìn)行控制,最后將這些聲音合成(以零坐標(biāo)為原點(diǎn)進(jìn)行相加)起來。間接合成在科學(xué)計(jì)算可視化中映射多維點(diǎn)數(shù)據(jù)時,人們采用的另一種方法是Chernoff臉 法[石教英1995],Chernoff設(shè)計(jì)了一個可以代表12個信息分量的臉,將各維數(shù)據(jù)映射到 控制臉部不同部分器官的形狀的變形量,那么由于在物體分類時一些數(shù)據(jù)集聚效果將映射 到Chernoff臉的幾種表情,人們就此可以判斷物體的模式,以達(dá)到對數(shù)據(jù)特征本能和自發(fā) 的感知過程的目的。與此類同,如果我們可以設(shè)計(jì)一個Chernoff的標(biāo)準(zhǔn)聲。將多維點(diǎn)數(shù)據(jù) 分別映射到該聲音的頻率、幅度、時長、位置、諧波成分。那么同樣根據(jù)調(diào)制后的Chernoff 聲我們也可以作類似分類的判決。為了利用以往人們對音樂的知識能夠在以后的可聽化設(shè) 計(jì)中發(fā)揮作用,因?yàn)橛脩舻穆犛X模型是以用戶的音樂模型作為基礎(chǔ)的[方志剛1997],我們 采用了 A4(440Hz)作為標(biāo)準(zhǔn)音。步驟5:聲音的播放1)用 Window API在Window API的支援下,播放小段wAV檔的最佳方案就是使用PlaySound ()函數(shù)。 PlaySoundO的第1個限制是wAV檔案的大?。坏?個限制是混音的功能,它每次只能播放 一個聲音對象;第3個限制是無法體現(xiàn)位置感和空間感,只有音量的大小感覺。
2)用 DirectSound在DirectSound中,基本操作單元是聲音緩沖區(qū)對象,一種聲音對應(yīng)一個從 緩沖區(qū)聲音對象。所有播放的從緩沖區(qū)聲音對象都在主緩沖區(qū)中進(jìn)行混音后播放。 DectSoundBuffer對象允許控制從緩沖區(qū)對象的3個屬性頻率、容量和均衡。其函數(shù)主 要有,SetFrequencyO設(shè)置頻率,SetPanO設(shè)置均衡值,SetVolume ()設(shè)置音量。利用 DirectSound配合雙聲道播放方式,可以實(shí)現(xiàn)距離感、左右方向感、音量的變化、聲源的運(yùn)動 及混音的效果。根據(jù)聲源距聽者的距離遠(yuǎn)近而調(diào)整音量;通過衰減一邊聲道的音量或改變 均衡值來表現(xiàn)聲源的左右方向性;通過增減運(yùn)動聲源的頻率來產(chǎn)生多普勒效果等。3)使用 DirectSound3D DirectSound3D使播放的聲音從立體聲擴(kuò)展到了 3D聲音,放置聲源的空間 坐標(biāo)系就是Direct3D所用的坐標(biāo)系。它主要包括DirectSound3Dbuf f er8以及與此 相關(guān)的 DirectSound3Dlistener8 兩個對象。DirectSound3Dbuffer8 用于控制單個 聲源的3D屬性,即從緩沖區(qū)聲音對象。其函數(shù)主要包括SetPositionO設(shè)置聲源的 位置、SetConeOrientationO設(shè)置音錐的方向、SetConeAngles ()設(shè)置音錐的內(nèi)外角 度、SetConeOutsideVolume ()設(shè)置音錐的外部音量、SetMaxDistance ()設(shè)置最大距 離值、SetMinDistanceO設(shè)置最小距離值以及SetVelocity ()設(shè)置聲源的速度等。 DirectS0imd3Dlistener8用于放置虛擬的聽者,管理3D聲音場景的整體屬性。其函數(shù)主要 有SetPositionO設(shè)置聽者位置、SetOrientation()設(shè)置聽者方向、SetVelocity ()設(shè)置聽 者速度因子、SetDistanceFactor ()設(shè)置聽者距離因子以及SetDopplerFactorO設(shè)置聽者 多普勒效果因子等。真正實(shí)現(xiàn)DirectSoimd3D,必須配合多音箱的環(huán)繞聲系統(tǒng)。需要說明的是,上述裝置和系統(tǒng)內(nèi)的各單元之間的信息交互、執(zhí)行過程等內(nèi)容,由 于與本發(fā)明方法實(shí)施例基于同一構(gòu)思,具體內(nèi)容可參見本發(fā)明方法實(shí)施例中的敘述,此處 不再贅述。本領(lǐng)域普通技術(shù)人員可以理解上述實(shí)施例的各種方法中的全部或部分步驟是可 以通過程序來指令相關(guān)的硬件來完成,該程序可以存儲于一計(jì)算機(jī)可讀存儲介質(zhì)中,存 儲介質(zhì)可以包括只讀存儲器(ROM,Read Only Memory)、隨機(jī)存取存儲器(RAM,Random Access Memory)、磁盤或光盤等。以上對本發(fā)明實(shí)施例所提供的一種數(shù)字家庭的地 理信息的可視可聽化方法,進(jìn)行 了詳細(xì)介紹,本文中應(yīng)用了具體個例對本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例 的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時,對于本領(lǐng)域的一般技術(shù)人員, 依據(jù)本發(fā)明的思想,在具體實(shí)施方式
及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書內(nèi) 容不應(yīng)理解為對本發(fā)明的限制。
權(quán)利要求
一種基于數(shù)字家庭的地理信息的可聽化表達(dá)方法,其特征在于,包括步驟1信息的獲取,即進(jìn)行聲源的確定;步驟2信息的處理,將各種信息作規(guī)范化處理,形成后續(xù)處理的應(yīng)用數(shù)據(jù),即特征數(shù)據(jù);步驟3信息映射;允許各種輸入信號找到相應(yīng)的映射規(guī)則,達(dá)到可聽化的目的,根據(jù)特征數(shù)據(jù)的不同采用不同的映射模型得到參數(shù)化聲音;步驟4聲音合成,形成參數(shù)化聲音;步驟5聲音的播放。
2.如權(quán)利要求1所述的方法,其特征在于,所述聲音的合成采用的方法分直接合成和 間接合成,其中直接合成參照的是傅立葉分析,間接合成則是收到Chemoff模型的影響。
3.如權(quán)利要求1或者2所述的方法,其特征在于,所述聲音的播放通過WindowAPI、 DirectSound, DirectSound3D中的一種或者多種來實(shí)現(xiàn)。
全文摘要
本發(fā)明實(shí)施例公開了一種基于數(shù)字家庭的地理信息的可聽化表達(dá)方法,包括步驟1信息的獲取,即進(jìn)行聲源的確定;步驟2信息的處理,將各種信息作規(guī)范化處理,形成后續(xù)處理的應(yīng)用數(shù)據(jù),即特征數(shù)據(jù);步驟3信息映射;允許各種輸入信號找到相應(yīng)的映射規(guī)則,達(dá)到可聽化的目的,根據(jù)特征數(shù)據(jù)的不同采用不同的映射模型得到參數(shù)化聲音;步驟4聲音合成,形成參數(shù)化聲音;步驟5聲音的播放。通過實(shí)施本發(fā)明,在信息突變狀態(tài)以及視覺通道負(fù)荷過重等場合優(yōu)于其他通道,其表達(dá)在地理信息的語音閱讀、氛圍營造、沉浸表達(dá)等方面表現(xiàn)優(yōu)異。
文檔編號G10L19/00GK101872613SQ201010200898
公開日2010年10月27日 申請日期2010年6月12日 優(yōu)先權(quán)日2010年6月12日
發(fā)明者姜軍毅, 殷偉, 王棟, 羅笑南, 蔡瓊 申請人:廣東中大訊通軟件科技有限公司;東莞市中珩電子科技有限公司;中山大學(xué)