一種基于數(shù)字家庭的地理信息的可聽化表達(dá)方法

文檔序號：2823639閱讀：248來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：一種基于數(shù)字家庭的地理信息的可聽化表達(dá)方法
技術(shù)領(lǐng)域：
本發(fā)明涉及數(shù)字家庭技術(shù)領(lǐng)域，具體涉及一種基于數(shù)字家庭的地理信息的可聽化表達(dá)方法。
背景技術(shù)：
地理信息系統(tǒng)(Geographic Information System，簡稱GIS)作為獲取、整理、分析和管理地理空間數(shù)據(jù)的重要工具、技術(shù)和學(xué)科，近年來得到了廣泛關(guān)注和迅猛發(fā)展。由于信息技術(shù)的發(fā)展，數(shù)字時代的來臨，到今天已經(jīng)逐漸成為一門相當(dāng)成熟的技術(shù)，并且得到了極廣泛的應(yīng)用。尤其是近些年，GIS更以其強(qiáng)大的地理信息空間分析功能，在GPS及路徑優(yōu)化中發(fā)揮著越來越重要的作用。GIS地理信息系統(tǒng)是以地理空間數(shù)據(jù)庫為基礎(chǔ)，在軟硬件的支持下，運(yùn)用系統(tǒng)工程和信息科學(xué)的理論，科學(xué)管理和綜合分析具有空間內(nèi)涵的地理數(shù)據(jù)，以提供管理、決策、以及應(yīng)用服務(wù)等所需信息的技術(shù)系統(tǒng)?？梢暬瘧?yīng)用(Visualization Application)以數(shù)字家庭應(yīng)用為基礎(chǔ)，建立城市、區(qū) 域、或大型建筑工程、著名風(fēng)景名勝區(qū)的可視化模型，與數(shù)字電視應(yīng)用后臺結(jié)合，實(shí)現(xiàn)實(shí)景模型瀏覽實(shí)時瀏覽地理環(huán)境、地理信息查詢以及購物等一些互動應(yīng)用服務(wù)功能?？陕牷?究起源于20世紀(jì)50年代，21世紀(jì)初因計(jì)算機(jī)信息技術(shù)的發(fā)展成為研究熱點(diǎn)。狹義的可聽化是指用非語音信號表達(dá)信息，它立足于計(jì)算機(jī)信息論，側(cè)重于科學(xué)數(shù)據(jù)聽覺表達(dá)；廣義的可聽化是為了信息交流或數(shù)據(jù)解釋，將某科學(xué)領(lǐng)域的數(shù)據(jù)聯(lián)系轉(zhuǎn)化為以聽覺信號表現(xiàn)的感知聯(lián)系，用人類可辨析的聲音信號表達(dá)信息?？陕牷欣谌藗儶?dú)立獲取或幫助理解從視覺通道獲取的信息，是一門涉及認(rèn)知、聲學(xué)、藝術(shù)、工程學(xué)等方面的交叉學(xué)科。20世紀(jì)90年代可聽化開始應(yīng)用于地理信息表達(dá)，除可為有視覺障礙的用戶提供表達(dá)替代方式外，還廣泛應(yīng)用于地理信息系統(tǒng)和多媒體圖集中的音視頻和文本注記解說、3維虛擬仿真、車輛語音導(dǎo)航、少兒地理教育等諸多系統(tǒng)和產(chǎn)品中。在對此方法的研究和實(shí)踐過程中，本發(fā)明的發(fā)明人發(fā)現(xiàn)雖然可視化一直是表達(dá) 空間信息強(qiáng)有力的工具，網(wǎng)絡(luò)通信、多媒體以及三維圖像等高新科技的融入更使地理信息可視化表達(dá)異彩紛呈。但是，海量數(shù)據(jù)呈現(xiàn)于方寸屏幕間，造成了視覺顯示繁雜、地圖視覺載負(fù)量巨增等矛盾。計(jì)算機(jī)可聽化技術(shù)的發(fā)展，使聽覺獲取數(shù)據(jù)成為可能，并為地理信息提供了新的表達(dá)方式。在現(xiàn)實(shí)世界中，人類視聽覺相得益彰，聽覺也是獲取信息的重要途徑，重要性僅次于視覺。有聲信息時刻潛移默化被接收，人類多通道的感知避免了信息單通道過載和信息獲取單一化。聽覺具有本能或自發(fā)感知的獨(dú)特功效，一些可聽化的研究領(lǐng)域正在證明或已經(jīng)證明聽覺通道在某些領(lǐng)域的應(yīng)用中優(yōu)于其他通道，特別是在重要的信息突變狀態(tài)以及視覺通道負(fù)荷過重等場合?？陕牷?dú)立表達(dá)或輔助視覺表達(dá)，對地理信息傳遞、表達(dá)及認(rèn)知具有重大意義和實(shí)踐價值，在解決視覺感知過載，多重界面、大屏幕顯示以及信息突發(fā)、臨界表達(dá)等問題方面尤為重要。于是本發(fā)明的發(fā)明人決定使用一種基于數(shù)字家庭的地理信息的可視可聽化方法，結(jié)合可視可聽的優(yōu)點(diǎn)來設(shè)計(jì)。
發(fā)明內(nèi)容
本發(fā)明提供一種基于數(shù)字家庭的地理信息的可聽化方法，能夠獨(dú)立表達(dá)或輔助視覺表達(dá)，對地理信息傳遞、表達(dá)及認(rèn)知具有重大意義和實(shí)踐價值，在解決視覺感知過載，多重界面、大屏幕顯示以及信息突發(fā)、臨界表達(dá)等問題方面尤為重要，這樣使可視可聽達(dá)到平衡。本發(fā)明實(shí)施例提供了一種基于數(shù)字家庭的地理信息的可聽化表達(dá)方法，包括步驟1 信息的獲取，即進(jìn)行聲源的確定；步驟2 信息的處理，將各種信息作規(guī)范化處理，形成后續(xù)處理的應(yīng)用數(shù)據(jù)，即特征數(shù)據(jù)；步驟3 信息映射；允許各種輸入信號找到相應(yīng)的映射規(guī)則，達(dá)到可聽化的目的，根據(jù)特征數(shù)據(jù)的不同采用不同的映射模型得到參數(shù)化聲音；步驟4 聲音合成，形成參數(shù)化聲音；步驟5:聲音的播放。所述聲音的合成采用的方法分直接合成和間接合成，其中直接合成參照的是傅立葉分析，間接合成則是收到ChernofT模型的影響。所述聲音的播放通過Window API、DirectSouncU DirectSound3D中的一種或者多種來實(shí)現(xiàn)。由于本發(fā)明實(shí)施例采用一種基于數(shù)字家庭的地理信息的可聽化表達(dá)，聽覺具有本能或自發(fā)感知的獨(dú)特功效。因此多通道的感知避免了信息單通道過載和信息獲取單一化，計(jì)算機(jī)等高新技術(shù)提供的良好平臺為可聽化表達(dá)提供了新契機(jī)。它的獨(dú)立表達(dá)或輔助表達(dá)，在信息突變狀態(tài)以及視覺通道負(fù)荷過重等場合優(yōu)于其他通道，其表達(dá)在地理信息的語音閱讀、氛圍營造、沉浸表達(dá)等方面表現(xiàn)優(yōu)異。

為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案，下面將對實(shí)施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例，對于本領(lǐng)域普通技術(shù)人員來講，在不付出創(chuàng)造性勞動性的前提下，還可以根據(jù)這些附圖獲得其他的附圖。圖1為本發(fā)明實(shí)施例中的地理信息可視化和可聽化表達(dá)實(shí)現(xiàn)流程圖；圖2是本發(fā)明實(shí)施例中的地理信息可聽化表達(dá)實(shí)現(xiàn)流程圖；圖3是本發(fā)明實(shí)施例中的地理信息的可聽化應(yīng)用分類示意圖；圖4是本發(fā)明實(shí)施例中的離散無結(jié)構(gòu)映射示意圖；圖5是本發(fā)明實(shí)施例中的結(jié)構(gòu)化離散信息映射示意圖；圖6是本發(fā)明實(shí)施例中的高維點(diǎn)數(shù)據(jù)直接映射法示意圖；圖7是本發(fā)明實(shí)施例中的高維點(diǎn)數(shù)據(jù)間接映射法示意圖。
具體實(shí)施例方式本發(fā)明實(shí)施例提供一種基于數(shù)字家庭的地理信息的可聽化表達(dá)方法，能為各單位之間的電子政務(wù)信息提供共享。以下分別進(jìn)行詳細(xì)說明。
本發(fā)明實(shí)施例提供一種數(shù)字家庭的地理信息的可聽化方法，能夠獨(dú)立表達(dá)或輔助視覺表達(dá)，對地理信息傳遞、表達(dá)及認(rèn)知具有重大意義和實(shí)踐價值，在解決視覺感知過載，多重界面、大屏幕顯示以及信息突發(fā)、臨界表達(dá)等問題方面尤為重要。本發(fā)明實(shí)施例還提供相應(yīng)地理信息可聽化表達(dá)實(shí)現(xiàn)系統(tǒng)。以下分別進(jìn)行詳細(xì)說明。完整的地理信息的可視可聽流程圖如圖1所示，其中完整的地理信息的可聽表達(dá) 流程如圖2所示。地理數(shù)據(jù)通過可聽化映射出符合人類聽覺認(rèn)知的聲音，由聽覺感知通道被聆聽者所獲取。地理信息可聽化應(yīng)用廣泛、前景廣闊，對此綜述如圖3所示。一個完整的可聽化表達(dá)體系包括信息提取、信息處理、聲音映射、聲音合成和聲音播放等5部分。從地理專題數(shù)據(jù)中提取所需數(shù)據(jù)后，由等級數(shù)值過濾干擾信息并提取特征數(shù)據(jù)，然后通過數(shù)據(jù) 到聲音映射輸出聲音參數(shù)，最后參數(shù)合成聲音，輸出采樣值。
地理信息的可聽表達(dá)各步驟具體如下步驟1 信息的獲取(聲源的確定)聲源的確定即聲音數(shù)據(jù)的存儲及與空間實(shí)體的對應(yīng)關(guān)系的確定。聲音數(shù)據(jù)一般是以文件或資源的方式存儲的，原則上不同的聲音對象分別對應(yīng)不同的空間實(shí)體，因此數(shù)據(jù) 獲取模塊是采集各種數(shù)據(jù)源的數(shù)據(jù)，這些數(shù)據(jù)可以是離散的，也可以是連續(xù)的，可以是一維的也可以是高維的。步驟2:信息的處理經(jīng)過步驟1我們得到了各種原始數(shù)據(jù)，由于各種原始數(shù)據(jù)的結(jié)構(gòu)不盡相同，我們需要將各種信息作規(guī)范化處理，形成我們可以做后續(xù)處理的的應(yīng)用數(shù)據(jù)，即特征數(shù)據(jù)。步驟3:信息映射在可聽化應(yīng)用最重要的是有關(guān)的映射模型，所謂映射模型如圖一所示，是允許各種輸入信號無結(jié)構(gòu)離散的，結(jié)構(gòu)離散的、圖形的圖象的。他們都可以在這個模型中找到相應(yīng)的映射規(guī)則，達(dá)到可聽化的目的。輸出的則是各種參數(shù)化的聲音這些聲音可以是連續(xù)的，也可以是離散的，即它們的分辨顆粒度可以改變。不同的輸入數(shù)據(jù)集，其映射的規(guī)則不相同。其最重要的檢驗(yàn)標(biāo)準(zhǔn)就是，要使聲音信息表達(dá)的能力得到最大發(fā)揮。一般映射模型如下所述無結(jié)構(gòu)離散化信息的映射是各種映射中最簡單的。相當(dāng)于點(diǎn)對點(diǎn)的映射，例如事件A對應(yīng)為聲音a，事件B對應(yīng)與聲音η。諸如此類，最簡單也是最常見的就是windows系統(tǒng)中經(jīng)常出現(xiàn)的伴隨警告信息出現(xiàn)的警告聲音。聽標(biāo)是這一類映射的典型例子。這種映射最大的要求就是要是這種一對一的映射盡量自然符合人們交互的習(xí)慣。圖4所示的是離散無結(jié)構(gòu)信息的映射模型。對于結(jié)構(gòu)化離散信息的映射，首先必須指定一套對應(yīng)于結(jié)構(gòu)化信息的映射規(guī)則，當(dāng)任意一個屬于該信息集的信息輸入時，可以按照這種規(guī)則自動的生成參數(shù)化的可聽信號。耳標(biāo)就是明顯的例子。這種映射方法應(yīng)該在符合人們交互習(xí)慣的同時，具備更強(qiáng)的自適應(yīng)能力，即如果結(jié)構(gòu)發(fā)生了一定的變化，應(yīng)該可以根據(jù)規(guī)則生成器生成新的映射規(guī)則。例如目錄增加了一層，那么構(gòu)成耳標(biāo)的映射規(guī)則應(yīng)該自動發(fā)生改變，構(gòu)造出新的映射規(guī)則，同時又要對用戶產(chǎn)生較小的影響。圖5所示的是結(jié)構(gòu)化離散信息映射模型。一維連續(xù)信息的表達(dá)在可聽化中是最簡單的，因?yàn)槁曇舯旧砭涂梢钥醋鞣入S時間的變化，因此可以直接將連續(xù)信號的值直接映射到聲音的幅度或者頻率上。一維連續(xù)數(shù)據(jù)從數(shù)據(jù)集本質(zhì)上來講是多維點(diǎn)信號的一種特例。那么多維點(diǎn)數(shù)據(jù)的可聽化可以使用我們在參數(shù)化聲音章中所采用的加法合成的直接映射法、也可以使用參照Chernoff模型的間接映射法，選擇合適的中間參數(shù)來控制標(biāo)準(zhǔn)的聲音以達(dá)到映射的目的。圖6、圖7分別為多維點(diǎn)數(shù)據(jù)的直接映射模型和間接映射模型。從步驟2中根據(jù)特征數(shù)據(jù)的不同采用不同的映射模型得到參數(shù)化聲音。步驟4:聲音合成經(jīng)過步驟3之后形成的參數(shù)化聲音，聲音的合成采用的方法分直接合成和間接合成。直接合成參照的是傅立葉分析，間接合成則是收到ChernofT模型的影響。直接合成利用傅立葉變換的譜線合成聲音相當(dāng)于使用正弦信號線性合成原來的時域波形，比如我們通過奇次整數(shù)頻率來合成原來的聲音信號的話，可以使用原信號頻率的奇次整數(shù) 倍正弦信號來合成原來的方波信號。使用傅立葉分析聲音信號將產(chǎn)生一個頻譜，在物理世界的任意一個聲音信號都可以使用正弦曲線的組合來表示，但是組成這種組合的正弦曲線的數(shù)目可能趨向無窮大，我們需要在精度和計(jì)算量上作一個折中。如果一個數(shù)字采樣信號的長度為N個采樣點(diǎn)，需要使用N/2個正弦曲線來表示這個這個信號。聲音信號按照他們的不同頻譜分為分為和聲，非和聲和噪聲，和聲從頻譜來看，他們的譜線只包括基頻的整數(shù)倍，它給人強(qiáng)烈的頻率的感覺，非和聲的頻譜，給人比較微弱的頻率的感覺。很多打擊樂器例如鼓、鑼、和鐘產(chǎn)生的都是非和聲，噪聲在頻譜上表現(xiàn)沒有明顯的譜線，在聽覺上給人的感覺就是沒有固定的音高 (頻率)某些打擊樂器和輔音都是這些噪音的代表。真實(shí)世界的聲音都是由這三種聲音按照不同的組成比例構(gòu)成的。如果我們要合成一個聲音的話，可以模擬上面的過程，也可以使用不同的振蕩器發(fā)出不同的頻率〔當(dāng)然頻率可以固定也可以在一定范圍內(nèi)改動)，再使用幅度控制設(shè)備對幅度進(jìn)行控制，最后將這些聲音合成(以零坐標(biāo)為原點(diǎn)進(jìn)行相加)起來。間接合成在科學(xué)計(jì)算可視化中映射多維點(diǎn)數(shù)據(jù)時，人們采用的另一種方法是Chernoff臉法[石教英1995]，Chernoff設(shè)計(jì)了一個可以代表12個信息分量的臉，將各維數(shù)據(jù)映射到控制臉部不同部分器官的形狀的變形量，那么由于在物體分類時一些數(shù)據(jù)集聚效果將映射到Chernoff臉的幾種表情，人們就此可以判斷物體的模式，以達(dá)到對數(shù)據(jù)特征本能和自發(fā) 的感知過程的目的。與此類同，如果我們可以設(shè)計(jì)一個Chernoff的標(biāo)準(zhǔn)聲。將多維點(diǎn)數(shù)據(jù) 分別映射到該聲音的頻率、幅度、時長、位置、諧波成分。那么同樣根據(jù)調(diào)制后的Chernoff 聲我們也可以作類似分類的判決。為了利用以往人們對音樂的知識能夠在以后的可聽化設(shè) 計(jì)中發(fā)揮作用，因?yàn)橛脩舻穆犛X模型是以用戶的音樂模型作為基礎(chǔ)的[方志剛1997]，我們采用了 A4(440Hz)作為標(biāo)準(zhǔn)音。步驟5:聲音的播放1)用 Window API在Window API的支援下，播放小段wAV檔的最佳方案就是使用PlaySound ()函數(shù)。 PlaySoundO的第1個限制是wAV檔案的大?。坏?個限制是混音的功能，它每次只能播放一個聲音對象；第3個限制是無法體現(xiàn)位置感和空間感，只有音量的大小感覺。
2)用 DirectSound在DirectSound中，基本操作單元是聲音緩沖區(qū)對象，一種聲音對應(yīng)一個從緩沖區(qū)聲音對象。所有播放的從緩沖區(qū)聲音對象都在主緩沖區(qū)中進(jìn)行混音后播放。 DectSoundBuffer對象允許控制從緩沖區(qū)對象的3個屬性頻率、容量和均衡。其函數(shù)主要有，SetFrequencyO設(shè)置頻率，SetPanO設(shè)置均衡值，SetVolume ()設(shè)置音量。利用 DirectSound配合雙聲道播放方式，可以實(shí)現(xiàn)距離感、左右方向感、音量的變化、聲源的運(yùn)動及混音的效果。根據(jù)聲源距聽者的距離遠(yuǎn)近而調(diào)整音量；通過衰減一邊聲道的音量或改變均衡值來表現(xiàn)聲源的左右方向性；通過增減運(yùn)動聲源的頻率來產(chǎn)生多普勒效果等。3)使用 DirectSound3D DirectSound3D使播放的聲音從立體聲擴(kuò)展到了 3D聲音，放置聲源的空間坐標(biāo)系就是Direct3D所用的坐標(biāo)系。它主要包括DirectSound3Dbuf f er8以及與此相關(guān)的 DirectSound3Dlistener8 兩個對象。DirectSound3Dbuffer8 用于控制單個聲源的3D屬性，即從緩沖區(qū)聲音對象。其函數(shù)主要包括SetPositionO設(shè)置聲源的位置、SetConeOrientationO設(shè)置音錐的方向、SetConeAngles ()設(shè)置音錐的內(nèi)外角度、SetConeOutsideVolume ()設(shè)置音錐的外部音量、SetMaxDistance ()設(shè)置最大距離值、SetMinDistanceO設(shè)置最小距離值以及SetVelocity ()設(shè)置聲源的速度等。 DirectS0imd3Dlistener8用于放置虛擬的聽者，管理3D聲音場景的整體屬性。其函數(shù)主要有SetPositionO設(shè)置聽者位置、SetOrientation()設(shè)置聽者方向、SetVelocity ()設(shè)置聽者速度因子、SetDistanceFactor ()設(shè)置聽者距離因子以及SetDopplerFactorO設(shè)置聽者多普勒效果因子等。真正實(shí)現(xiàn)DirectSoimd3D，必須配合多音箱的環(huán)繞聲系統(tǒng)。需要說明的是，上述裝置和系統(tǒng)內(nèi)的各單元之間的信息交互、執(zhí)行過程等內(nèi)容，由于與本發(fā)明方法實(shí)施例基于同一構(gòu)思，具體內(nèi)容可參見本發(fā)明方法實(shí)施例中的敘述，此處不再贅述。本領(lǐng)域普通技術(shù)人員可以理解上述實(shí)施例的各種方法中的全部或部分步驟是可以通過程序來指令相關(guān)的硬件來完成，該程序可以存儲于一計(jì)算機(jī)可讀存儲介質(zhì)中，存儲介質(zhì)可以包括只讀存儲器(ROM，Read Only Memory)、隨機(jī)存取存儲器(RAM，Random Access Memory)、磁盤或光盤等。以上對本發(fā)明實(shí)施例所提供的一種數(shù)字家庭的地理信息的可視可聽化方法，進(jìn)行了詳細(xì)介紹，本文中應(yīng)用了具體個例對本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述，以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想；同時，對于本領(lǐng)域的一般技術(shù)人員，依據(jù)本發(fā)明的思想，在具體實(shí)施方式
及應(yīng)用范圍上均會有改變之處，綜上所述，本說明書內(nèi) 容不應(yīng)理解為對本發(fā)明的限制。
權(quán)利要求
一種基于數(shù)字家庭的地理信息的可聽化表達(dá)方法，其特征在于，包括步驟1信息的獲取，即進(jìn)行聲源的確定；步驟2信息的處理，將各種信息作規(guī)范化處理，形成后續(xù)處理的應(yīng)用數(shù)據(jù)，即特征數(shù)據(jù)；步驟3信息映射；允許各種輸入信號找到相應(yīng)的映射規(guī)則，達(dá)到可聽化的目的，根據(jù)特征數(shù)據(jù)的不同采用不同的映射模型得到參數(shù)化聲音；步驟4聲音合成，形成參數(shù)化聲音；步驟5聲音的播放。
2.如權(quán)利要求1所述的方法，其特征在于，所述聲音的合成采用的方法分直接合成和間接合成，其中直接合成參照的是傅立葉分析，間接合成則是收到Chemoff模型的影響。
3.如權(quán)利要求1或者2所述的方法，其特征在于，所述聲音的播放通過WindowAPI、 DirectSound, DirectSound3D中的一種或者多種來實(shí)現(xiàn)。
全文摘要
本發(fā)明實(shí)施例公開了一種基于數(shù)字家庭的地理信息的可聽化表達(dá)方法，包括步驟1信息的獲取，即進(jìn)行聲源的確定；步驟2信息的處理，將各種信息作規(guī)范化處理，形成后續(xù)處理的應(yīng)用數(shù)據(jù)，即特征數(shù)據(jù)；步驟3信息映射；允許各種輸入信號找到相應(yīng)的映射規(guī)則，達(dá)到可聽化的目的，根據(jù)特征數(shù)據(jù)的不同采用不同的映射模型得到參數(shù)化聲音；步驟4聲音合成，形成參數(shù)化聲音；步驟5聲音的播放。通過實(shí)施本發(fā)明，在信息突變狀態(tài)以及視覺通道負(fù)荷過重等場合優(yōu)于其他通道，其表達(dá)在地理信息的語音閱讀、氛圍營造、沉浸表達(dá)等方面表現(xiàn)優(yōu)異。
文檔編號G10L19/00GK101872613SQ201010200898
公開日2010年10月27日申請日期2010年6月12日優(yōu)先權(quán)日2010年6月12日
發(fā)明者姜軍毅, 殷偉, 王棟, 羅笑南, 蔡瓊申請人:廣東中大訊通軟件科技有限公司;東莞市中珩電子科技有限公司;中山大學(xué)

完整全部詳細(xì)技術(shù)資料下載