專利名稱:具備語(yǔ)音和視頻多模態(tài)交互的數(shù)字化網(wǎng)絡(luò)媒體終端的制作方法
技術(shù)領(lǐng)域:
本實(shí)用新型屬于數(shù)字多媒體技術(shù)領(lǐng)域,尤其是一種可進(jìn)行語(yǔ)音交互、視頻交互、無(wú) 線聯(lián)網(wǎng)的數(shù)字化多媒體終端。
背景技術(shù):
信息社會(huì)的快速發(fā)展,人們獲取信息的途徑和方式正在發(fā)生重大轉(zhuǎn)變,廣告模式 隨之也在發(fā)生翻天覆地的變化,之前的報(bào)紙、廣播、電視等單向傳播的傳統(tǒng)媒體正在逐步被 人們冷落,而具備交互性能的互聯(lián)網(wǎng)廣告等新媒體廣告正在被廣泛采用,讓受眾參與其中、 提供更加豐富的信息,是互聯(lián)網(wǎng)廣告成功的標(biāo)志之一?;ヂ?lián)網(wǎng)只是人們生活圈子的一小部分,在互聯(lián)網(wǎng)之外,還存在眾多的廣告模式,如 展板、廣告牌、數(shù)字媒體廣告網(wǎng)絡(luò)等等,但這些模式無(wú)一例外還是單向的展示和播放模式, 受眾只能被動(dòng)的觀看,無(wú)法參與其中,獲取的信息量也十分有限,廣告的效果和吸引力比較 差。如何提升傳統(tǒng)廣告的黏性,增大其信息量,交互性能成為傳統(tǒng)廣告必須要面對(duì)和解決的 關(guān)鍵問(wèn)題。語(yǔ)音是人類溝通和獲取信息最自然最便捷的方式,語(yǔ)音交互將是繼圖形交互模式 之后人機(jī)交互模式上具有突破性意義的變革。將語(yǔ)音交互技術(shù)應(yīng)用到廣告媒體終端中,說(shuō) 指令即可實(shí)現(xiàn)與廣告媒體終端的互動(dòng),實(shí)現(xiàn)語(yǔ)音搜索、語(yǔ)音控制等功能,將提供一種全新體 驗(yàn)的廣告交互模式。通過(guò)視頻攝像頭的視頻分析,讓廣告媒體終端能夠感知用戶的肢體動(dòng)作,并產(chǎn)生 相應(yīng)的操作,將為廣告媒體終端提供一種直觀的、所見(jiàn)即所得的視頻交互模式,使得用戶可 以自主控制廣告,選擇關(guān)注點(diǎn)。針對(duì)傳統(tǒng)的廣告媒體終端僅僅是單向廣播方式的多媒體播放,無(wú)法與廣告受眾交 互的問(wèn)題,本實(shí)用新型實(shí)現(xiàn)了一種可進(jìn)行語(yǔ)音交互、視頻交互、無(wú)線聯(lián)網(wǎng)的數(shù)字化多媒體終 端,受眾可通過(guò)語(yǔ)音或視頻與終端進(jìn)行交互,參與到廣告中,獲取更深層次的廣告信息,該 終端可廣泛應(yīng)用于單獨(dú)的廣告、展示、展覽,或組成數(shù)字媒體廣告網(wǎng)絡(luò)。
發(fā)明內(nèi)容針對(duì)傳統(tǒng)的廣告媒體終端僅僅是單向廣播方式的多媒體播放,無(wú)法與廣告受眾交 互的問(wèn)題,本實(shí)用新型實(shí)現(xiàn)了一種可進(jìn)行語(yǔ)音交互、視頻交互、無(wú)線聯(lián)網(wǎng)的數(shù)字化多媒體終 端。本實(shí)用新型實(shí)現(xiàn)的終端包括語(yǔ)音識(shí)別觸發(fā)按鍵、語(yǔ)音采樣麥克風(fēng)、視頻采集攝像 頭、液晶屏、核心電路板、喇叭、電源開(kāi)關(guān)、外殼;其中,語(yǔ)音識(shí)別觸發(fā)按鍵,位于外殼的正面, 液晶屏的下邊,點(diǎn)觸該按鍵開(kāi)啟語(yǔ)音采樣麥克風(fēng),與終端進(jìn)行語(yǔ)音交互;語(yǔ)音采樣麥克風(fēng), 與核心電路板連接,位于外殼的正面,液晶屏的下邊,進(jìn)行語(yǔ)音采樣;視頻采集攝像頭,與 核心電路板連接,位于外殼的正面,液晶屏的上邊,進(jìn)行視頻采集;液晶屏,位于外殼正面, 與核心電路板連接,顯示圖形界面,可采用非觸摸液晶屏或觸摸液晶屏;觸摸液晶屏還可為終端提供觸摸圖形界面;核心電路板,包括語(yǔ)音識(shí)別觸發(fā)按鍵開(kāi)關(guān)、處理器單元、存儲(chǔ)單 元、Wi-Fi單元、移動(dòng)通信單元、電源管理單元,其中語(yǔ)音識(shí)別觸發(fā)按鍵開(kāi)關(guān)位于語(yǔ)音識(shí)別 觸發(fā)按鍵的后面,緊貼語(yǔ)音識(shí)別觸發(fā)按鍵,采用輕觸開(kāi)關(guān)或按鈕開(kāi)關(guān),將語(yǔ)音識(shí)別觸發(fā)按鍵 的操作轉(zhuǎn)化為電開(kāi)關(guān)信號(hào);處理器單元由嵌入式CPU及外圍電路溝通,嵌入式CPU采用基 于MIPS架構(gòu)、ARM架構(gòu)或Intel Nehalem架構(gòu)的CPU ;存儲(chǔ)單元采用FLASH Memory或固態(tài) 硬盤;Wi-Fi單元由Wi-FI芯片及外圍電路組成,支持802. 11,802. Ila,802. lib,802. llg、 802. Iln ;移動(dòng)通信單元由3G通信模塊組成,支持TD-SCDMA、⑶MA2000、或W⑶MA,提供3G 移動(dòng)通信信道;電源管理單元由電源管理芯片和人體探測(cè)裝置組成,終端前長(zhǎng)時(shí)間無(wú)人,終 端將自動(dòng)進(jìn)入休眠狀態(tài),有人時(shí)喚醒;喇叭,嵌入在外殼內(nèi)部,位于液晶屏周圍,用于播放聲 音;電源開(kāi)關(guān),位于外殼側(cè)面,可開(kāi)啟或關(guān)閉終端;外殼,將各個(gè)部件整合為一個(gè)整體,外殼 的外在體現(xiàn)包括1個(gè)語(yǔ)音識(shí)別觸發(fā)按鍵、1組麥克風(fēng)孔、1個(gè)視頻采集攝像頭、1個(gè)液晶屏、1 組喇叭孔、1個(gè)電源接口和1個(gè)電源開(kāi)關(guān)。
圖1為數(shù)字化網(wǎng)絡(luò)媒體終端的外觀視圖圖2為數(shù)字化網(wǎng)絡(luò)媒體終端的核心部件視圖
具體實(shí)施方式
以下結(jié)合附圖和實(shí)施例對(duì)本實(shí)用新型做進(jìn)一步說(shuō)明。圖1為數(shù)字化網(wǎng)絡(luò)媒體終端的外觀視圖,包括語(yǔ)音識(shí)別觸發(fā)按鍵1、麥克風(fēng)孔801、 視頻采集攝像頭3、液晶屏4、喇叭孔802、電源開(kāi)關(guān)7、外殼8,其中語(yǔ)音識(shí)別觸發(fā)按鍵1位 于外殼8的正面,在液晶屏4的下邊,用于觸發(fā)終端的語(yǔ)音識(shí)別功能;麥克風(fēng)孔801是外殼 8表面的開(kāi)孔,位于語(yǔ)音采用麥克風(fēng)2的前面,用于透過(guò)聲音;視頻采集攝像頭3位于外殼 8的正面,在液晶屏4的上邊,可采集視頻;液晶屏4位于外殼8的正面,通過(guò)線纜與其后面 的核心電路板5連接;喇叭孔802是外殼8表面的開(kāi)孔,位于喇叭6的前面,用于透過(guò)聲音; 電源開(kāi)關(guān)7,與核心電路板5中的電源管理單元506連接,位于外殼的側(cè)面,可開(kāi)啟和關(guān)閉終 端的供電;外殼8將終端的各個(gè)部件整合為一個(gè)整體。圖2為數(shù)字化網(wǎng)絡(luò)媒體終端的核心部件視圖,包括語(yǔ)音采用麥克風(fēng)2、視頻采集攝 像頭3、核心電路板5、語(yǔ)音識(shí)別觸發(fā)按鍵開(kāi)關(guān)501、處理器單元502、存儲(chǔ)單元503、Wi-Fi單 元504、移動(dòng)通信單元505、電源管理單元506、喇叭6、電源開(kāi)關(guān)7,其中語(yǔ)音采用麥克風(fēng)2位 于外殼8上的麥克風(fēng)孔801的后面,可進(jìn)行語(yǔ)音采用;視頻采集攝像頭3,位于核心電路板 5的上部中間位置,用于采集視頻圖像;核心電路板5固定在外殼8內(nèi)部,由語(yǔ)音識(shí)別觸發(fā) 按鍵開(kāi)關(guān)501、處理器單元502、存儲(chǔ)單元503、Wi-Fi單元504、移動(dòng)通信單元505、電源管理 單元506等組成,其中語(yǔ)音識(shí)別觸發(fā)按鍵開(kāi)關(guān)501位于語(yǔ)音識(shí)別觸發(fā)按鍵1的后面,緊貼語(yǔ) 音識(shí)別觸發(fā)按鍵1,采用輕觸開(kāi)關(guān)或按鈕開(kāi)關(guān),將語(yǔ)音識(shí)別觸發(fā)按鍵的操作轉(zhuǎn)化為電開(kāi)關(guān)信 號(hào);處理器單元502由嵌入式CPU及外圍電路溝通,嵌入式CPU采用基于MIPS架構(gòu)、ARM架 構(gòu)或Intel Nehalem架構(gòu)的CPU ;存儲(chǔ)單元503采用FLASH Memory或固態(tài)硬盤;Wi-Fi單元 504由Wi-FI芯片及外圍電路組成;移動(dòng)通信單元505由3G通信模塊組成,提供3G移動(dòng)通 信信道;電源管理單元506由電源管理芯片和人體探測(cè)裝置組成,終端前長(zhǎng)時(shí)間無(wú)人,終端將自動(dòng)進(jìn)入休眠狀態(tài),有人時(shí)自動(dòng)喚醒;喇叭6固定在外殼8上,位于喇叭孔802的后面,與 核心電路板5連接,用于播放聲音;電源開(kāi)關(guān)7,固定在外殼8上,與核心電路板5中的電源 管理單元506連接,可開(kāi)啟關(guān)閉終端。實(shí)施例本實(shí)施例實(shí)現(xiàn)了一種可進(jìn)行語(yǔ)音交互、視頻交互、無(wú)線聯(lián)網(wǎng)的數(shù)字化多媒體終端, 圖1為數(shù)字化網(wǎng)絡(luò)媒體終端的外觀視圖,圖2為數(shù)字化網(wǎng)絡(luò)媒體終端的核心部件視圖,該終 端由語(yǔ)音識(shí)別觸發(fā)按鍵1、語(yǔ)音采樣麥克風(fēng)2、視頻采集攝像頭3、液晶屏4、核心電路板5、喇 叭6、電源開(kāi)關(guān)7、外殼8等部件組成;核心電路板5是終端的核心硬件平臺(tái),包括語(yǔ)音識(shí)別 觸發(fā)按鍵開(kāi)關(guān)501、處理器單元502、存儲(chǔ)單元503、Wi-Fi單元504、移動(dòng)通信單元505、電源 管理單元506等幾個(gè)關(guān)鍵功能單元模塊,其中Wi-Fi單元504和移動(dòng)通信單元505可為終 端提供Wi-Fi無(wú)線聯(lián)網(wǎng)和3G無(wú)線聯(lián)網(wǎng)的功能。該實(shí)施例終端實(shí)現(xiàn)的數(shù)字化網(wǎng)絡(luò)媒體終端具備語(yǔ)音和視頻多模態(tài)交互能力,受眾 可通過(guò)語(yǔ)音或視頻與終端進(jìn)行交互,參與到廣告中,獲取更深層次的廣告信息,可廣泛應(yīng)用 于單獨(dú)的廣告、展示、展覽,或組成數(shù)字媒體廣告網(wǎng)絡(luò)。
權(quán)利要求具備語(yǔ)音和視頻多模態(tài)交互的數(shù)字化網(wǎng)絡(luò)媒體終端,包括語(yǔ)音識(shí)別觸發(fā)按鍵、語(yǔ)音采樣麥克風(fēng)、視頻采集攝像頭、液晶屏、核心電路板、喇叭、電源開(kāi)關(guān)、外殼,其特征在于語(yǔ)音識(shí)別觸發(fā)按鍵,位于外殼的正面,液晶屏的下邊,點(diǎn)觸該按鍵開(kāi)啟語(yǔ)音采樣麥克風(fēng),與終端進(jìn)行語(yǔ)音交互;語(yǔ)音采樣麥克風(fēng),與核心電路板連接,位于外殼的正面,液晶屏的下邊,進(jìn)行語(yǔ)音采樣;視頻采集攝像頭,與核心電路板連接,位于外殼的正面,液晶屏的上邊,進(jìn)行視頻采集;液晶屏,位于外殼正面,與核心電路板連接,顯示圖形界面,可采用非觸摸液晶屏或觸摸液晶屏;觸摸液晶屏可為終端提供觸摸圖形界面;核心電路板,包括語(yǔ)音識(shí)別觸發(fā)按鍵開(kāi)關(guān)、處理器單元、存儲(chǔ)單元、Wi Fi單元、移動(dòng)通信單元、電源管理單元;喇叭,嵌入在外殼內(nèi)部,位于液晶屏周圍,用于播放聲音;電源開(kāi)關(guān),位于外殼側(cè)面,可開(kāi)啟或關(guān)閉終端;外殼,將各個(gè)部件整合為一個(gè)整體,外殼的外在體現(xiàn)包括1個(gè)語(yǔ)音識(shí)別觸發(fā)按鍵、1組麥克風(fēng)孔、1個(gè)視頻采集攝像頭、1個(gè)液晶屏、1組喇叭孔、1個(gè)電源接口和1個(gè)電源開(kāi)關(guān)。
2.根據(jù)權(quán)利要求1所述的終端,其特征在于,核心電路板中的語(yǔ)音識(shí)別觸發(fā)按鍵開(kāi)關(guān) 位于語(yǔ)音識(shí)別觸發(fā)按鍵的后面,緊貼語(yǔ)音識(shí)別觸發(fā)按鍵,采用輕觸開(kāi)關(guān)或按鈕開(kāi)關(guān),將語(yǔ)音 識(shí)別觸發(fā)按鍵的操作轉(zhuǎn)化為電開(kāi)關(guān)信號(hào)。
3.根據(jù)權(quán)利要求1所述的終端,其特征在于,核心電路板中的處理器單元由嵌入式CPU 及外圍電路溝通,嵌入式CPU采用基于MIPS架構(gòu)、ARM架構(gòu)或Intel Nehalem架構(gòu)的CPU。
4.根據(jù)權(quán)利要求1所述的終端,其特征在于,核心電路板中的存儲(chǔ)單元采用 FLASHMemory或固態(tài)硬盤。
5.根據(jù)權(quán)利要求1所述的終端,其特征在于,核心電路板中的Wi-Fi單元由Wi-FI芯片 及外圍電路組成,支持 802. 11,802. Ila,802. lib,802. Ilg,802. lln。
6.根據(jù)權(quán)利要求1所述的終端,其特征在于,核心電路板中的移動(dòng)通信單元由3G通信 模塊組成,支持TD-SCDMA、CDMA2000、或WCDMA,提供3G移動(dòng)通信信道。
7.根據(jù)權(quán)利要求1所述的終端,其特征在于,核心電路板中的電源管理單元由電源管 理芯片和人體探測(cè)裝置組成,終端前長(zhǎng)時(shí)間無(wú)人,終端將自動(dòng)進(jìn)入休眠狀態(tài),有人時(shí)喚醒。
專利摘要一種可進(jìn)行語(yǔ)音交互、視頻交互、無(wú)線聯(lián)網(wǎng)的數(shù)字化多媒體終端,該終端包括語(yǔ)音識(shí)別觸發(fā)按鍵、語(yǔ)音采樣麥克風(fēng)、視頻采集攝像頭、液晶屏、核心電路板、喇叭、電源開(kāi)關(guān)、外殼;語(yǔ)音識(shí)別觸發(fā)按鍵可開(kāi)啟語(yǔ)音采樣麥克風(fēng),與終端進(jìn)行語(yǔ)音交互;視頻采集攝像頭將采集的視頻圖像傳送給核心電路板進(jìn)行處理,實(shí)現(xiàn)人與終端的視頻交互;該終端克服了傳統(tǒng)的廣告多媒體終端僅僅是單向廣播方式的多媒體播放,無(wú)法與廣告受眾交互的問(wèn)題,實(shí)現(xiàn)了一種具備便捷的語(yǔ)音交互模式和視頻交互模式的數(shù)字化多媒體終端,受眾可通過(guò)語(yǔ)音或視頻與終端進(jìn)行交互,參與到廣告中,獲取更深層次的廣告信息,可廣泛應(yīng)用于單獨(dú)的廣告、展示、展覽,或組成數(shù)字媒體廣告網(wǎng)絡(luò)。
文檔編號(hào)H04M7/00GK201667671SQ20102010016
公開(kāi)日2010年12月8日 申請(qǐng)日期2010年1月25日 優(yōu)先權(quán)日2010年1月25日
發(fā)明者孫敏霞 申請(qǐng)人:北京森博克智能科技有限公司