專利名稱:基于體感的人機(jī)交互設(shè)備的制作方法
技術(shù)領(lǐng)域:
本實(shí)用新型涉及人機(jī)交互領(lǐng)域,具體而言,涉及一種基于體感的人機(jī)交互設(shè)備。
背景技術(shù):
現(xiàn)有傳統(tǒng)的計(jì)算機(jī)或計(jì)算設(shè)備的輸入設(shè)備中,最常用的是鼠標(biāo),鍵盤,觸摸屏,簡單遙控器等。這些輸入設(shè)備具有輸入簡單,快捷,準(zhǔn)確的優(yōu)點(diǎn),但缺點(diǎn)也是不夠直觀,人需要用手直接對(duì)輸入設(shè)備進(jìn)行操作才能完成信息輸入。在另外一些人機(jī)交互的情況下,用戶希望不接觸設(shè)備也能完成設(shè)備操作,比較典型的情況如:體感游戲時(shí)希望擺脫設(shè)備束縛;公共場(chǎng)合信息查詢時(shí)不希望觸摸設(shè)備,而是希望通過語言、動(dòng)作直接獲取信息,更加自然,還可以避免傳染性疾病;網(wǎng)上社區(qū)交流,通過復(fù)制人的動(dòng)作,語音使得交流更加真實(shí)有效;使用機(jī)器人模仿人體動(dòng)作,對(duì)機(jī)器人進(jìn)行控制等等。目前,大部分人機(jī)交互設(shè)備不具備人機(jī)交互自然的特點(diǎn),無法完成人體動(dòng)作、聲音的捕捉和識(shí)別,為了解決該問題,微軟推出了體感輸入設(shè)備kinect,但是,該設(shè)備的模式識(shí)別需要在xbox或計(jì)算機(jī)上完成,對(duì)主設(shè)備處理速度要求高,使用環(huán)境受限,無法推廣到普通被控設(shè)備。針對(duì)相關(guān)技術(shù)中體感輸入設(shè)備無法推廣到普通被控設(shè)備的問題,目前尚未提出有效的解決方案。
實(shí)用新型內(nèi)容本實(shí)用新型的主要目的在于提供一種基于體感的人機(jī)交互設(shè)備,以解決體感輸入設(shè)備無法推廣到普通被控設(shè)備的問題。為了實(shí)現(xiàn)上述目的,根據(jù)本實(shí)用新型的一個(gè)方面,提供了一種基于體感的人機(jī)交互設(shè)備。根據(jù)本實(shí)用新型的基于體感的人機(jī)交互設(shè)備包括:獲取單元,用于獲取用戶動(dòng)作和聲音信息;中央處理器,與獲取單元相連接,用于識(shí)別獲取到的動(dòng)作和聲音信息;傳輸單元,與中央處理器相連接,用于將識(shí)別結(jié)果輸出至被控設(shè)備,以使被控設(shè)備根據(jù)識(shí)別結(jié)果執(zhí)行相應(yīng)的命令。進(jìn)一步地,獲取單元包括:動(dòng)作獲取單元,用于獲取用戶動(dòng)作的圖像;以及語音獲取單元,用于獲取用戶的語音信息。進(jìn)一步地,動(dòng)作獲取單元包括:結(jié)構(gòu)光投射器,用于將結(jié)構(gòu)光投射至用戶所在的空間;圖像采集器,用于采集結(jié)構(gòu)光投射的空間內(nèi)的圖像;以及可編程門陣列,用于計(jì)算并輸出采集到的圖像的深度圖。進(jìn)一步地,圖像采集器為單色圖像傳感器;結(jié)構(gòu)光投射器為單波長結(jié)構(gòu)光投射器;以及單色圖像傳感器具有與單波長結(jié)構(gòu)光投射器波長相同的帶通光濾波片。進(jìn)一步地,結(jié)構(gòu)光投射器與可編程門陣列通過第一數(shù)字信號(hào)線連接;圖像采集器與可編程門陣列通過第二數(shù)字信號(hào)線連接;以及可編程門陣列與中央處理器通過第三數(shù)字信號(hào)線連接。進(jìn)一步地,語音獲取單元包括:語音采集器,用于采集用戶的聲音信號(hào),將聲音信號(hào)轉(zhuǎn)換為電信號(hào);信號(hào)調(diào)理電路,用于將電信號(hào)進(jìn)行放大濾波;以及音頻模數(shù)轉(zhuǎn)換器,用于將放大濾波后的模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)后輸出。進(jìn)一步地,語音采集器與信號(hào)調(diào)理電路通過第一模擬信號(hào)線連接;信號(hào)調(diào)理電路與音頻模數(shù)轉(zhuǎn)換器通過第二模擬信號(hào)線連接;以及音頻模數(shù)轉(zhuǎn)換器與中央處理器通過第四數(shù)字信號(hào)線連接。進(jìn)一步地,該設(shè)備還包括:無線輸入設(shè)備,用于接收用戶輸入的控制信號(hào);以及無線收發(fā)器,與無線輸入設(shè)備和中央處理器相連接,用于將控制信號(hào)經(jīng)由中央處理器和傳輸單元輸出至被控設(shè)備。進(jìn)一步地,無線輸入設(shè)備包括:無線鍵盤、無線鼠標(biāo)、無線耳麥和/或無線手柄。進(jìn)一步地,中央處理器與無線收發(fā)器通過第五數(shù)字信號(hào)線連接。通過本實(shí)用新型,采用包括以下結(jié)構(gòu)的基于體感的人機(jī)交互設(shè)備,用于獲取用戶動(dòng)作和聲音信息的獲取單元,與獲取單元相連接并用于識(shí)別獲取到的動(dòng)作和聲音信息的中央處理器;與中央處理器相連接并用于將識(shí)別結(jié)果輸出至被控設(shè)備的傳輸單元,被控設(shè)備根據(jù)識(shí)別結(jié)果執(zhí)行相應(yīng)的命令,解決了體感輸入設(shè)備無法推廣到普通被控設(shè)備的問題,能夠直接向普通被控設(shè)備輸出用戶動(dòng)作和聲音的識(shí)別結(jié)果,無需普通設(shè)備進(jìn)行動(dòng)作聲音識(shí)別,進(jìn)而達(dá)到了將體感控制應(yīng)用到普通設(shè)備中,用戶體驗(yàn)好的效果。
構(gòu)成本申請(qǐng)的一部分的附圖用來提供對(duì)本實(shí)用新型的進(jìn)一步理解,本實(shí)用新型的示意性實(shí)施例及其說明用于解釋本實(shí)用新型,并不構(gòu)成對(duì)本實(shí)用新型的不當(dāng)限定。在附圖中:圖1是根據(jù)本實(shí)用新型實(shí)施例的基于體感的人機(jī)交互設(shè)備的原理框圖;以及圖2是根據(jù)本實(shí)用新型實(shí)施例的基于體感的人機(jī)交互設(shè)備連接示意圖。
具體實(shí)施方式
需要說明的是,在不沖突的情況下,本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互組合。下面將參考附圖并結(jié)合實(shí)施例來詳細(xì)說明本實(shí)用新型。本具體實(shí)施方式
對(duì)本申請(qǐng)?zhí)峁┑幕隗w感的人機(jī)交互設(shè)備的實(shí)施例進(jìn)行說明,該設(shè)備可獲取用戶動(dòng)作和聲音信息,然后進(jìn)行識(shí)別并將識(shí)別結(jié)果傳輸至被控設(shè)備,例如該被控設(shè)備可以為計(jì)算機(jī)、家用電器、公共操作設(shè)備(包括提款機(jī)、銀行取號(hào)機(jī)、飯店點(diǎn)菜機(jī)等),將本申請(qǐng)的基于體感的人機(jī)交互設(shè)備連接至被控設(shè)備,被控設(shè)備中設(shè)置相應(yīng)的控制程序,在獲取到人機(jī)交互設(shè)備輸出的識(shí)別結(jié)果后,執(zhí)行識(shí)別結(jié)果對(duì)應(yīng)的控制命令,實(shí)現(xiàn)基于體感的控制。圖1是根據(jù)本實(shí)用新型實(shí)施例的基于體感的人機(jī)交互設(shè)備的原理框圖,如圖1所示,該基于體感的人機(jī)交互設(shè)備包括獲取單元20、中央處理器40和傳輸單元60。其中,獲取單元20用于獲取用戶動(dòng)作和聲音信息,例如,通過攝像頭連續(xù)拍攝用戶動(dòng)作,得到動(dòng)作圖像;通過麥克風(fēng)獲取用戶說話聲音,得到語音信號(hào)等。中央處理器40與獲取單元20相連接,通過模式識(shí)別算法識(shí)別獲取到的動(dòng)作和聲音信息,然后經(jīng)由傳輸單元將識(shí)別結(jié)果輸出至被控設(shè)備,以使被控設(shè)備根據(jù)識(shí)別結(jié)果執(zhí)行相應(yīng)的命令。其中,中央處理器應(yīng)該具有較強(qiáng)的數(shù)據(jù)處理能力,滿足實(shí)時(shí)的動(dòng)作識(shí)別、語音識(shí)別、傳輸單元的數(shù)據(jù)打包及傳輸要求。具體地,該人機(jī)交互設(shè)備的連接示意圖如圖2所示,獲取單元20包括三位視頻流獲取單元(也即動(dòng)作獲取單元)和語音信號(hào)流獲取單元(也即語音獲取單元),其中,三維視頻流獲取單元包括結(jié)構(gòu)光投射器、攝像頭和可編程門陣列;語音信號(hào)流獲取單元包括麥克風(fēng)、信號(hào)調(diào)理電路和音頻模數(shù)轉(zhuǎn)換器;中央處理器作為動(dòng)作、語音識(shí)別單元對(duì)三維視頻流獲取單元和語音信號(hào)流獲取單元獲取到的信息進(jìn)行識(shí)別。上述各部分的連接關(guān)系如下:結(jié)構(gòu)光投射器與可編程門陣列通過數(shù)字信號(hào)線SI連接;攝像頭與可編程門陣列通過數(shù)字信號(hào)線S2連接;可編程門陣列與中央處理器通過數(shù)字信號(hào)線S3連接,該數(shù)字信號(hào)線S3可使用外部存儲(chǔ)器訪問方式,并使用多比特并行數(shù)據(jù)傳輸;麥克風(fēng)與信號(hào)調(diào)理電路通過模擬信號(hào)線Ml連接;信號(hào)調(diào)理電路與音頻模數(shù)轉(zhuǎn)換器通過模擬信號(hào)線M2連接;音頻模數(shù)轉(zhuǎn)換器與中央處理器通過數(shù)字信號(hào)線S4連接;上述中央處理器支持通用串行總線,用于和外部被控設(shè)備進(jìn)行數(shù)據(jù)通訊。該人機(jī)交互設(shè)備的工作原理如下:可編程門陣列通過數(shù)字信號(hào)線SI控制結(jié)構(gòu)光投射器,產(chǎn)生結(jié)構(gòu)光,并將結(jié)構(gòu)光投射到空間。被上述結(jié)構(gòu)光照明區(qū)域中的物體或者人體的表面輪廓會(huì)對(duì)結(jié)構(gòu)光進(jìn)行調(diào)制,使原始投射的結(jié)構(gòu)光產(chǎn)生變形。攝像頭以一定的幀率連續(xù)采集照明區(qū)域內(nèi)空間圖像,圖像數(shù)據(jù)通過數(shù)字信號(hào)線S2傳給可編程門陣列??删幊涕T陣列預(yù)先配置了深度圖獲取算法,用于將原始采集的信號(hào)實(shí)時(shí)處理成深度圖的視頻流,提供給后續(xù)動(dòng)作模式識(shí)別算法使用,因此,可編程門整列連續(xù)處理攝像頭傳來的數(shù)據(jù),根據(jù)調(diào)制后結(jié)構(gòu)光的變形情況計(jì)算出每個(gè)成像點(diǎn)的深度值,每一幀圖像可以獲得一幀深度圖,連續(xù)幀圖像獲得連續(xù)幀的深度圖,可編程門陣列通過數(shù)字信號(hào)線S3將連續(xù)的幀深度圖送到中央處理器。中央處理器收到連續(xù)幀的深度圖后,通過內(nèi)部的軟件算法進(jìn)行動(dòng)作模式識(shí)別,識(shí)別結(jié)果通過通用串行總線傳給外部被控設(shè)備。結(jié)構(gòu)光投射器可以采用投射光斑或者網(wǎng)格的方式。優(yōu)選的,可以使用單波長的結(jié)構(gòu)光方案,便于在圖像獲取時(shí)采用一定方案濾除環(huán)境光干擾。系統(tǒng)設(shè)計(jì)時(shí)預(yù)先設(shè)定投射方式,可編程門陣列可以控制結(jié)構(gòu)光投射器的供電,方便在休眠模式下降低系統(tǒng)功耗。攝像頭可以使用單色圖像傳感器。優(yōu)選使用帶有和上述單波長相同的帶通光濾波片,利于濾除環(huán)境光干擾。傳感器選擇上應(yīng)該盡可能使用感光面積較大的傳感器,這樣可以降低對(duì)結(jié)構(gòu)光投射器的發(fā)光功率要求,獲得較好的效果。麥克風(fēng)將環(huán)境聲音信號(hào)轉(zhuǎn)換成電信號(hào),通過模擬信號(hào)線Ml輸出到信號(hào)調(diào)理電路。信號(hào)調(diào)理電路按照需要對(duì)麥克風(fēng)傳來的信號(hào)做放大濾波,通過模擬信號(hào)線M2輸出到模數(shù)轉(zhuǎn)換器。模數(shù)轉(zhuǎn)換器把信號(hào)調(diào)理電路傳來的模擬信號(hào)轉(zhuǎn)換成數(shù)字信號(hào),通過數(shù)字信號(hào)線S4輸出到中央處理器。中央處理器收到數(shù)字信號(hào)線S4傳來的數(shù)字信號(hào)后,通過內(nèi)部的軟件算法進(jìn)行語音識(shí)別,識(shí)別結(jié)果通過通用串行總線傳給外部設(shè)備。信號(hào)調(diào)理電路應(yīng)該具有較好的動(dòng)態(tài)范圍、信噪比、增益控制等功能。有利于獲得高質(zhì)量的語音信號(hào),同時(shí)有利于語音識(shí)別和語音重現(xiàn)。通過上述原理課得到,當(dāng)結(jié)構(gòu)光投射器將結(jié)構(gòu)光投射到用戶所在空間位置時(shí),用戶不同的動(dòng)作使結(jié)構(gòu)光產(chǎn)生不同的變形,攝像頭采集變形后的可編程門陣列像,可編程門陣列輸出結(jié)構(gòu)光圖像的深度圖,中央處理器根據(jù)深度圖得到識(shí)別結(jié)果,也即識(shí)別用戶動(dòng)作。這種基于深度圖的識(shí)別方式識(shí)別準(zhǔn)確性高,并且向主機(jī)傳輸?shù)氖亲R(shí)別結(jié)果,避免傳輸深度圖影響傳輸速度和圖像效果。當(dāng)用戶通過語音控制外部被控設(shè)備時(shí),麥克風(fēng)能夠采集到用戶的說話聲音,并經(jīng)過信號(hào)調(diào)理電路和音頻模數(shù)轉(zhuǎn)換器傳送給中央處理器,中央處理器根據(jù)聲音數(shù)字信號(hào)得到識(shí)別結(jié)果,也即識(shí)別用戶語音,并將聲音識(shí)別結(jié)果傳送給外部被控設(shè)備。優(yōu)選地,該人機(jī)交互設(shè)備還包括無線數(shù)據(jù)收發(fā)器,通過無線信道Wl與無線設(shè)備相連接,將無線設(shè)備接收到的用戶輸入傳輸至中央處理器,其中,無線設(shè)備包括無線手柄、無線鍵盤和鼠標(biāo)、無線耳麥等。其中,中央處理器與無線收發(fā)器通過數(shù)字信號(hào)線S5連接,無線收發(fā)器支持主流的無線收發(fā)能力和協(xié)議,比如支持藍(lán)牙,wifi等,同時(shí)支持多設(shè)備的星狀數(shù)據(jù)連接。在該優(yōu)選實(shí)施例中,無線手柄、無線鍵盤、無線鼠標(biāo)獲得用戶控制信號(hào)或無線耳麥捕捉用戶語音信號(hào),通過無線信道Wl傳送給無線收發(fā)機(jī),無線收發(fā)機(jī)將接收到的控制信號(hào)或語音信號(hào)通過數(shù)字信號(hào)線S5發(fā)送給中央處理器,中央處理器收到數(shù)字信號(hào)線S5傳來的數(shù)字信號(hào)后,將控制信號(hào)和語音識(shí)別結(jié)果通過通用串行總線傳給外部被控設(shè)備。因此,聲音信號(hào)可以從麥克風(fēng)獲得,也可以通過無線麥克風(fēng)獲得,取決于使用者。對(duì)于需要排除環(huán)境聲音干擾的情況,佩戴在使用者頭部的麥克風(fēng)會(huì)取得更好的效果。進(jìn)一步地,外部被控設(shè)備播放的數(shù)字語音信號(hào)通過通用串行總線傳送給中央處理器,中央處理器收到外部被控設(shè)備播放的數(shù)字語音信號(hào)通過數(shù)字信號(hào)線S5傳送給無線收發(fā)機(jī),無線收發(fā)機(jī)將中央處理器傳來的數(shù)字語音信號(hào)通過無線信道發(fā)送給無線耳麥,用戶聽到聲音,實(shí)現(xiàn)信號(hào)的雙向傳輸。從以上的描述中,可以看出,本實(shí)用新型實(shí)現(xiàn)了如下技術(shù)效果:該基于體感的人機(jī)交互設(shè)備通過捕捉人體的動(dòng)作和語音,并將動(dòng)作和語音做模式識(shí)別,將模式識(shí)別結(jié)果傳送給外部被控設(shè)備,完成人自身與被控設(shè)備進(jìn)行交互的過程,其中,人機(jī)交互設(shè)備自身可完成動(dòng)作、語音的獲取和模式識(shí)別,直接將識(shí)別結(jié)果傳給外部被控設(shè)備,外部被控設(shè)備只需要完成應(yīng)用程序處理,降低了對(duì)主機(jī)速度要求,使得基于體感的控制應(yīng)用更加廣泛。進(jìn)一步地,該基于體感的人機(jī)交互設(shè)備對(duì)深度圖傳輸采用多比特并行接口,解決了傳輸通道帶寬不足的問題;支持無線連接,可以支持無線鍵盤、無線鼠標(biāo)、無線耳麥、無線手柄等設(shè)備,解決了精細(xì)準(zhǔn)確輸入控制的問題。以上所述僅為本實(shí)用新型的優(yōu)選實(shí)施例而已,并不用于限制本實(shí)用新型,對(duì)于本領(lǐng)域的技術(shù)人員來說,本實(shí)用新型可以有各種更改和變化。凡在本實(shí)用新型的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本實(shí)用新型的保護(hù)范圍之內(nèi)。
權(quán)利要求1.一種基于體感的人機(jī)交互設(shè)備,其特征在于,包括: 獲取單元,用于獲取用戶動(dòng)作和聲音信息; 中央處理器,與所述獲取單元相連接,用于識(shí)別獲取到的動(dòng)作和聲音信息; 傳輸單元,與所述中央處理器相連接,用于將識(shí)別結(jié)果輸出至被控設(shè)備,以使所述被控設(shè)備根據(jù)所述識(shí)別結(jié)果執(zhí)行相應(yīng)的命令。
2.根據(jù)權(quán)利要求1所述的基于體感的人機(jī)交互設(shè)備,其特征在于,所述獲取單元包括: 動(dòng)作獲取單元,用于獲取所述用戶動(dòng)作的圖像;以及 語音獲取單元,用于獲取所述用戶的語音信息。
3.根據(jù)權(quán)利要求2所述的基于體感的人機(jī)交互設(shè)備,其特征在于,所述動(dòng)作獲取單元包括: 結(jié)構(gòu)光投射器,用于將結(jié)構(gòu)光投射至所述用戶所在的空間; 圖像采集器,用于采集所述結(jié)構(gòu)光投射的空間內(nèi)的圖像;以及 可編程門陣列,用于計(jì)算并輸出采集到的圖像的深度圖。
4.根據(jù)權(quán)利要求3所述的基于體感的人機(jī)交互設(shè)備,其特征在于, 所述圖像采集器為單色圖像傳感器; 所述結(jié)構(gòu)光投射器為單波長結(jié)構(gòu)光投射器;以及 所述單色圖像傳感器具有與所述單波長結(jié)構(gòu)光投射器波長相同的帶通光濾波片。
5.根據(jù)權(quán)利要求3所述的基于體感的人機(jī)交互設(shè)備,其特征在于, 所述結(jié)構(gòu)光投射器與所述可編程門陣列通過第一數(shù)字信號(hào)線連接; 所述圖像采集器與所述可編程門陣列通過第二數(shù)字信號(hào)線連接;以及 所述可編程門陣列與所述中央處理器通過第三數(shù)字信號(hào)線連接。
6.根據(jù)權(quán)利要求2所述的基于體感的人機(jī)交互設(shè)備,其特征在于,所述語音獲取單元包括: 語音采集器,用于采集所述用戶的聲音信號(hào),將所述聲音信號(hào)轉(zhuǎn)換為電信號(hào); 信號(hào)調(diào)理電路,用于將所述電信號(hào)進(jìn)行放大濾波;以及 音頻模數(shù)轉(zhuǎn)換器,用于將放大濾波后的模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)后輸出。
7.根據(jù)權(quán)利要求6所述的基于體感的人機(jī)交互設(shè)備,其特征在于, 所述語音采集器與信號(hào)調(diào)理電路通過第一模擬信號(hào)線連接; 所述信號(hào)調(diào)理電路與所述音頻模數(shù)轉(zhuǎn)換器通過第二模擬信號(hào)線連接;以及 所述音頻模數(shù)轉(zhuǎn)換器與所述中央處理器通過第四數(shù)字信號(hào)線連接。
8.根據(jù)權(quán)利要求1所述的基于體感的人機(jī)交互設(shè)備,其特征在于,還包括: 無線輸入設(shè)備,用于接收用戶輸入的控制信號(hào);以及 無線收發(fā)器,與所述無線輸入設(shè)備和所述中央處理器相連接,用于將所述控制信號(hào)經(jīng)由所述中央處理器和所述傳輸單元輸出至所述被控設(shè)備。
9.根據(jù)權(quán)利要求8所述的基于體感的人機(jī)交互設(shè)備,其特征在于,所述無線輸入設(shè)備包括:無線鍵盤、無線鼠標(biāo)、無線耳麥和/或無線手柄。
10.根據(jù)權(quán)利要求8所述的基于體感的人機(jī)交互設(shè)備,其特征在于,所述中央處理器與所述無線收發(fā)器通過第五數(shù)字信號(hào)線連接。
專利摘要本實(shí)用新型公開了一種基于體感的人機(jī)交互設(shè)備。該設(shè)備包括獲取單元,用于獲取用戶動(dòng)作和聲音信息;中央處理器,與獲取單元相連接,用于識(shí)別獲取到的動(dòng)作和聲音信息;傳輸單元,與中央處理器相連接,用于將識(shí)別結(jié)果輸出至被控設(shè)備,以使被控設(shè)備根據(jù)識(shí)別結(jié)果執(zhí)行相應(yīng)的命令。通過本實(shí)用新型,能夠直接向普通被控設(shè)備輸出用戶動(dòng)作和聲音的識(shí)別結(jié)果,無需普通設(shè)備進(jìn)行動(dòng)作聲音識(shí)別,因而能夠?qū)Ⅲw感控制應(yīng)用到普通設(shè)備中,用戶體驗(yàn)好。
文檔編號(hào)G06F3/01GK203164866SQ201320026829
公開日2013年8月28日 申請(qǐng)日期2013年1月17日 優(yōu)先權(quán)日2013年1月17日
發(fā)明者余大勇, 趙明, 高郇 申請(qǐng)人:高斯泰克(北京)科技有限公司