采用語音識別系統(tǒng)進行設(shè)置的攝像機的制作方法

文檔序號：7919277閱讀：352來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：采用語音識別系統(tǒng)進行設(shè)置的攝像機的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種攝像機，特別涉及一種采用語音識別系統(tǒng)進行設(shè)置的攝像機。
背景技術(shù)：
目前的人機交流主要是手動操作方式實現(xiàn)人機對話，限制了人與計算機系統(tǒng)和機電系統(tǒng)交流的靈活性。為了提高數(shù)字化家電系統(tǒng)人機對話靈活性，方便老人、殘疾人等特殊人群需要，在人機對話方面需要尋求更好的信息交換手段。因為語言是人類最主要和最基本的交流方式，而且隨著數(shù)字信號處理軟件和硬件的發(fā)展，到目前為止語音處理技術(shù)日趨成熟，己接近實用化階段。

發(fā)明內(nèi)容
鑒于現(xiàn)有技術(shù)存在的不足，本發(fā)明提供了一種通過語音輸入可以進行控制攝像機操作的采用語音識別系統(tǒng)進行設(shè)置的攝像機。本發(fā)明為現(xiàn)實上述目的所采取的技術(shù)方案是一種采用語音識別系統(tǒng)進行設(shè)置的攝像機，包括與攝像機電子線路連接的CPU電路及編碼解碼電路，其特征在于，還包括語音模塊，所述的語音模塊分別與CPU電路及編碼解碼電路連接，所述的CPU電路存儲控制程序，其控制步驟是 1、當(dāng)接通電源開機后，系統(tǒng)進入第一個選擇即是否進入語音控制模式，系統(tǒng)將該選擇設(shè)置為開機自動選擇項目，如果選擇NO則系統(tǒng)進入手動模式，這時攝像機的功能和普通的攝像機一樣； 2、如果選擇YES，則該信息會通過CPU傳達到語音控制模塊，激活語音控制模塊的動作，這時攝像機將進入語音控制啟動狀態(tài)； 3、然后進行關(guān)鍵字的識別，這里能夠通過語音操作的關(guān)鍵字有錄像、停止、放像、
關(guān)機，用戶說出"錄像"后系統(tǒng)會判斷該信息，然后將判斷得到的信息發(fā)送給CPU后進行執(zhí)
行，用戶每說一個關(guān)鍵字程序就進行一次判斷，直到"關(guān)機"這個程序被執(zhí)行為止。本發(fā)明的有益效果是可使用語音系統(tǒng)技術(shù)，進行對攝像機的操作，使操作更佳便
捷，并且能通過智能語音系統(tǒng)的使用提高抓拍的效果和速度，改善了因調(diào)節(jié)菜單造成的最
佳畫面流失的缺陷，隨著語音聲控系統(tǒng)的完善，新產(chǎn)品也將在大量涌現(xiàn)。

圖1為本發(fā)明的電路連接框圖。
圖2為本發(fā)明的控制流程圖。
具體實施例方式
如圖1、2所示采用語音識別系統(tǒng)進行設(shè)置的攝像機，包括與攝像機電子線路連接的CPU電路及編碼解碼電路，還包括語音模塊，語音模塊分別與CPU電路及編碼解碼電路連接，CPU電路存儲控制程序，其控制步驟是 1、當(dāng)接通電源開機后，系統(tǒng)進入第一個選擇即是否進入語音控制模式，該選項在菜單中也有，系統(tǒng)將該選擇設(shè)置為開機自動選擇項目，如果選擇NO則系統(tǒng)進入手動模式，這時攝像機的功能和普通的攝像機一樣； 2、如果選擇YES，則該信息會通過CPU傳達到語音控制模塊，激活語音控制模塊的動作，這時攝像機將進入語音控制啟動狀態(tài)； 3、然后進行關(guān)鍵字的識別，這里能夠通過語音操作的關(guān)鍵字有錄像、停止、放像、關(guān)機，用戶說出"錄像"后系統(tǒng)會判斷該信息，然后將判斷得到的信息發(fā)送給CPU后進行執(zhí) 行，用戶每說一個關(guān)鍵字程序就進行一次判斷，直到"關(guān)機"這個程序被執(zhí)行為止。
本發(fā)明包括硬件設(shè)計和軟件設(shè)計兩部分，硬件部分在攝像機電子線路中增加了語音處理芯片(RSC-364)，軟件上增加了控制語音處理的代碼。語音模塊(RSC-364)是一片以8位MCU為核心的CMOS器件，且還集成了 ROM、 RAM、 A/D、 D/A、前端放大器及功率放大器等組件。RSC-364具有準(zhǔn)確，快速的反應(yīng)時間、低成本，且多功能，只要加上很少的外部組件，就可以組成一個語音識別系統(tǒng)。其運算能力為4MIPS (Million Instructions Per Second)為了提高運算能力，芯片上還多了一個 24bitX24bit的乘法器。 RSC-364使用預(yù)先學(xué)習(xí)好的人工神經(jīng)網(wǎng)絡(luò)進行非特定語者之語音識別，即不需要經(jīng)過訓(xùn)練就可以識別〃 Yse〃、〃 No" 、〃 0k〃等簡單語句，其Data Book上稱其識別率為97%以上。 RSC-364還具有5 15kb/s的語音合成功能，其語音合成是由Sensory專門設(shè)計，其音質(zhì)較一般的好。它還具有改進的ADPCM(自適應(yīng)差分脈沖調(diào)制)語音編譯碼功能。
RSC-364的設(shè)計，包括麥克風(fēng)信號擴大，數(shù)據(jù)轉(zhuǎn)換，識別和綜合功能性，還有在ROM 儲存器(僅RSC-364芯片具有)中，有一單芯片CPU的核心，因此，RSC-364能在14. 32MHz 提供整數(shù)性能的4MIPS。這能使消費者以最小的費用取得最大的效能。RSC-364指令表非常類似于微處理器的8051族群。其處理器避免限制專用內(nèi)存，透過有完全對稱來源和目的，適合全部指令。聲控系統(tǒng)在多數(shù)DVC都自帶麥克風(fēng)部分，因此可以直接連接到DVC中的麥克風(fēng)。由 DVC主板提供電源。多識別引擎識別器工作流程為 (1)對輸入語音進行預(yù)處理，包括語音信號的切分以及噪聲去除等。語音信號的切分采用的是基于能量窗計算的切分算法，使得語音信號的端點更準(zhǔn)確。 (2)根據(jù)輸入語音的物理長度以及其它物理特征預(yù)判輸入語音為孤立詞輸入還是連續(xù)語音輸入。如果語音信號較短，則采用識別引擎1、2進行識別；如果信號較長，則采用識別引擎2、3進行識別；如果不能確定是孤立語音還是連續(xù)語音，則同時采用三個識別引擎進行識別。 (3)對于不同的識別引擎，將得到的識別結(jié)果作為候選關(guān)鍵詞(如果識別結(jié)果不同則為多候選)送入確認(rèn)模塊進行確認(rèn)。由于基于多識別引擎的識別器至少同時啟動了兩個或者三個識別引擎，因此系統(tǒng) 的響應(yīng)時間不可避免地要受到影響。所以在語音建模時，采用參數(shù)共享的方法，從而降低了計算法復(fù)雜度，提高了系統(tǒng)響應(yīng)速度。同時注意到，對于孤立語音來說，由于識別引擎1、2 的識別速度很快，因此完全可以滿足實時響應(yīng)的要求；對于連續(xù)語音來說，其識別時間主要耗費在識別引擎3上，這是不可避免的，系統(tǒng)引入的附加耗時很小，因此基本上不會因此而降低系統(tǒng)的響應(yīng)速度。而多識別引擎的識別器的建立，使得無論連續(xù)語音輸入還是孤立語音輸入，都能采用合適的識別引擎進行識別，從而在允許用戶自由交流的基礎(chǔ)上，保證了系統(tǒng)的識別率得到大幅度的提高。尤其是用戶在采用連續(xù)語音輸入系統(tǒng)不能正確識別時，可以降低要求，視其為孤立語音輸入，這樣一方面可以正確控制家電正常運行，另一方面通過自適應(yīng)，不同識別引擎的模型都得到了更為精確的刻畫，逐漸提高了系統(tǒng)識別率，從而使得連續(xù)語音識別率也得到了提高。另外，在各種情況下都采用了連接識別引擎，主要是考慮到殘疾用戶的語音中經(jīng)常附帶一些常見的突發(fā)噪聲以及語氣詞，因此通過對此進行獨立建模，能夠去除語音信號首尾的噪聲和語氣詞的影響。
權(quán)利要求
一種采用語音識別系統(tǒng)進行設(shè)置的攝像機，包括與攝像機電子線路連接的CPU電路及編碼解碼電路，其特征在于，還包括語音模塊，所述的語音模塊分別與CPU電路及編碼解碼電路連接，所述的CPU電路存儲控制程序步驟是(1)當(dāng)接通電源開機后，系統(tǒng)進入第一個選擇即是否進入語音控制模式，系統(tǒng)將該選擇設(shè)置為開機自動選擇項目，如果選擇NO則系統(tǒng)進入手動模式，這時攝像機的功能和普通的攝像機一樣；(2)如果選擇YES，則該信息會通過CPU傳達到語音控制模塊，激活語音控制模塊動作，這時攝像機將進入語音控制啟動狀態(tài)；(3)語音控制模塊進行關(guān)鍵字的識別，這里能夠通過語音操作的關(guān)鍵字有錄像、停止、放像、關(guān)機；用戶說出“錄像”后系統(tǒng)會判斷該信息，然后將判斷得到的信息發(fā)送給CPU后進行執(zhí)行，用戶每說一個關(guān)鍵字程序就進行一次判斷，直到“關(guān)機”這個程序被執(zhí)行為止。
全文摘要
本發(fā)明涉及一種采用語音識別系統(tǒng)進行設(shè)置的攝像機，它包括與攝像機電子線路連接的CPU電路及編碼解碼電路，還包括語音模塊，語音模塊分別與CPU電路及編碼解碼電路連接，CPU電路存儲控制程序步驟是當(dāng)接通電源開機后，系統(tǒng)進入第一個選擇即是進入語音控制模式，激活語音控制模塊的動作，這時攝像機將進入語音控制啟動狀態(tài)；然后進行關(guān)鍵字的識別，能夠通過語音操作的關(guān)鍵字有錄像、停止、放像、關(guān)機，用戶說出“錄像”后系統(tǒng)會判斷該信息，然后將判斷得到的信息發(fā)送給CPU后進行執(zhí)行，該機可使使操作更佳便捷，并且能通過智能語音系統(tǒng)的使用提高抓拍的效果和速度，改善了因調(diào)節(jié)菜單造成的最佳畫面流失的缺陷。
文檔編號H04N5/232GK101742110SQ20081015290
公開日2010年6月16日申請日期2008年11月10日優(yōu)先權(quán)日2008年11月10日
發(fā)明者李妮, 鄭龍周申請人:天津三星電子有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：李妮;鄭龍周
技術(shù)所有人：天津三星電子有限公司
我是此專利的發(fā)明人

上一篇：自動跟蹤攝像系統(tǒng)的制作方法
上一篇：隨機防偽產(chǎn)品及手機鑒真方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機構(gòu)動力學(xué)與控制
5、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

家庭語音控制系統(tǒng)相關(guān)技術(shù)

?？稻W(wǎng)絡(luò)攝像機ip設(shè)置相關(guān)技術(shù)

攝像機快門速度設(shè)置相關(guān)技術(shù)

攝像機白平衡設(shè)置技巧相關(guān)技術(shù)

ae攝像機景深焦距設(shè)置相關(guān)技術(shù)

網(wǎng)絡(luò)攝像機ip設(shè)置相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

采用語音識別系統(tǒng)進行設(shè)置的攝像機的制作方法