欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

具有聲控翻譯功能的便攜式數(shù)字媒體播放器的制作方法

文檔序號:6776076閱讀:183來源:國知局
專利名稱:具有聲控翻譯功能的便攜式數(shù)字媒體播放器的制作方法
技術(shù)領(lǐng)域
本實用新型涉及一種便攜式數(shù)字媒體播放器,尤其涉及一種具有聲控翻譯功能的便攜式數(shù)字媒體播放器。
背景技術(shù)
隨著科技和經(jīng)濟的不斷發(fā)展,在日常生活和工作中人們需要與越來越多的不同國籍的人進行交流。然而由于語言的不通,不可避免地會造成交流困難的問題,不僅信息無法得到溝通,而且很可能會產(chǎn)生誤解,給雙方都帶來了極大的不便。目前,MP3、MP4等便攜式數(shù)字媒體播放器由于其結(jié)構(gòu)小巧、操作便捷而得到了廣泛普及。

實用新型內(nèi)容為了解決人們在日常生活和工作中與不同國籍人交流的語言障礙問題,本實用新型提出了一種具有聲控翻譯功能的便攜式數(shù)字媒體播放器。
本實用新型解決解決人們在日常生活和工作中與不同國籍人交流的語言障礙問題所采用的技術(shù)方案是提供一種具有聲控翻譯功能的便攜式數(shù)字媒體播放器,該數(shù)字媒體播放器包括存儲數(shù)字媒體數(shù)據(jù)的存儲單元;用于對數(shù)字媒體數(shù)據(jù)進行處理的數(shù)據(jù)處理單元;用于顯示或語音播放數(shù)據(jù)處理單元輸出的信號的輸出單元;進行功能控制和信息處理的中央處理單元,該數(shù)字媒體播放器還進一步包括用于接收用戶語音信息的麥克風(fēng);對用戶語音信息進行識別的語音識別單元,中央處理單元根據(jù)語音識別單元所識別的語音信息從存儲單元中的文本信息選出相似度大于預(yù)定閾值的文本信息并根據(jù)存儲單元中存儲的詞庫翻譯成目標(biāo)文本信息,然后由輸出單元進行顯示或語音播放。
根據(jù)本實用新型一優(yōu)選實施例,輸出單元包括顯示屏和揚聲器。
根據(jù)本實用新型一優(yōu)選實施例,數(shù)據(jù)處理單元包括音頻解碼模塊和音頻處理模塊,音頻處理模塊與揚聲器相連接。
根據(jù)本實用新型一優(yōu)選實施例,數(shù)據(jù)處理單元包括視頻解碼模塊、接收視頻解碼模塊輸出的數(shù)字視頻信號的顯示模塊以及接收視頻解碼模塊輸出的數(shù)字音頻信號的音頻處理模塊,顯示模塊與顯示屏相連接,音頻處理模塊與揚聲器相連接。
根據(jù)本實用新型一優(yōu)選實施例,中央處理單元根據(jù)語音識別單元所識別的語音信息從存儲單元中選出至少兩個相似度大于預(yù)定閾值的文本信息并在顯示屏上進行顯示。
根據(jù)本實用新型一優(yōu)選實施例,中央處理單元還根據(jù)用戶確定指令從至少兩個相關(guān)文本信息中選擇用戶確認(rèn)的文本信息。
根據(jù)本實用新型一優(yōu)選實施例,中央處理單元根據(jù)存儲器內(nèi)存儲的詞庫將用戶確認(rèn)的文本信息翻譯成目標(biāo)文本信息并在顯示屏上進行顯示。
根據(jù)本實用新型一優(yōu)選實施例,數(shù)字媒體播放器進一步包括將目標(biāo)文本信息轉(zhuǎn)換成語音信息的語音轉(zhuǎn)換單元。
根據(jù)本實用新型一優(yōu)選實施例,存儲器中存儲有多個備選詞庫。
根據(jù)本實用新型一優(yōu)選實施例,語音識別單元為針對非特定人的語音識別單元。
上述技術(shù)方案的有益效果是在現(xiàn)有MP3、MP4等廣泛使用的便攜式數(shù)字媒體播放器中增加了聲控翻譯功能并合理利用數(shù)字媒體播放器中現(xiàn)有元器件,便于用戶克服在日常生活和工作中與不同國籍的人交流的語言障礙問題。

圖1是本實用新型的數(shù)字媒體播放器一實施例的示意框圖;圖2是本實用新型的數(shù)字媒體播放器另一實施例的示意框圖。
具體實施方式
以下結(jié)合附圖和實施例對本實用新型進一步說明。
參見圖1,圖1是本實用新型的數(shù)字媒體播放器一實施例的示意框圖。在本實施例中以MP3播放器為例對本實用新型進行示范性描述,MP3播放器1包括存儲MP3文件的存儲單元101;進行功能控制和信息處理的中央處理單元102;對MP3文件進行解碼的音頻解碼模塊103;與音頻解碼模塊103相連接的音頻處理單元104;與音頻處理單元104相連的揚聲器105以及經(jīng)顯示模塊106與中央處理單元102和音頻解碼模塊103相連接的顯示屏107。使用時,音頻解碼模塊103對MP3文件進行解碼,并將數(shù)字音頻信號傳輸?shù)揭纛l處理單元104,由音頻處理單元104進行D/A轉(zhuǎn)換形成模擬信號并由揚聲器105進行語音播放。顯示屏107用于顯示中央處理單元102的控制狀態(tài)以及MP3文件信息。
此外,MP3播放器1還進一步包括用于接收用戶語音信息的麥克風(fēng)108;對用戶語音信息進行識別的語音識別單元109。中央處理單元102根據(jù)語音識別單元109所識別的語音信息從存儲單元101中的文本信息選出相似度大于預(yù)定閾值的文本信息并根據(jù)存儲單元101中存儲的詞庫翻譯成目標(biāo)文本信息,然后由顯示屏107進行顯示或者經(jīng)語音轉(zhuǎn)換單元110將目標(biāo)文本信息轉(zhuǎn)換成語音信息經(jīng)揚聲器105進行播放。
中央處理單元102優(yōu)選根據(jù)語音識別單元109所識別的語音信息從存儲單元101中選出至少兩個相似度大于預(yù)定閾值的文本信息,在顯示屏107上進行顯示并等待用戶進行確認(rèn)。用戶通過語音指令或控制界面的按鍵指令選擇出適當(dāng)?shù)奈谋拘畔?。中央處理單?02根據(jù)存儲單元101內(nèi)的詞庫將所選擇的文本信息翻譯成相應(yīng)的目標(biāo)文本信息。在MP3播放器1的存儲單元101內(nèi)可以存儲多種翻譯映射詞庫,例如旅游用語詞庫、商務(wù)用語詞庫、工程用語詞庫等,用戶可以根據(jù)具體的語言環(huán)境通過選擇適當(dāng)?shù)穆糜斡谜Z詞庫來進行最恰當(dāng)?shù)姆g。
使用時,用戶對著MP3播放器1所出自己想要表達的短句,對選擇出的備選文本信息進行確認(rèn),并由MP3播放器1翻譯成相應(yīng)的語音,將其拼寫顯示在顯示屏上或進行語音播報。而其他用戶通過語音播報或查看顯示屏的顯示內(nèi)容理解用戶想要表達的意思,并通過反向的翻譯過程回答提問,進而實現(xiàn)互動翻譯。在翻譯過程中,由于出現(xiàn)備選內(nèi)容,避免了由于同音不同意的字或詞條所帶來的翻譯錯誤,保證了翻譯的準(zhǔn)確率。
參見圖2,圖2是本實用新型的數(shù)字媒體播放器另一實施例的示意框圖。在本實施例中,在本實施例中以MP4播放器為例對本實用新型進行示范性描述,MP4播放器2包括存儲MP4文件的存儲單元201;進行功能控制和信息處理的中央處理單元202;對MP4文件進行解碼的視頻解碼模塊204;與視頻解碼模塊203相連接的并接收數(shù)字音頻數(shù)據(jù)的音頻處理單元204;與音頻處理單元204相連的揚聲器205以及經(jīng)顯示模塊206與中央處理單元202和視頻解碼模塊203相連接的顯示屏207。使用時,視頻解碼模塊203首先對MP4文件進行視頻解碼,并將解碼后的數(shù)字音頻信號傳輸?shù)揭纛l處理單元204,由音頻處理單元204進行D/A轉(zhuǎn)換形成模擬信號并由揚聲器205進行語音播放,解碼后的數(shù)字視頻信號經(jīng)顯示模塊206在顯示屏107進行顯示。MP4播放器2還進一步包括用于接收用戶語音信息的麥克風(fēng)208;對用戶語音信息進行識別的語音識別單元209。中央處理單元202根據(jù)語音識別單元209所識別的語音信息從存儲單元201中的文本信息選出相似度大于預(yù)定閾值的文本信息并根據(jù)存儲單元201中存儲的詞庫翻譯成目標(biāo)文本信息,然后由顯示屏207進行顯示或者經(jīng)語音轉(zhuǎn)換單元110將目標(biāo)文本信息轉(zhuǎn)換成語音信息經(jīng)揚聲器205進行播放。
此外,MP4播放器2還進一步設(shè)置數(shù)據(jù)收發(fā)單元211。利用數(shù)據(jù)收發(fā)單元211可以通過各種傳輸協(xié)議與其他同類數(shù)字媒體播放器建立無線或有線連接,例如通過互聯(lián)網(wǎng)、紅外或藍牙信號。采用這種聯(lián)機方式進行翻譯無需將頻繁地將數(shù)字媒體播放器遞交到其他用戶手中,可以使用戶更方便地進行“對話”。
本實用新型數(shù)字媒體播放器的語音識別單元可以包括針對特定人的語音識別系統(tǒng)或針對非特定人的語音識別系統(tǒng)。在針對特定人的語音識別系統(tǒng)中,用戶需要事先對每一個詞條進行訓(xùn)練。在訓(xùn)練階段,用戶每個詞條依次說數(shù)遍,數(shù)字媒體播放器的語音識別單元提取詞條的特征量,并將特征量按序列存入存儲單元中。在識別階段,語音識別單元將輸入詞條的特征量依次與存儲單元中存儲的每一個特征量進行相似度比較,將相似度大于預(yù)定閾值的詞條作為識別結(jié)果輸出。針對特定人的識別系統(tǒng)識別的詞條數(shù)目一般在100條以下,識別性能隨著詞條數(shù)目的增加會有明顯的下降,并且對于不同用戶、在不同的噪聲環(huán)境中,以及不同的時間相同用戶的不同生理、心理狀態(tài)下,系統(tǒng)的性能都會受到明顯的影響。當(dāng)采用針對非特定人的語音識別系統(tǒng)中,采用基于統(tǒng)計模型的算法,系統(tǒng)開發(fā)者事先采集大量的語音數(shù)據(jù)進行訓(xùn)練,得到聲學(xué)模型并存儲在存儲單元中。在識別階段,語音識別單元將用戶的輸入詞條的特征量與通過聲學(xué)模型構(gòu)建的識別網(wǎng)絡(luò)進行匹配解碼,輸出該詞條。中央處理單元可根據(jù)語音識別單元輸出的識別結(jié)果進行相應(yīng)顯示。非特定人語音識別系統(tǒng)對于用戶而言,不需要引入繁瑣的訓(xùn)練過程,方便了用戶的使用;同時它可以供不同的人使用,因此大大拓寬了應(yīng)用范圍。另一方面,由于采用了基于統(tǒng)計模型的算法,其穩(wěn)健性和識別性能都比特定人識別系統(tǒng)大大的提高。非特定人識別系統(tǒng)識別的詞條數(shù)目可以達到1000條,識別性能不會隨著識別詞條數(shù)目的增加有明顯的下降,并且具有一定的抗噪能力。
通過上述實施例,可以在現(xiàn)有MP3、MP4等廣泛使用的便攜式數(shù)字媒體播放器中增加了聲控翻譯功能并合理利用數(shù)字媒體播放器中現(xiàn)有元器件,便于用戶克服在日常生活和工作中與不同國籍的人交流的語言障礙問題。
上述的詳細描述僅是示范性描述,本領(lǐng)域技術(shù)人員在不脫離本實用新型所保護的范圍和精神的情況下,可根據(jù)不同的實際需要設(shè)計出各種實施方式。
權(quán)利要求1.一種具有聲控翻譯功能的便攜式數(shù)字媒體播放器,所述數(shù)字媒體播放器包括存儲數(shù)字媒體數(shù)據(jù)的存儲單元;用于對所述數(shù)字媒體數(shù)據(jù)進行處理的數(shù)據(jù)處理單元;用于顯示或語音播放所述數(shù)據(jù)處理單元輸出的信號的輸出單元;進行功能控制和信息處理的中央處理單元,其特征在于所述數(shù)字媒體播放器還進一步包括用于接收用戶語音信息的麥克風(fēng);對所述用戶語音信息進行識別的語音識別單元,所述中央處理單元根據(jù)所述語音識別單元所識別的語音信息從所述存儲單元中的文本信息選出相似度大于預(yù)定閾值的文本信息并根據(jù)所述存儲單元中存儲的詞庫翻譯成目標(biāo)文本信息,然后由所述輸出單元進行顯示或語音播放。
2.根據(jù)權(quán)利要求1所述的數(shù)字媒體播放器,其特征在于所述輸出單元包括顯示屏和揚聲器。
3.根據(jù)權(quán)利要求2所述的數(shù)字媒體播放器,其特征在于所述數(shù)據(jù)處理單元包括音頻解碼模塊和音頻處理模塊,所述音頻處理模塊與所述揚聲器相連接。
4.根據(jù)權(quán)利要求2所述的數(shù)字媒體播放器,其特征在于所述數(shù)據(jù)處理單元包括視頻解碼模塊、接收所述視頻解碼模塊輸出的數(shù)字視頻信號的顯示模塊以及接收所述視頻解碼模塊輸出的數(shù)字音頻信號的音頻處理模塊,所述顯示模塊與所述顯示屏相連接,所述音頻處理模塊與所述揚聲器相連接。
5.根據(jù)權(quán)利要求2所述的數(shù)字媒體播放器,其特征在于所述中央處理單元根據(jù)所述語音識別單元所識別的語音信息從所述存儲單元中選出至少兩個相似度大于預(yù)定閾值的文本信息并在所述顯示屏上進行顯示。
6.根據(jù)權(quán)利要求5所述的數(shù)字媒體播放器,其特征在于所述中央處理單元還根據(jù)用戶確定指令從所述至少兩個相關(guān)文本信息中選擇用戶確認(rèn)的文本信息。
7.根據(jù)權(quán)利要求6所述的數(shù)字媒體播放器,其特征在于所述中央處理單元根據(jù)所述存儲器內(nèi)存儲的詞庫將所述用戶確認(rèn)的文本信息翻譯成目標(biāo)文本信息并在所述顯示屏上進行顯示。
8.根據(jù)權(quán)利要求7所述的數(shù)字媒體播放器,其特征在于所述數(shù)字媒體播放器進一步包括將所述目標(biāo)文本信息轉(zhuǎn)換成語音信息的語音轉(zhuǎn)換單元。
9.根據(jù)權(quán)利要求1所述的數(shù)字媒體播放器,其特征在于所述存儲器中存儲有多個備選詞庫。
10.根據(jù)上述權(quán)利要求任意一項所述的數(shù)字媒體播放器,其特征在于所述語音識別單元為針對非特定人的語音識別單元。
專利摘要本實用新型涉及一種具有聲控翻譯功能的便攜式數(shù)字媒體播放器,包括存儲數(shù)字媒體數(shù)據(jù)的存儲單元;用于對數(shù)字媒體數(shù)據(jù)進行處理的數(shù)據(jù)處理單元;用于顯示或播放數(shù)據(jù)處理單元輸出的信號的輸出單元;進行功能控制和信息處理的中央處理單元;用于接收用戶語音信息的麥克風(fēng);對用戶語音信息進行識別的語音識別單元,中央處理單元根據(jù)語音識別單元所識別的語音信息從存儲單元中的文本信息選出相似度大于預(yù)定閾值的文本信息并根據(jù)存儲單元中存儲的詞庫翻譯成目標(biāo)文本信息,然后由輸出單元進行顯示或播放。通過上述結(jié)構(gòu),在MP3、MP4等現(xiàn)有便攜式數(shù)字媒體播放器中增加了聲控翻譯功能。
文檔編號G11B20/00GK2904207SQ200620013828
公開日2007年5月23日 申請日期2006年5月12日 優(yōu)先權(quán)日2006年5月12日
發(fā)明者陳修志 申請人:陳修志
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
湾仔区| 嘉禾县| 辽阳市| 高青县| 广西| 荔波县| 松原市| 兴安县| 余姚市| 浮山县| 广宗县| 长宁县| 奎屯市| 莱州市| 康乐县| 额济纳旗| 永安市| 崇信县| 盱眙县| 金华市| 峨眉山市| 西和县| 子洲县| 荔浦县| 陇南市| 阿合奇县| 鄂托克旗| 刚察县| 成都市| 静乐县| 南和县| 麦盖提县| 额济纳旗| 兰坪| 乐陵市| 博爱县| 公安县| 商水县| 岳阳县| 连云港市| 稻城县|