欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于識(shí)別與語(yǔ)音命令相關(guān)聯(lián)的位置以控制家用電器的方法和系統(tǒng)的制作方法

文檔序號(hào):9553318閱讀:297來(lái)源:國(guó)知局
用于識(shí)別與語(yǔ)音命令相關(guān)聯(lián)的位置以控制家用電器的方法和系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種用于在家庭環(huán)境中識(shí)別與語(yǔ)音命令相關(guān)聯(lián)的位置以控制家用電器的方法和系統(tǒng)。更具體地,本發(fā)明涉及一種用于使用機(jī)器學(xué)習(xí)方法來(lái)識(shí)別用戶在何處發(fā)出語(yǔ)音命令并且然后對(duì)與用戶在同一房間中的家用電器執(zhí)行語(yǔ)音命令的動(dòng)作的方法和系統(tǒng)。
【背景技術(shù)】
[0002]如今通過(guò)移動(dòng)電話上的語(yǔ)音命令進(jìn)行的個(gè)人助理應(yīng)用越來(lái)越受歡迎。這種類型的應(yīng)用使用自然語(yǔ)言處理來(lái)回答問(wèn)題、提出建議、以及通過(guò)將請(qǐng)求委托給目的地電視機(jī)或STB (機(jī)頂盒)來(lái)對(duì)諸如電視機(jī)之類的家用電器執(zhí)行動(dòng)作。
[0003]然而,在具有一個(gè)以上電視機(jī)的典型家庭環(huán)境中,如果應(yīng)用僅識(shí)別出用戶向移動(dòng)電話說(shuō)出“打開電視”,那么在沒(méi)有與說(shuō)出語(yǔ)音命令的地點(diǎn)相關(guān)的適當(dāng)位置信息的情況下決定應(yīng)當(dāng)打開哪個(gè)電視機(jī)是很含糊的。因此,基于用戶命令的背景來(lái)確定將要控制哪個(gè)電視機(jī)的附加方法是必要的。
[0004]在本申請(qǐng)中提出的解決方案解決了在家庭環(huán)境中存在多個(gè)電視機(jī)時(shí)當(dāng)前技術(shù)的通過(guò)語(yǔ)音命令進(jìn)行的個(gè)人助理應(yīng)用無(wú)法正確地識(shí)別需要控制哪個(gè)電視機(jī)的難題。
[0005]通過(guò)提出利用所記錄的“打開電視”語(yǔ)音命令提取特征并且通過(guò)用分類方法分析該特征來(lái)識(shí)別說(shuō)出“打開電視”的語(yǔ)音命令的地點(diǎn)的方法,所提出的方法能夠找到與語(yǔ)音命令相關(guān)聯(lián)的位置并且然后打開同一房間中的電視。
[0006]家用電器包括多個(gè)電視機(jī)、空調(diào)設(shè)備、照明設(shè)備等。
[0007]作為相關(guān)技術(shù),US20100332668A1公開了一種用于檢測(cè)電子裝置之間的接近度的方法和系統(tǒng)。

【發(fā)明內(nèi)容】

[0008]根據(jù)本發(fā)明的一方面,提供了一種用于在家庭環(huán)境中用語(yǔ)音命令來(lái)控制位于指定房間中的家用電器的方法,該方法包括以下步驟:接收由用戶進(jìn)行的語(yǔ)音命令;記錄所接收的語(yǔ)音命令;采樣所記錄的語(yǔ)音命令,以及從所記錄的語(yǔ)音命令中提取特征;通過(guò)將語(yǔ)音命令的提取的特征與特征參考進(jìn)行比較來(lái)確定房間標(biāo)簽,其中房間標(biāo)簽與特征參考相關(guān)聯(lián);將房間標(biāo)簽指定給語(yǔ)音命令;以及根據(jù)所述語(yǔ)音命令來(lái)控制位于指定房間中的家用電器。
[0009]根據(jù)本發(fā)明的另一方面,提供了一種用于在家庭環(huán)境中用語(yǔ)音命令來(lái)控制位于指定房間中的家用電器的系統(tǒng),該系統(tǒng)包括:接收器,用于接收由用戶進(jìn)行的語(yǔ)音命令;記錄器,用于記錄所接收的語(yǔ)音命令;以及控制器,其被配置為:采樣所記錄的語(yǔ)音命令,以及從所記錄的語(yǔ)音命令中提取特征;通過(guò)將語(yǔ)音命令的提取的特征與特征參考進(jìn)行比較來(lái)確定房間標(biāo)簽,其中房間標(biāo)簽與特征參考相關(guān)聯(lián);將房間標(biāo)簽指定給語(yǔ)音命令;以及根據(jù)語(yǔ)音命令來(lái)控制位于指定房間中的家用電器。
【附圖說(shuō)明】
[0010]根據(jù)結(jié)合附圖的以下描述,本發(fā)明的這些和其它方面、特征和優(yōu)點(diǎn)將變得顯而易見(jiàn),附圖中:
[0011]圖1示出了根據(jù)本發(fā)明的實(shí)施例的在家庭環(huán)境中的不同房間中存在一個(gè)以上電視機(jī)的示例性情況;
[0012]圖2示出了說(shuō)明根據(jù)本發(fā)明的實(shí)施例的分類方法的示例性流程圖;以及
[0013]圖3示出了說(shuō)明根據(jù)本發(fā)明的實(shí)施例的系統(tǒng)的示例性框圖。
【具體實(shí)施方式】
[0014]在以下描述中,將描述本發(fā)明的實(shí)施例的各個(gè)方面。為了解釋的目的,闡述了具體配置和細(xì)節(jié),以便提供徹底的理解。然而,對(duì)于本領(lǐng)域技術(shù)人員而言還將顯而易見(jiàn)的是,可以在沒(méi)有在此呈現(xiàn)的具體細(xì)節(jié)的情況下實(shí)現(xiàn)本發(fā)明。
[0015]圖1示出了在家庭環(huán)境101中的不同房間103、105、107、109中存在一個(gè)以上電視機(jī)111、113、115、117的情況。在家庭環(huán)境101下,如果用戶119向移動(dòng)電話121僅指示“打開電視”,則移動(dòng)電話上基于語(yǔ)音命令系統(tǒng)的個(gè)人助理應(yīng)用不可能確定需要控制哪個(gè)電視機(jī)。
[0016]為了解決該問(wèn)題,本發(fā)明在用戶指示“打開電視”的語(yǔ)音命令時(shí)考慮周邊聲學(xué)(surrounding acoustic),并且將語(yǔ)音命令與諸如語(yǔ)音特征和命令時(shí)間之類的其周邊之間的現(xiàn)有相關(guān)性應(yīng)用到語(yǔ)音命令理解中,以便用機(jī)器學(xué)習(xí)方法識(shí)別指示語(yǔ)音命令的地點(diǎn)并且然后打開同一房間中的電視。
[0017]在本發(fā)明中,個(gè)人助理應(yīng)用包括語(yǔ)音分類系統(tǒng),該語(yǔ)音分類系統(tǒng)結(jié)合了三個(gè)處理階段:1.語(yǔ)音記錄,2.特征提取和3.分類。已經(jīng)使用了包括諸如過(guò)零率(zero-crossingrate)、信號(hào)帶寬、頻譜質(zhì)心和信號(hào)能量之類的低級(jí)別參數(shù)的各種信號(hào)特征。從自動(dòng)語(yǔ)音識(shí)別器繼承的另一組所使用的特征是規(guī)定的梅爾倒頻譜系數(shù)(MFCC:mel-frequencycepstral coefficients)。這意味著語(yǔ)音分類模塊將結(jié)合具有節(jié)奏和音高內(nèi)容的表示的標(biāo)準(zhǔn)特征。
[0018]1.語(yǔ)音記錄
[0019]每次用戶指示“打開電視”的語(yǔ)音命令時(shí),個(gè)人助理應(yīng)用記錄該語(yǔ)音命令,并且然后向特征分析模塊提供所記錄的音頻以便進(jìn)一步處理。
[0020]2.特征分析
[0021]為了得到高精度的位置分類,根據(jù)本發(fā)明的系統(tǒng)以8KHz采樣率來(lái)采樣所記錄的音頻,并且然后例如按一秒鐘窗將它劃分成段。然后,在該系統(tǒng)的算法中將該一秒鐘音頻段看作基本分類單元,并且將該一秒鐘音頻段進(jìn)一步分割成四十個(gè)25ms不重疊的幀?;谝幻腌娨纛l段中的這四十個(gè)幀來(lái)提取每個(gè)特征。然后,系統(tǒng)選擇能夠識(shí)別由不同房間中的不同環(huán)境對(duì)所記錄的音頻所產(chǎn)生的效果的好特征。
[0022]將要提取和分析的若干基本特征包括:音頻平均值,其衡量音頻段矢量的平均值;音頻傳播,其衡量所記錄的音頻段頻譜的傳播;過(guò)零率比例,其對(duì)音頻段波形的符號(hào)改變的次數(shù)進(jìn)行計(jì)數(shù);短時(shí)能量比例,其通過(guò)使用均方根的計(jì)算來(lái)描述音頻段的短時(shí)能量。此外,提出為所記錄的語(yǔ)音命令也選擇兩個(gè)更高級(jí)的特征:MFCC和混響效果系數(shù)。
[0023]MFCC(梅爾倒頻譜系數(shù))用極少的系數(shù)來(lái)表示頻譜的形狀。倒頻譜被定義為頻譜的對(duì)數(shù)的傅立葉變換。梅爾倒頻譜是在梅爾頻帶上計(jì)算的頻譜,而不是傅立葉頻譜??梢愿鶕?jù)以下步驟來(lái)計(jì)算MFCC:
[0024]1.對(duì)音頻信號(hào)進(jìn)行傅里葉變換;
[0025]2.將上面所獲得的頻譜的功率映射到梅爾刻度(scale)上;
[0026]3.在每個(gè)梅爾頻率處求功率的對(duì)數(shù);
[0027]4.對(duì)一列梅爾對(duì)數(shù)功率進(jìn)行離散余弦變換;
[0028]5.將所得到的頻譜的幅度作為MFCC。
[0029]同時(shí),不同房間對(duì)所記錄的語(yǔ)音命令產(chǎn)生不同的混響效果。取決于在具有不同大小和環(huán)境設(shè)置的不同房間中每個(gè)新音節(jié)有多遠(yuǎn)才被浸沒(méi)(submerge)到混響噪聲中,所記錄的音頻具有變化的聽覺(jué)感知。提出根據(jù)以下步驟從音頻記錄中提取混響特征:
[0030]1.執(zhí)行短時(shí)傅立葉變換以將音頻信號(hào)變換成2D時(shí)頻表示,在該2D時(shí)頻表示中混響特征在時(shí)間維度上顯現(xiàn)為頻譜特征的模糊;
[0031]2.通過(guò)將表示2D時(shí)頻性質(zhì)的圖像變換到可以執(zhí)行有效邊緣檢測(cè)和表征的小波域來(lái)定量地估計(jì)混響的量;
[0032]3.以這種方式提取所得到的混響時(shí)間的定量估計(jì)與物理測(cè)量強(qiáng)相關(guān),并且被看作混響效果系數(shù)。
[0033]此外,還可以考慮與所記錄的語(yǔ)音命令相關(guān)聯(lián)的其它非語(yǔ)音特征。當(dāng)存在用戶趨向于在不同日子的同一時(shí)間在特定房間中觀看電視的模式時(shí),所述其它非語(yǔ)音特征例如包括記錄語(yǔ)音命令時(shí)的時(shí)間。
[0034]3.分類
[0035]得到在上述步驟中提取的特征之后,提出使用多類
當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
黑水县| 灵台县| 长宁区| 哈尔滨市| 治多县| 科技| 昌宁县| 叶城县| 黔西县| 铁岭市| 荔波县| 玛纳斯县| 驻马店市| 石景山区| 和顺县| 罗山县| 嘉禾县| 卫辉市| 滁州市| 彭水| 江陵县| 滕州市| 宜州市| 辽宁省| 杂多县| 横山县| 莱阳市| 郁南县| 格尔木市| 汝阳县| 尉氏县| 土默特左旗| 独山县| 天全县| 江西省| 元氏县| 德州市| 平泉县| 招远市| 铜山县| 永丰县|