一種智能家居設(shè)備語音控制裝置的喚醒方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及智能家居技術(shù)領(lǐng)域,尤其涉及一種智能家居設(shè)備語音控制裝置的喚醒方法及系統(tǒng)。
【背景技術(shù)】
[0002]—套智能家居系統(tǒng)控制系統(tǒng)一般是由多個(gè)智能設(shè)備組成的,這些智能設(shè)備有些是有操作系統(tǒng)的,有些是沒有操作系統(tǒng)的。目前智能家居交互方式是在有操作系統(tǒng)的設(shè)備上進(jìn)行點(diǎn)擊操作來控制其他設(shè)備。
[0003]語音控制是目前比較流行的人機(jī)交互方式,也是未來的趨勢。但是,語音控制不是一直處于監(jiān)聽用戶說話的狀態(tài),需要用戶操作將其喚醒,才能進(jìn)行語音識(shí)別等操作。
[0004]現(xiàn)有技術(shù)中的喚醒方式是通過用戶的點(diǎn)擊操作。比如長按HOME鍵來喚醒語音功能,或是在智能電視上需要點(diǎn)擊遙控器相應(yīng)地按鈕來喚醒語音功能。這種喚醒方式的優(yōu)點(diǎn)是操控方式直截了當(dāng)。缺點(diǎn)是用戶不能夠脫離雙手來操作設(shè)備。該方式應(yīng)用在手機(jī)上尚且可以被用戶所接受,因?yàn)槭謾C(jī)已經(jīng)成為隨身物品。但是,在家里,手機(jī)已經(jīng)脫離了隨身物品的屬性,其他智能設(shè)備也具有同樣地問題。所以,在智能家居系統(tǒng)當(dāng)中,用該方式喚醒語音控制功能給用戶帶來了極大的不便。
[0005]現(xiàn)有技術(shù)中還有利用一種低功耗的芯片長時(shí)間監(jiān)聽用戶的特定指令來喚醒語音功能。這種喚醒方式的優(yōu)點(diǎn)是讓用戶脫離了雙手來操控設(shè)備,但是該低功耗芯片技術(shù)用語音來喚醒語音,容易出現(xiàn)混淆,無法識(shí)別是喚醒語音功能或是執(zhí)行操作指令。
[0006]因此,現(xiàn)有技術(shù)還有待于改進(jìn)和發(fā)展。
【發(fā)明內(nèi)容】
[0007]鑒于現(xiàn)有技術(shù)的不足,本發(fā)明目的在于提供一種智能家居設(shè)備語音控制裝置的喚醒方法及系統(tǒng),旨在解決現(xiàn)有技術(shù)中用語音喚醒語音控制裝置,命令易出現(xiàn)混淆,而采用低功耗芯片監(jiān)聽用戶的喚醒指令的技術(shù)不成熟且成本高的缺陷。
[0008]本發(fā)明的技術(shù)方案如下:
一種智能家居設(shè)備語音控制裝置的喚醒方法,其中,方法包括;
智能家居設(shè)備采集用戶的圖像數(shù)據(jù),檢測圖像數(shù)據(jù)中是否存在人臉;
當(dāng)檢測到圖像中存在人臉時(shí),根據(jù)圖像識(shí)別算法判斷是否存在預(yù)先存儲(chǔ)的特定的人臉;
當(dāng)檢測到存在預(yù)先存儲(chǔ)的特定的人臉時(shí),定位人臉中的眼睛位置,當(dāng)檢測到眼睛的眼球聚焦時(shí)間超過一預(yù)定時(shí)間累積閾值時(shí),則控制喚醒智能家居設(shè)備語音控制裝置。
[0009]所述的智能家居設(shè)備語音控制裝置的喚醒方法,其中,所述智能家居設(shè)備采集用戶的圖像數(shù)據(jù),檢測圖像數(shù)據(jù)中是否存在人臉具體包括:
智能家居設(shè)備通過攝像頭實(shí)時(shí)采集視頻流,將視頻流進(jìn)行采樣得到采樣數(shù)據(jù);
將采樣數(shù)據(jù)量化后得到的量化數(shù)據(jù)進(jìn)行重新編碼得到圖像數(shù)據(jù); 通過人臉檢測算法檢測圖像數(shù)據(jù)中是否存在人臉。
[0010]所述的智能家居設(shè)備語音控制裝置的喚醒方法,其中,所述當(dāng)檢測到圖像中存在人臉時(shí),利用圖像識(shí)別算法判斷是否存在預(yù)先存儲(chǔ)的特定的人臉具體包括:
當(dāng)檢測到圖像中存在人臉時(shí),獲取圖像中所有的人臉,對(duì)所有的人臉圖像做串行處理,根據(jù)圖像識(shí)別算法依次識(shí)別是否存在預(yù)先存儲(chǔ)的特定的人臉。
[0011]所述的智能家居設(shè)備語音控制裝置的喚醒方法,其中,所述當(dāng)檢測到存在預(yù)先存儲(chǔ)的特定的人臉時(shí),定位人臉中的眼睛位置,當(dāng)檢測到眼睛的眼球聚焦時(shí)間超過一預(yù)定時(shí)間閾值時(shí),則喚醒智能家居設(shè)備語音控制裝置具體包括:
當(dāng)檢測到圖像中存在預(yù)先存儲(chǔ)的特定的人臉時(shí),對(duì)接收到的圖像做串行處理依次做人眼定位算法,定位人臉中的眼睛位置;
提取人臉中的眼睛圖像,并判斷眼球是否處于聚焦?fàn)顟B(tài);
若檢測到眼球處于聚焦?fàn)顟B(tài)時(shí)的前后兩次的時(shí)間差小于一預(yù)定時(shí)間偏差閾值,且眼球處于聚焦?fàn)顟B(tài)時(shí)間超過一預(yù)定時(shí)間累積閾值時(shí),則控制喚醒智能家居設(shè)備語音控制裝置。
[0012]所述的智能家居設(shè)備語音控制裝置的喚醒方法,其中,所述提取人臉中的眼睛圖像,并判斷眼球是否處于聚焦?fàn)顟B(tài)具體包括:
提取人臉中的眼睛圖像并做串行處理,依次進(jìn)行聚焦?fàn)顟B(tài)分析;
提取眼睛圖像中的眼球的特征信息,根據(jù)特征信息判斷眼球是否處于聚焦?fàn)顟B(tài)。
[0013]—種智能家居設(shè)備語音控制裝置的喚醒系統(tǒng),其中,系統(tǒng)包括:
圖像采集模塊,用于智能家居設(shè)備采集用戶的圖像數(shù)據(jù),檢測圖像數(shù)據(jù)中是否存在人臉;
檢測與判斷模塊,用于當(dāng)檢測到圖像中存在人臉時(shí),根據(jù)圖像識(shí)別算法判斷是否存在預(yù)先存儲(chǔ)的特定的人臉;
定位與喚醒模塊,用于當(dāng)檢測到存在預(yù)先存儲(chǔ)的特定的人臉時(shí),定位人臉中的眼睛位置,當(dāng)檢測到眼睛的眼球聚焦時(shí)間超過一預(yù)定時(shí)間閾值時(shí),則控制喚醒智能家居設(shè)備語音控制裝置。
[0014]所述的智能家居設(shè)備語音控制裝置的喚醒系統(tǒng),其中,所述圖像采集模塊具體包括:
視頻采集單元,用于智能家居設(shè)備通過攝像頭實(shí)時(shí)采集視頻流,將視頻流進(jìn)行采樣得到采樣數(shù)據(jù);
編碼單元,用于將采樣數(shù)據(jù)量化后得到的量化數(shù)據(jù)進(jìn)行重新編碼得到圖像數(shù)據(jù);
檢測單元,用于通過人臉檢測算法檢測圖像數(shù)據(jù)中是否存在人臉。
[0015]所述的智能家居設(shè)備語音控制裝置的喚醒系統(tǒng),其中,所述檢測與判斷模塊具體包括:
檢測與判定單元,用于當(dāng)檢測到圖像中存在人臉時(shí),獲取圖像中所有的人臉,對(duì)所有的人臉圖像做串行處理,根據(jù)圖像識(shí)別算法依次識(shí)別是否存在預(yù)先存儲(chǔ)的特定的人臉。
[0016]所述的智能家居設(shè)備語音控制裝置的喚醒系統(tǒng),其中,所述定位與喚醒模塊具體包括:
定位單元,用于當(dāng)檢測到圖像中存在預(yù)先存儲(chǔ)的特定的人臉時(shí),對(duì)接收到的圖像做串行處理依次做人眼定位算法,定位人臉中的眼睛位置; 判斷單元,用于提取人臉中的眼睛圖像,并判斷眼球是否處于聚焦?fàn)顟B(tài);
控制單元,用于若檢測到眼球處于聚焦?fàn)顟B(tài)時(shí)的前后兩次的時(shí)間差小于一預(yù)定時(shí)間偏差閾值,且眼球處于聚焦?fàn)顟B(tài)時(shí)間超過一預(yù)定時(shí)間累積閾值時(shí),則控制喚醒智能家居設(shè)備語音控制裝置。
[0017]所述的智能家居設(shè)備語音控制裝置的喚醒系統(tǒng),其中,所述判斷單元具體包括: 圖像提取及分析單元,用于提取人臉中的眼睛圖像并做串行處理,依次進(jìn)行聚焦?fàn)顟B(tài)分析;
聚焦?fàn)顟B(tài)判斷單元,用于提取眼睛圖像中的眼球的特征信息,根據(jù)特征信息判斷眼球是否處于聚焦?fàn)顟B(tài)。
[0018]本發(fā)明提供了一種智能家居設(shè)備語音控制裝置的喚醒方法及系統(tǒng),本發(fā)明可在復(fù)雜背景下的人臉檢測技術(shù),在有多張有臉的情況下,喚醒語音識(shí)別,提高了語音識(shí)別的可靠性,同時(shí)通過判斷時(shí)間偏差閾值提高了系統(tǒng)處理的精確度。
【附圖說明】
[0019]圖1為本發(fā)明中一種智能家居設(shè)備語音控制裝置的喚醒方法的較佳實(shí)施例的流程圖;
圖2為本發(fā)明中一種智能家居設(shè)備語音控制裝置的喚醒方法的具體應(yīng)用實(shí)施例的流程圖;
圖3為本發(fā)明的一種智能家居設(shè)備語音控制裝置的喚醒系統(tǒng)的較佳實(shí)施例的功能原理框圖。
【具體實(shí)施方式】
[0020]為使本發(fā)明的目的、技術(shù)方案及效果更加清楚、明確,以下對(duì)本發(fā)明進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0021]本發(fā)明還提供了一種智能家居設(shè)備語音控制裝置的喚醒系統(tǒng)的較佳實(shí)施例的流程圖,如圖1所示,其中,方法包括:
步驟S100、智能家居設(shè)備采集用戶的圖像數(shù)據(jù),檢測圖像數(shù)據(jù)中是否存在人臉。
[0022]具體地,現(xiàn)有的智能家居設(shè)備包括但不限于智能電視、智能洗衣機(jī)、智能空調(diào)、智能冰箱、智能燈、智能插座。具體地,本發(fā)明實(shí)施例中,將一智能家居設(shè)備作為數(shù)據(jù)運(yùn)算中心,其他設(shè)備作為受控的設(shè)備。數(shù)據(jù)運(yùn)算中心與一攝像頭連接,攝像頭為數(shù)據(jù)的采集端。智能家居設(shè)備通過攝像頭采集用戶的視頻數(shù)據(jù),并將視頻數(shù)據(jù)處理為一幀幀的圖像數(shù)據(jù)。進(jìn)一步地檢測圖像數(shù)據(jù)中是否有人臉信息,其中檢測是否有人臉信息可通過人臉檢測算法,基于視頻圖像的人臉識(shí)別方法一般都是自動(dòng)檢測人臉區(qū)域,從視頻中提取特征,最后如果人臉存在則識(shí)別出人臉的身份。視頻人臉識(shí)別起源于基于靜態(tài)圖像的人臉識(shí)別,即識(shí)別系統(tǒng)自動(dòng)的檢測和分割出人臉,然后用基于靜態(tài)圖像的識(shí)別方法進(jìn)行識(shí)別。通過利用姿態(tài)和從視頻中估計(jì)到的深度信息合成一個(gè)虛擬的正面人臉。另外一個(gè)能提高識(shí)別率的方法是利用視頻中充裕的幀圖像,基于每幀圖像的識(shí)別結(jié)果,使用“投票”機(jī)制。投票方法可以是確定的,但是概率投票方法一般來說更好。具體的投票方法可根據(jù)需要進(jìn)行確定。
[0023]具體實(shí)施時(shí),所述步驟SlOO具體包括: 步驟SlOl、智能家居設(shè)備通過攝像頭實(shí)時(shí)采集視頻流,將視頻流進(jìn)行采樣得到采樣數(shù)據(jù);