本發(fā)明涉及智能機(jī)器人領(lǐng)域,具體地說(shuō),涉及一種面向智能機(jī)器人的基于人臉識(shí)別樣本庫(kù)的交互方法和裝置。
背景技術(shù):
現(xiàn)有技術(shù)中,人臉識(shí)別樣本庫(kù)的構(gòu)建一般是通過人工輸入。比較典型的是,在安防領(lǐng)域中,通過人工錄入特定身份的人臉圖像,并將其與身份標(biāo)記進(jìn)行綁定。為了提高識(shí)別度,通常會(huì)針對(duì)一個(gè)身份標(biāo)記綁定數(shù)張不同角度和方位的人臉圖像。因此,單次的有監(jiān)督錄入是目前大部分人臉識(shí)別服務(wù)的運(yùn)行邏輯。這些技術(shù)包括linkface、Face++和云從。然而,這些技術(shù)僅適合安防領(lǐng)域。針對(duì)智能機(jī)器人在家庭中與人的交互場(chǎng)景,由于智能機(jī)器人獲取到的用戶圖像是多種多樣的,人工輸入的用戶圖像不能滿足智能機(jī)器人的圖像識(shí)別需求,因此這種技術(shù)卻并不適合應(yīng)用在用于在家庭中與用戶進(jìn)行交互的智能機(jī)器人上。
因此,需要提供一種能夠適用家庭中交互用的智能機(jī)器人的人臉樣本采集方案。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供一種面向智能機(jī)器人的基于人臉識(shí)別樣本庫(kù)的交互方法來(lái)解決上述技術(shù)問題。該方法包括以下步驟:
檢測(cè)獲取當(dāng)前圖像;
如果所述當(dāng)前圖像中存在人臉圖片,則提取其中的身份特征向量并將其與人臉識(shí)別樣本數(shù)據(jù)庫(kù)中所存儲(chǔ)的已綁定身份標(biāo)記的身份特征向量進(jìn)行比較;
基于比較的結(jié)果將提取的所述身份特征向量存儲(chǔ)到與身份標(biāo)記綁定的聚類中,以填充人臉識(shí)別樣本數(shù)據(jù)庫(kù);
當(dāng)接收到該身份標(biāo)記對(duì)應(yīng)的用戶輸入的多模態(tài)交互數(shù)據(jù)時(shí),結(jié)合所述身份標(biāo)記生成多模態(tài)交互輸出數(shù)據(jù)并輸出。
根據(jù)本發(fā)明的面向智能機(jī)器人的基于人臉識(shí)別樣本庫(kù)的交互方法,優(yōu)選的是,所述方法還包括以下步驟:
當(dāng)提取的身份特征向量與數(shù)據(jù)庫(kù)中存儲(chǔ)的已綁定身份標(biāo)記的身份特征向量比較的結(jié)果超過閾值范圍,則輸出當(dāng)前身份特征向量不匹配的結(jié)果,并以多模態(tài)形式獲取該身份特征對(duì)應(yīng)的身份標(biāo)記信息;
將該身份標(biāo)記信息與所述提取的身份特征進(jìn)行綁定;
將綁定了身份標(biāo)記信息的身份特征作為新的聚類填充到樣本數(shù)據(jù)庫(kù)中。
根據(jù)本發(fā)明的面向智能機(jī)器人的基于人臉識(shí)別樣本庫(kù)的交互方法,優(yōu)選的是,所述方法還包括以下步驟:
當(dāng)提取的身份特征向量與數(shù)據(jù)庫(kù)中存儲(chǔ)的已綁定姓名的身份特征向量比較的結(jié)果未超過閾值范圍,則輸出當(dāng)前身份特征向量匹配的結(jié)果,并按照規(guī)則將當(dāng)前人臉特征與最相似的人臉特征進(jìn)行融合。
根據(jù)本發(fā)明的面向智能機(jī)器人的基于人臉識(shí)別樣本庫(kù)的交互方法,優(yōu)選的是,所述方法還包括:
提取新輸入人臉圖片的身份特征向量之后,計(jì)算所述身份特征向量與所有原聚類的重心之間的余弦相似度;
尋找余弦相似度的最大值以及對(duì)應(yīng)的聚類編號(hào);
在所述余弦相似度的最大值大于設(shè)定閾值時(shí),則將該提取的身份特征向量作為新的向量添加到其所屬的聚類中,重新計(jì)算聚類重心。
根據(jù)本發(fā)明的面向智能機(jī)器人的基于人臉識(shí)別樣本庫(kù)的交互方法,優(yōu)選的是,在所述余弦相似度的最大值小于設(shè)定閾值時(shí),針對(duì)該身份特征向量新建一個(gè)聚類,并分配相應(yīng)編號(hào)。
面向智能機(jī)器人的基于人臉識(shí)別樣本庫(kù)的交互根據(jù)本發(fā)明的另一個(gè)方面,還提供了一種面向智能機(jī)器人的基于人臉識(shí)別樣本庫(kù)的交互裝置。該裝置包括以下單元:
檢測(cè)單元,其用以檢測(cè)獲取當(dāng)前圖像;
比較單元,其用以判斷如果所述當(dāng)前圖像中存在人臉圖片,則提取其中的身份特征向量并將其與人臉識(shí)別樣本數(shù)據(jù)庫(kù)中所存儲(chǔ)的已綁定身份標(biāo)記的身份特征向量進(jìn)行比較;
填充單元,其用以基于比較的結(jié)果將提取的所述身份特征向量存儲(chǔ)到與身份標(biāo)記綁定的聚類中,以填充人臉識(shí)別樣本數(shù)據(jù)庫(kù);
多模態(tài)交互單元,其用以當(dāng)接收到該身份標(biāo)記對(duì)應(yīng)的用戶輸入的多模態(tài)交互數(shù)據(jù)時(shí),結(jié)合所述身份標(biāo)記生成多模態(tài)交互輸出數(shù)據(jù)并輸出。
根據(jù)本發(fā)明的面向智能機(jī)器人的基于人臉識(shí)別樣本庫(kù)的交互裝置,優(yōu)選的是,所述裝置還包括以下單元:
不匹配輸出單元,其用以當(dāng)提取的身份特征向量與數(shù)據(jù)庫(kù)中存儲(chǔ)的已綁定身份標(biāo)記的身份特征向量比較的結(jié)果超過閾值范圍,則輸出當(dāng)前身份特征向量不匹配的結(jié)果,并以多模態(tài)形式獲取該身份特征對(duì)應(yīng)的身份標(biāo)記信息;
綁定單元,其用以將該身份標(biāo)記信息與所述提取的身份特征進(jìn)行綁定;
新聚類填充單元,其用以將綁定了身份標(biāo)記信息的身份特征作為新的聚類填充到樣本數(shù)據(jù)庫(kù)中。
根據(jù)本發(fā)明的面向智能機(jī)器人的基于人臉識(shí)別樣本庫(kù)的交互裝置,優(yōu)選的是,所述裝置還包括以下單元:
匹配輸出融合單元,其用以當(dāng)提取的身份特征向量與數(shù)據(jù)庫(kù)中存儲(chǔ)的已綁定姓名的身份特征向量比較的結(jié)果未超過閾值范圍,則輸出當(dāng)前身份特征向量匹配的結(jié)果,并按照規(guī)則將當(dāng)前人臉特征與最相似的人臉特征進(jìn)行融合。
根據(jù)本發(fā)明的面向智能機(jī)器人的基于人臉識(shí)別樣本庫(kù)的交互裝置,優(yōu)選的是,所述裝置還包括:
用以提取新輸入人臉圖片的身份特征向量之后,計(jì)算所述身份特征向量與所有原聚類的重心之間的余弦相似度的單元;
用以尋找余弦相似度的最大值以及對(duì)應(yīng)的聚類編號(hào)的單元;
用以在所述余弦相似度的最大值大于設(shè)定閾值時(shí),則將該提取的身份特征向量作為新的向量添加到其所屬的聚類中,重新計(jì)算聚類重心的單元。
根據(jù)本發(fā)明的面向智能機(jī)器人的基于人臉識(shí)別樣本庫(kù)的交互裝置,優(yōu)選的是,所述交互裝置還包括:
用以在所述余弦相似度的最大值小于設(shè)定閾值時(shí),針對(duì)該身份特征向量新建一個(gè)聚類,并分配相應(yīng)編號(hào)的單元。
面向智能機(jī)器人的基于人臉識(shí)別樣本庫(kù)的交互的有利之處在于,通過智能機(jī)器人在無(wú)監(jiān)督的情況下自動(dòng)收集身份特征信息來(lái)建立人臉識(shí)別的樣本庫(kù),對(duì)于家庭交互這一交互場(chǎng)景下,智能機(jī)器人采集到的用戶圖像存在各種各樣的角度這一情況,智能機(jī)器人可以自動(dòng)收錄人員信息,增加人臉樣本庫(kù)的樣本數(shù)量,提高人物識(shí)別度,從而在多模態(tài)交互過程中滿足用戶要求。
本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說(shuō)明書中闡述,并且,部分地從說(shuō)明書中變得顯而易見,或者通過實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過在說(shuō)明書、權(quán)利要求書以及附圖中所特別指出的結(jié)構(gòu)來(lái)實(shí)現(xiàn)和獲得。
附圖說(shuō)明
附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,并且構(gòu)成說(shuō)明書的一部分,與本發(fā)明的實(shí)施例共同用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的限制。在附圖中:
圖1顯示了根據(jù)本發(fā)明的實(shí)施例的智能機(jī)器人利用無(wú)監(jiān)督自動(dòng)構(gòu)建的人臉樣本庫(kù)進(jìn)行交互的方法的流程圖;
圖2顯示了根據(jù)本發(fā)明的實(shí)施例如何無(wú)監(jiān)督自動(dòng)構(gòu)建人臉樣本庫(kù)的一個(gè)詳細(xì)流程圖;
圖3顯示了根據(jù)本發(fā)明的實(shí)施例的利用無(wú)監(jiān)督自動(dòng)構(gòu)建的人臉樣本庫(kù)進(jìn)行交互的裝置的結(jié)構(gòu)框圖,以及
圖4顯示了根據(jù)本發(fā)明的實(shí)施例進(jìn)行人臉樣本庫(kù)構(gòu)建后的特殊樣本示意圖。
具體實(shí)施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,以下結(jié)合附圖對(duì)本發(fā)明實(shí)施例作進(jìn)一步地詳細(xì)說(shuō)明。
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,以下結(jié)合附圖對(duì)本發(fā)明實(shí)施例作進(jìn)一步地詳細(xì)說(shuō)明。以下例子中,將以人臉為目標(biāo)物體來(lái)進(jìn)行本發(fā)明原理的說(shuō)明。本領(lǐng)域的技術(shù)人員應(yīng)該知曉,該實(shí)施例僅為說(shuō)明目的,不用作對(duì)本發(fā)明的限制。
現(xiàn)有技術(shù)中,家用智能機(jī)器人身份識(shí)別場(chǎng)景與安防用的身份識(shí)別的場(chǎng)景不同。家用智能機(jī)器人進(jìn)行身份識(shí)別時(shí)的環(huán)境信息存在眾多干擾因素、圖片質(zhì)量極差。此外,家用智能機(jī)器人接觸的人數(shù)有限,一般為3到5個(gè),最多也不會(huì)超過50個(gè),且身份對(duì)應(yīng)的樣本數(shù)量呈指數(shù)分布而非均勻分布。更重要的是,安防領(lǐng)域用的身份識(shí)別需要在關(guān)鍵特征上精確識(shí)別,人物在環(huán)境中一般是靜態(tài)的,所獲取的圖片質(zhì)量均勻,精確識(shí)別算法可以統(tǒng)一。而家用智能機(jī)器人考慮到識(shí)別環(huán)境中的人物圖片是動(dòng)態(tài)的,例如瞬間面部表情、陰影以及誤檢的情況,識(shí)別算法需要考慮眾多的容錯(cuò)因素。
為此,本發(fā)明提出一種針對(duì)家用機(jī)器人的新的構(gòu)建人臉樣本庫(kù)的方法,以及智能機(jī)器人利用所構(gòu)建的樣本庫(kù)進(jìn)行智能交互的方法,以能夠使得在不影響用戶體驗(yàn)的前提下反復(fù)錄入圖片,從而增加機(jī)器人對(duì)人物的識(shí)別率。
如圖1所示,其中顯示了根據(jù)本發(fā)明的實(shí)施例的智能機(jī)器人利用無(wú)監(jiān)督自動(dòng)構(gòu)建的人臉樣本庫(kù)進(jìn)行交互的方法的流程圖。在圖1中,方法開始于步驟S101。在該步驟中,智能機(jī)器人首先會(huì)檢測(cè)獲取當(dāng)前圖像。當(dāng)家用智能機(jī)器人在室內(nèi)環(huán)境中時(shí),開啟后,會(huì)自動(dòng)檢測(cè)當(dāng)前場(chǎng)景下的各角度圖片。或者該機(jī)器人到了新的場(chǎng)景時(shí),也會(huì)自動(dòng)檢測(cè)當(dāng)前場(chǎng)景下的各角度圖片,以了解所處環(huán)境信息。在本發(fā)明中,首要做的是進(jìn)行人物識(shí)別。人物的身份特征主要體現(xiàn)在人臉上,因此根據(jù)本發(fā)明優(yōu)選進(jìn)行人臉識(shí)別。
智能機(jī)器人不斷地進(jìn)行圖片中的人臉特征檢測(cè)。之后,對(duì)檢測(cè)到人臉的圖片進(jìn)行人臉身份特征提取。也就是說(shuō),在步驟S102中,判斷如果對(duì)當(dāng)前圖像的檢測(cè)結(jié)果是存在人臉圖片,則提取其中的身份特征向量并將其與人臉識(shí)別樣本數(shù)據(jù)庫(kù)中所存儲(chǔ)的已綁定身份標(biāo)記的身份特征向量進(jìn)行比較。
隨后,在步驟S103中,系統(tǒng)基于比較的結(jié)果將提取的身份特征向量存儲(chǔ)到與身份標(biāo)記綁定的聚類中,以填充人臉識(shí)別樣本數(shù)據(jù)庫(kù)。
最后,在步驟S104中,當(dāng)接收到該身份標(biāo)記對(duì)應(yīng)的用戶輸入的多模態(tài)交互數(shù)據(jù)時(shí),結(jié)合身份標(biāo)記/身份標(biāo)簽生成多模態(tài)交互輸出數(shù)據(jù)并輸出。
在步驟S102中,如果未找到足夠相似的人臉特征,則機(jī)器人認(rèn)為見到的是陌生人,通過交互模塊發(fā)出詢問,以獲取對(duì)方姓名這樣的身份標(biāo)記。在本發(fā)明中,身份標(biāo)記是記錄人臉身份的字符串,它們可以是身份編號(hào)或者姓名。
如果對(duì)方回復(fù)姓名則將姓名作為身份標(biāo)記與身份特征綁定。如果找到了足夠相似的人臉特征,則按照一定規(guī)則將當(dāng)前人臉特征與最相似的人臉特征融合,并獲取該人臉對(duì)應(yīng)的身份信息。
在人臉識(shí)別技術(shù)領(lǐng)域中,使用最多的技術(shù)是卷積神經(jīng)網(wǎng)絡(luò)。作為人臉編碼器的一種,卷積神經(jīng)網(wǎng)絡(luò)的輸入為人臉圖片,輸出為用D維特征向量代表的識(shí)別結(jié)果。D維向量是由D個(gè)小數(shù)組成的數(shù)組,D是一個(gè)整數(shù),如128。在本例中,每個(gè)這樣的數(shù)組代表一個(gè)人臉身份特征。將人臉身份信息編碼到D維向量中,就構(gòu)成了人臉身份特征向量。
這樣便可以通過余弦相似度來(lái)比較兩個(gè)向量相似程度,從而方便地比較出兩個(gè)人臉身份特征向量是否指示同一個(gè)身份識(shí)別結(jié)果。本發(fā)明提出人臉聚類概念。在本發(fā)明中,一個(gè)聚類是許多人臉身份特征的集合。聚類可與一個(gè)身份標(biāo)記(如姓名)綁定,也可以不綁定。在生成每個(gè)聚類時(shí),向其分配一個(gè)編號(hào),互不重復(fù),作為聚類的唯一標(biāo)識(shí)。聚類中的一個(gè)人臉身份特征在此可稱為樣本。將身份與聚類進(jìn)行綁定事實(shí)上就是對(duì)指定編號(hào)的聚類的身份標(biāo)記進(jìn)行更新的過程。
聚類有其重心,也用一個(gè)D維數(shù)組表示。根據(jù)本發(fā)明,聚類重心為聚類中所有人臉身份特征的歐幾里得均值。
如圖2所示,其中顯示了另一個(gè)根據(jù)本發(fā)明的面向智能機(jī)器人的基于人臉識(shí)別樣本庫(kù)的交互方法的優(yōu)選實(shí)施例。在圖2中,首先將身份特征向量與已綁定身份標(biāo)記的身份特征向量進(jìn)行比較,步驟S201。
接下來(lái),在步驟S202中,構(gòu)建人臉識(shí)別樣本庫(kù)時(shí),當(dāng)提取的身份特征向量與數(shù)據(jù)庫(kù)中存儲(chǔ)的已綁定身份標(biāo)記的身份特征向量比較的結(jié)果均超過閾值范圍,則輸出當(dāng)前身份特征向量不匹配的結(jié)果,并以多模態(tài)形式獲取該身份特征對(duì)應(yīng)的身份標(biāo)記信息,步驟S203。
接下來(lái),在步驟S204中,將該身份標(biāo)記信息與所提取的身份特征進(jìn)行綁定。
最后,在步驟S205中,將綁定了身份標(biāo)記信息的身份特征作為新的聚類填充到樣本數(shù)據(jù)庫(kù)中。這樣,樣本數(shù)據(jù)庫(kù)便有了新的聚類。新的聚類事實(shí)上代表的就是要進(jìn)行交互的新的對(duì)象。
在其他實(shí)施例中,根據(jù)本發(fā)明的面向智能機(jī)器人的基于人臉識(shí)別樣本庫(kù)的交互方法,優(yōu)選的是,所述方法還包括以下步驟:
當(dāng)提取的身份特征向量與數(shù)據(jù)庫(kù)中存儲(chǔ)的已綁定姓名的身份特征向量比較的結(jié)果未超過閾值范圍,則輸出當(dāng)前身份特征向量匹配的結(jié)果,并按照規(guī)則將當(dāng)前人臉特征與最相似的人臉特征進(jìn)行融合。
根據(jù)本發(fā)明的面向智能機(jī)器人的基于人臉識(shí)別樣本庫(kù)的交互方法,優(yōu)選的是,所述方法還包括:
在提取新輸入人臉圖片的身份特征向量之后,計(jì)算身份特征向量與所有原聚類的重心之間的余弦相似度。
接下來(lái),采用例如最近鄰分類算法,Nearest Neighbour Classification:https://en.wikipedia.org/wiki/Nearest_neighbour_algorithm來(lái)尋找余弦相似度的最大值以及對(duì)應(yīng)的聚類編號(hào)。
當(dāng)余弦相似度的最大值大于設(shè)定閾值時(shí),則將該提取的身份特征向量作為新的向量添加到其所屬的聚類中,重新計(jì)算聚類重心。理想狀態(tài)下,相同身份的不同人臉,其人臉身份特征向量的余弦相似度大于一閾值H,本實(shí)施例中H=0.8。在所述余弦相似度的最大值小于設(shè)定閾值時(shí),針對(duì)該身份特征向量新建一個(gè)聚類,并分配相應(yīng)編號(hào)。這樣便使得智能機(jī)器人能夠記住所有見過的人臉,并自動(dòng)歸類。
在其他實(shí)施例中,根據(jù)本發(fā)明的面向智能機(jī)器人的基于人臉識(shí)別樣本庫(kù)的交互方法,優(yōu)選的是,在每個(gè)聚類內(nèi)的身份特征向量的樣本記錄大于某一設(shè)定值例如50時(shí),在此聚類內(nèi)隨機(jī)抽取部分樣本記錄進(jìn)行刪除。此操作能夠在節(jié)約存儲(chǔ)資源的前提下保留類內(nèi)樣本的分布信息。
在聚類的總數(shù)量大于某一設(shè)定值如200時(shí),按比例刪除其中包含身份特征向量的樣本記錄少的那些聚類。此操作能排除人臉錄入時(shí)的干擾因素,比如遮擋、動(dòng)態(tài)模糊、夸張表情、誤檢等因素。
由于本發(fā)明的方法描述的是在計(jì)算機(jī)系統(tǒng)中實(shí)現(xiàn)的。該計(jì)算機(jī)系統(tǒng)例如可以設(shè)置在機(jī)器人的控制核心處理器中。例如,本文所述的方法可以實(shí)現(xiàn)為能以控制邏輯來(lái)執(zhí)行的軟件,其由機(jī)器人控制系統(tǒng)中的CPU來(lái)執(zhí)行。本文所述的功能可以實(shí)現(xiàn)為存儲(chǔ)在非暫時(shí)性有形計(jì)算機(jī)可讀介質(zhì)中的程序指令集合。當(dāng)以這種方式實(shí)現(xiàn)時(shí),該計(jì)算機(jī)程序包括一組指令,當(dāng)該組指令由計(jì)算機(jī)運(yùn)行時(shí)其促使計(jì)算機(jī)執(zhí)行能實(shí)施上述功能的方法??删幊踢壿嬁梢詴簳r(shí)或永久地安裝在非暫時(shí)性有形計(jì)算機(jī)可讀介質(zhì)中,例如只讀存儲(chǔ)器芯片、計(jì)算機(jī)存儲(chǔ)器、磁盤或其他存儲(chǔ)介質(zhì)。除了以軟件來(lái)實(shí)現(xiàn)之外,本文所述的邏輯可利用分立部件、集成電路、與可編程邏輯設(shè)備(諸如,現(xiàn)場(chǎng)可編程門陣列(FPGA)或微處理器)結(jié)合使用的可編程邏輯,或者包括它們?nèi)我饨M合的任何其他設(shè)備來(lái)體現(xiàn)。所有此類實(shí)施例旨在落入本發(fā)明的范圍之內(nèi)。
因此,根據(jù)本發(fā)明的另一個(gè)方面,還提供了一種面向智能機(jī)器人的基于人臉識(shí)別樣本庫(kù)的交互裝置300。該裝置300包括以下單元:
檢測(cè)單元301,其用以檢測(cè)獲取當(dāng)前圖像;
比較單元302,其用以判斷如果所述當(dāng)前圖像中存在人臉圖片,則提取其中的身份特征向量并將其與人臉識(shí)別樣本數(shù)據(jù)庫(kù)中所存儲(chǔ)的已綁定身份標(biāo)記的身份特征向量進(jìn)行比較;
填充單元303,其用以基于比較的結(jié)果將提取的所述身份特征向量存儲(chǔ)到與身份標(biāo)記綁定的聚類中,以填充人臉識(shí)別樣本數(shù)據(jù)庫(kù);
多模態(tài)交互單元304,其用以當(dāng)接收到該身份標(biāo)記對(duì)應(yīng)的用戶輸入的多模態(tài)交互數(shù)據(jù)時(shí),結(jié)合所述身份標(biāo)記生成多模態(tài)交互輸出數(shù)據(jù)并輸出。
根據(jù)本發(fā)明的面向智能機(jī)器人的基于人臉識(shí)別樣本庫(kù)的交互裝置300,優(yōu)選的是,其還包括以下單元:
不匹配輸出單元,其用以當(dāng)提取的身份特征向量與數(shù)據(jù)庫(kù)中存儲(chǔ)的已綁定身份標(biāo)記的身份特征向量比較的結(jié)果超過閾值范圍,則輸出當(dāng)前身份特征向量不匹配的結(jié)果,并以多模態(tài)形式獲取該身份特征對(duì)應(yīng)的身份標(biāo)記信息;
綁定單元,其用以將該身份標(biāo)記信息與所述提取的身份特征進(jìn)行綁定;
新聚類填充單元,其用以將綁定了身份標(biāo)記信息的身份特征作為新的聚類填充到樣本數(shù)據(jù)庫(kù)中。
在另一個(gè)實(shí)施例中,根據(jù)本發(fā)明的面向智能機(jī)器人的基于人臉識(shí)別樣本庫(kù)的交互裝置300,優(yōu)選的是,其還包括以下單元:
匹配輸出融合單元,其用以當(dāng)提取的身份特征向量與數(shù)據(jù)庫(kù)中存儲(chǔ)的已綁定姓名的身份特征向量比較的結(jié)果未超過閾值范圍,則輸出當(dāng)前身份特征向量匹配的結(jié)果,并按照規(guī)則將當(dāng)前人臉特征與最相似的人臉特征進(jìn)行融合。
根據(jù)本發(fā)明的面向智能機(jī)器人的基于人臉識(shí)別樣本庫(kù)的交互裝置,優(yōu)選的是,其還包括:
用以提取新輸入人臉圖片的身份特征向量之后,計(jì)算所述身份特征向量與所有原聚類的重心之間的余弦相似度的單元;
用以尋找余弦相似度的最大值以及對(duì)應(yīng)的聚類編號(hào)的單元;
用以在所述余弦相似度的最大值大于設(shè)定閾值時(shí),則將該提取的身份特征向量作為新的向量添加到其所屬的聚類中,重新計(jì)算聚類重心的單元。
根據(jù)本發(fā)明的面向智能機(jī)器人的基于人臉識(shí)別樣本庫(kù)的交互裝置,優(yōu)選的是,其還包括:
用以在所述余弦相似度的最大值小于設(shè)定閾值時(shí),針對(duì)該身份特征向量新建一個(gè)聚類,并分配相應(yīng)編號(hào)的單元。
在其他實(shí)施例中,根據(jù)本發(fā)明的面向智能機(jī)器人的基于人臉識(shí)別樣本庫(kù)的交互裝置300,優(yōu)選的是,其還包括:
用以在每個(gè)聚類內(nèi)的身份特征向量的樣本記錄大于某一設(shè)定值時(shí),在此聚類內(nèi)隨機(jī)抽取部分樣本記錄進(jìn)行刪除的單元;以及
用以在聚類的總數(shù)量大于某一設(shè)定值時(shí),按比例刪除其中包含身份特征向量的樣本記錄少的那些聚類的單元。
本發(fā)明通過智能機(jī)器人在無(wú)監(jiān)督的情況下自動(dòng)收集身份特征信息來(lái)建立人臉識(shí)別的樣本庫(kù),對(duì)于交互環(huán)境特別復(fù)雜的情況,可以自動(dòng)收錄人員信息,提高人物識(shí)別度,從而在多模態(tài)交互過程中滿足用戶要求。
如圖4所示,其中顯示了根據(jù)本發(fā)明原理構(gòu)建人臉身份特征樣本庫(kù)的特殊樣本類型。其中包括了7類特殊樣本,分別為誤檢類、遮擋類、瞬間動(dòng)態(tài)眨眼類、動(dòng)態(tài)模糊類、不規(guī)則陰影類、人臉角度類等。它們?cè)跇颖編?kù)中所占的比例都很少,一般在5%左右,因此對(duì)用戶的交互不會(huì)產(chǎn)生大的影響。
應(yīng)該理解的是,本發(fā)明所公開的實(shí)施例不限于這里所公開的特定結(jié)構(gòu)、處理步驟或材料,而應(yīng)當(dāng)延伸到相關(guān)領(lǐng)域的普通技術(shù)人員所理解的這些特征的等同替代。還應(yīng)當(dāng)理解的是,在此使用的術(shù)語(yǔ)僅用于描述特定實(shí)施例的目的,而并不意味著限制。
說(shuō)明書中提到的“一個(gè)實(shí)施例”或“實(shí)施例”意指結(jié)合實(shí)施例描述的特定特征、結(jié)構(gòu)或特性包括在本發(fā)明的至少一個(gè)實(shí)施例中。因此,說(shuō)明書通篇各個(gè)地方出現(xiàn)的短語(yǔ)“一個(gè)實(shí)施例”或“實(shí)施例”并不一定均指同一個(gè)實(shí)施例。
雖然本發(fā)明所公開的實(shí)施方式如上,但所述的內(nèi)容只是為了便于理解本發(fā)明而采用的實(shí)施方式,并非用以限定本發(fā)明。任何本發(fā)明所屬技術(shù)領(lǐng)域內(nèi)的技術(shù)人員,在不脫離本發(fā)明所公開的精神和范圍的前提下,可以在實(shí)施的形式上及細(xì)節(jié)上作任何的修改與變化,但本發(fā)明的專利保護(hù)范圍,仍須以所附的權(quán)利要求書所界定的范圍為準(zhǔn)。