專利名稱:一種數(shù)據(jù)手套動態(tài)手語識別方法
技術領域:
本發(fā)明涉及一種人工智能領域的模式識別方法,尤其是一種數(shù)據(jù)手套動態(tài)手語識別方法。
背景技術:
目前的手勢識別分為兩種,一種是基于傳感器數(shù)據(jù)的手勢識別方法,一種是基于圖像識別的手勢識別方法?;谖锢硎痔讉鞲衅鲾?shù)據(jù)的手勢識別是從傳感器直接獲得手指運動特征數(shù)據(jù),通過一定的算法將其翻譯成人可直接識別的文字或聲音;基于圖像識別的手勢識別方法是通過圖像錄入設備把手形輸入到計算機當中,借助圖像處理技術進行手勢識別的方法。國內外科學家對手勢識別進行了大量研究。1994年,Ramon M S和Dannil T研制了一種基于物理約束的手抓取過程的手動作合成的控制與抓取系統(tǒng)。1995年,Lee J intae 和Kimii Tosiyasv L研究用攝像機獲得手的運動圖像數(shù)據(jù)來自動分析三維手勢,實現(xiàn)三維手勢重構。1997年,加拿大多倫多大學的Sidney S F研究的Glove TalkII系統(tǒng)是目前最有影響的手勢接口系統(tǒng),他采用神經網(wǎng)絡將用戶手勢轉換成手勢語言參數(shù),通過語言合成器合成為語言輸出。我國高文等人,也進行了基于手勢和人的行為動作識別的手語合成技術的研究。但對于基于圖像識別的手勢識別方法,依賴于攝像機成像,環(huán)境,光線等因素,由于人手在運動過程當中,必然會使手指遮掩而使攝像機攝不到要分析的手指圖像??紤]到現(xiàn)有的條件因素,本研究基于傳感器數(shù)據(jù)手套的手勢識別。國內機構對基于傳感器數(shù)據(jù)手套的手勢識別技術也已有了起步,2010年華南理工大學的一種基于加速度傳感器的手勢識別方法,這種方法是基于數(shù)據(jù)手套上的加速度傳感器,以獲得手指運動特征值,主要是通過加速度值獲得手指在空間的旋轉特征碼,然后能過一定的算法去除人手抖動產生的噪聲,而獲得的特征值。這種技術因為基于加速度傳感器, 由于加速度傳感器本身精度,使得特征值精度有限,加速度傳感器依靠運動或重力產生加速度分量,使得加速度傳感器受外界影響較大,如手指運動過程當中,快慢產生的加速度值不一樣,不能表達加速度傳感器當前的位置,外界有振動,如有汽車經過,飛機起飛,音響等環(huán)境時,傳感器的數(shù)據(jù)很不穩(wěn)定。
發(fā)明內容
本發(fā)明要解決的技術問題是提供一種高精度的數(shù)據(jù)手套手語識別方法,所述手語識別方法節(jié)省匹配存儲空間和耗時,識別效率高。為了解決上述技術問題,本發(fā)明所采用的技術方案是
一種數(shù)據(jù)手套動態(tài)手語識別方法,包括手語識別之前建立手語數(shù)據(jù)庫和手語識別兩個部分,所述手語識別的步驟如下 Si.輸入代表手指運動的特征值;52.將輸入的特征值與儲存于手語數(shù)據(jù)庫中的特征值進一次以上的匹配;
53.將匹配得到的結果轉化成相應可識別的輸出信號送給輸出終端;
所述手語數(shù)據(jù)庫為將傳感器檢測的角度值轉化為手語特征的特征值的集合,所述輸入的特征值為來自傳感器檢測的角度值。進一步作為優(yōu)選的實施方式,所述數(shù)據(jù)庫特征值由每只手指的彎曲角度范圍和手掌與水平面的夾角范圍構成,每個特征值對應有文字標識,帶文字標識的特征值按預定義的先后順序組成一個代表手勢語的序列。進一步作為優(yōu)選的實施方式,所述序列按識別頻率高低為序構成手語數(shù)據(jù)庫。進一步作為優(yōu)選的實施方式,所述輸入的特征值由每只手指的彎曲角度范圍和手掌與水平面的夾角范圍構成,所述特征值按動作先后順序組成輸入序列。進一步作為優(yōu)選的實施方式,所述步驟S2中匹配的具體流程如下
521.將輸入的第一特征值與數(shù)據(jù)庫中代表手勢語的序列中的第一特征值進行匹配;
522.保存匹配結果,判斷等待下一次特征值輸入的時間是否超時;
523.若輸入超時,則輸出最佳匹配結果并結束匹配;
524.若輸入不超時,接收輸入的特征值,將輸入的特征值與上一次保存的匹配結果中序列內相應特征值進行匹配;
525.若匹配成功,則刪除上一次保存的匹配結果,返回S22;
526.若匹配不成功,則輸出上次保存的匹配結果中的最佳匹配結果,并結束匹配。進一步作為優(yōu)選的實施方式,所述輸出信號為文字、圖片或者語音。本發(fā)明的有益效果是本發(fā)明通過以各手指的彎曲角度范圍和手掌與水平面的夾角范圍構成特征值,將特征值按預定義的語義構成序列組成手語特征數(shù)據(jù)庫,并以被包含的匹配方式對動作的關鍵幀特征值進行匹配,提高了匹配的效率和精度;本發(fā)明通過在匹配流程中僅保留最后匹配的結果,節(jié)省了手語識別匹配過程中的資源消耗。
下面結合附圖對本發(fā)明的具體實施方式
作進一步說明 圖1是本發(fā)明手語識別方法的流程圖2是本發(fā)明手語數(shù)據(jù)庫中代表手勢語的序列的組成圖; 圖3是本發(fā)明手語識別方法輸入特征值與數(shù)據(jù)庫特征值匹配的流程圖。
具體實施例方式本發(fā)明旨在對人手指的變化所表達的內容遵照人設計的意圖,按動作對應的關鍵幀順序,給出最接近的表達結果。下面結合附圖對本發(fā)明進行進一步的說明
本發(fā)明所述輸入特征值為雙手的各個手指的彎曲角度和手掌所在平面與水平面成的夾角。本發(fā)明采用5個彎曲傳感器分布在每個手指的第二個關節(jié)處,并與指平面貼近,平行。加速度傳感器位于手背心部,與手掌平面平行。彎曲傳感器獲得反映手指彎曲程度的角度值,加速度傳感器獲得當前手掌所指示的方向。本發(fā)明根據(jù)這這兩種傳感器所獲得的角度和加速度,通過加速度值在X、Y、Z三個方向的分量比值,Angle(x)=x/
sqrt (χ*x+y*y+z*z), Angle (y)=y/sqrt(χ*x+y*y+z*z),Angle (ζ) =z/sqrt (x*x+y*y+z*z)分別求出加速度傳感器面的方向。把這些角度組織在一起,形成了一個以角度為特征值的數(shù)據(jù)結構,每一個特定的手勢都對應著一組特定的角度。動態(tài)手勢對應著一系列的組角度。所述手語特征數(shù)據(jù)庫的建立方法如下
建立一個以每只手的手指彎曲角度范圍和其手掌與水平面的夾角范圍組成一個特征
值;
每個特征值都有其對應的文字標識;
每個帶有文字標識的特征值按用戶定義的先后順序組成一個序列,稱這個序列為一個
手勢語。每個手勢語都有一個文字標識,以“你們好”為例來說明這個手勢語由三個序列組成。分別為序列1 “你”序列2 “們”序列3 “好”組成。其中“你” “們” “好”依次為序列的文字標識。而“你們好”為手勢語的文字標識。序列“你”是由每個手指的彎曲最大角度和最小角度,手掌的水平角度和法向角度構成其的特征值。參照圖2,手語特征數(shù)據(jù)內序列的結構包括多個特征值特征值1,特征值2,特征值3,特征值η……。以手勢語為基本元素,構建一個按識別頻率高為順序的自定義數(shù)據(jù)庫。至此,手語特征數(shù)據(jù)庫建立完成。建立好手勢語庫之后,參照圖1,手語識別步聚如下
51.輸入代表手指運動的特征值;
52.將輸入的特征值與儲存于手語數(shù)據(jù)庫中的特征值進一次以上的匹配;
53.將匹配得到的結果轉化成相應可識別的輸出信號送給輸出終端。參照圖3,匹配的具體流程如下
521.將輸入的第一特征值與數(shù)據(jù)庫中代表手勢語的序列中的第一特征值進行匹配;
522.保存匹配結果,判斷等待下一次特征值輸入的時間是否超時;
523.若輸入超時,則輸出最佳匹配結果并結束匹配;
524.若輸入不超時,接收輸入的特征值,將輸入的特征值與上一次保存的匹配結果中序列內相應特征值進行匹配;
525.若匹配成功,則刪除上一次保存的匹配結果,返回步驟S22;
526.若匹配不成功,則輸出上次保存的匹配結果中的最佳匹配結果,并結束匹配。當輸入的手勢語包括多幀特征值時,需要按手勢語的動作依次匹配每個特征值。 這里有種情況,即在比較過程當中有多個符合條件的手勢語序列,如你好,你好嗎?你好多書。當進行第一個特征值時,這三個序列都符合,如果在給定的時間內(假如2秒內無數(shù)據(jù)輸入,那么沒有手勢被識別,如果有數(shù)據(jù)輸入,且恰好是“好”特征值,那么這3個也都符合,這時在給定的時間內沒有數(shù)據(jù)輸入,就以“你好”做為輸出結果。如果有數(shù)據(jù)輸入,且符合序列3,就以序列3所在的手勢語作為結果,否則以“你好”作為結果輸出。以上是對本發(fā)明的較佳實施進行了具體說明,但本發(fā)明創(chuàng)造并不限于所述實施例,熟悉本領域的技術人員在不違背本發(fā)明精神的前提下還可做作出種種的等同變形或替換,這些等同的變形或替換均包含在本申請權利要求所限定的范圍內。
權利要求
1.一種數(shù)據(jù)手套動態(tài)手語識別方法,包括手語識別之前建立手語數(shù)據(jù)庫和手語識別兩個部分,所述手語識別的步驟如下51.輸入代表手指運動的特征值;52.將輸入的特征值與儲存于手語數(shù)據(jù)庫中的特征值進一次以上的匹配;53.將匹配得到的結果轉化成相應可識別的輸出信號送給輸出終端;其特征在于所述手語數(shù)據(jù)庫為將傳感器檢測的角度值轉化為手語特征的特征值的集合,所述輸入的特征值為來自傳感器檢測的角度值。
2.根據(jù)權利要求1所述的一種數(shù)據(jù)手套動態(tài)手語識別方法,其特征在于所述數(shù)據(jù)庫特征值由每只手指的彎曲角度范圍和手掌與水平面的夾角范圍構成,每個特征值對應有文字標識,帶文字標識的特征值按預定義的先后順序組成一個代表手勢語的序列。
3.根據(jù)權利要求2所述的一種數(shù)據(jù)手套動態(tài)手語識別方法,其特征在于所述序列按識別頻率高低為序構成手語數(shù)據(jù)庫。
4.根據(jù)權利要求1所述的一種數(shù)據(jù)手套動態(tài)手語識別方法,其特征在于所述輸入的特征值由每只手指的彎曲角度范圍和手掌與水平面的夾角范圍構成,所述特征值按動作先后順序組成輸入序列。
5.根據(jù)權利要求1所述的一種數(shù)據(jù)手套動態(tài)手語識別方法,其特征在于所述步驟S2 中匹配的具體流程如下521.將輸入的第一特征值與數(shù)據(jù)庫中代表手勢語的序列中的第一特征值進行匹配;522.保存匹配結果,判斷等待下一次特征值輸入的時間是否超時;523.若輸入超時,則輸出最佳匹配結果并結束匹配;524.若輸入不超時,接收輸入的特征值,將輸入的特征值與上一次保存的匹配結果中序列內相應特征值進行匹配;525.若匹配成功,則刪除上一次保存的匹配結果,返回S22;526.若匹配不成功,則輸出上次保存的匹配結果中的最佳匹配結果,并結束匹配。
6.根據(jù)權利要求1所述的一種數(shù)據(jù)手套動態(tài)手語識別方法,其特征在于所述輸出信號為文字、圖片或者語音。
全文摘要
本發(fā)明公開了一種數(shù)據(jù)手套動態(tài)手語識別方法,包括手語識別之前建立手語數(shù)據(jù)庫和手語識別兩個部分,所述手語識別的步驟如下輸入代表手指運動的特征值;將輸入的特征值與儲存于手語數(shù)據(jù)庫中的特征值進一次以上的匹配;將匹配得到的結果轉化成相應可識別的輸出信號送給輸出終端。所述手語數(shù)據(jù)庫為將傳感器檢測的角度值轉化為手語特征的特征值的集合,所述輸入的特征值為來自傳感器檢測的角度值。本發(fā)明提高了手語識別匹配的效率和精度;本發(fā)明通過在匹配流程中僅保留最后匹配的結果,節(jié)省了手語識別匹配過程中的資源消耗。可廣泛應用在手語識別領域。
文檔編號G06F3/01GK102193633SQ20111013770
公開日2011年9月21日 申請日期2011年5月25日 優(yōu)先權日2011年5月25日
發(fā)明者王兵, 郝志鋒, 黃昌正 申請人:廣州暢途軟件有限公司