用于字符輸入的方法和設(shè)備的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及用戶交互,更具體地涉及一種用于字符輸入的方法和設(shè)備。
【背景技術(shù)】
[0002]隨著手勢識別技術(shù)的發(fā)展,人們變得越來越希望使用手寫(handwriting)作為輸入手段。手寫識別的基礎(chǔ)是機(jī)器學(xué)習(xí)和訓(xùn)練庫。無論使用什么訓(xùn)練數(shù)據(jù)庫,筆劃(stroke)的合理分段都是關(guān)鍵的。目前,多數(shù)手寫輸入是在觸摸屏上進(jìn)行的。在用戶完成字符的一個筆劃之后;他將使其手不接觸觸摸屏,從而輸入設(shè)備可以容易地將各筆劃彼此區(qū)分。
[0003]隨著3D(3維)設(shè)備的發(fā)展,用于識別在空中的手寫輸入的需求變得越來越強(qiáng)烈。
【發(fā)明內(nèi)容】
[0004]根據(jù)本發(fā)明的一方面,提供一種用于識別由具有用于捕獲輸入對象的移動軌跡的相機(jī)以及用于檢測從輸入對象到傳感器的距離的傳感器的設(shè)備所輸入的字符的方法,其中,該方法包括步驟:檢測從輸入對象到傳感器的距離;當(dāng)輸入對象在空間區(qū)域內(nèi)移動時,記錄輸入對象的移動軌跡,其中空間區(qū)域具有相對于傳感器的最近距離值和最遠(yuǎn)距離值,并且其中當(dāng)輸入對象在空間區(qū)域的外部移動時,記錄輸入對象的移動軌跡;基于所記錄的移動軌跡而識別字符。
[0005]此外,在識別字符的步驟之前,該方法還包括:檢測輸入對象在空間區(qū)域內(nèi)對于一時間段是靜止的。
[0006]此外,在識別字符的步驟之前,該方法還包括:確定當(dāng)前筆劃是新字符的開始筆劃,其中,筆劃對應(yīng)于輸入對象在當(dāng)檢測到輸入對象從空間區(qū)域的外部移動到空間區(qū)域中時開始并且當(dāng)檢測到輸入對象從空間區(qū)域移動到空間區(qū)域的外部時結(jié)束的時段期間的移動軌跡。
[0007]此外,確定步驟還包括:將當(dāng)前筆劃和先前筆劃映射到與顯示器表面的平面與地球的地表面的平面之間的相交線平行的同一線,以獲得第一映射線和第二映射線;以及如果不滿足任何以下條件,則確定當(dāng)前筆劃是新字符的開始筆劃:1)第二映射線包含(contain)第一映射線;2)第一映射線包含第二映射線;以及3)第一映射線和第二映射線的交集(intersect1n)對于第一映射線和第二映射線的并集(un1n)的比率大于一值。
[0008]此外,設(shè)備具有用于字符識別的工作模式和待機(jī)模式,該方法還包括:在檢測到第一手勢時,將設(shè)備置于工作模式下;以及在檢測到第二手勢時,將設(shè)備置于待機(jī)模式下。
[0009]此外,該方法還包括:當(dāng)輸入對象在空間區(qū)域內(nèi)移動時,使得相機(jī)能夠輸出該輸入對象的移動軌跡;以及當(dāng)輸入對象在空間區(qū)域的外部移動時,使得相機(jī)不能夠輸出該輸入對象的移動軌跡。
[0010]根據(jù)本發(fā)明的一方面,提供一種用于識別字符輸入的設(shè)備,其中,該設(shè)備包括:相機(jī)101,用于捕獲并且輸出一輸入對象的移動軌跡;傳感器102,用于檢測并且輸出該輸入對象與傳感器102之間的距離;處理器103,用于a)在由傳感器102所輸出的距離處于具有最遠(yuǎn)距離值和最近距離值的范圍內(nèi)時,記錄相機(jī)101所輸出的輸入對象的移動軌跡,其中在由傳感器102所輸出的距離不屬于該范圍時,不記錄輸入對象的移動軌跡;b)基于所記錄的移動軌跡來識別字符。
[0011]此外,處理器103還用于:c)在檢測到第一手勢時,將設(shè)備置于用于字符識別的工作模式與待機(jī)模式之中的工作模式下;以及d)在檢測到第一手勢之時,基于由傳感器102所輸出的距離來確定最遠(yuǎn)距離值和最近距離值。
[0012]此外,處理器103還用于:c’)在檢測到第一手勢時,將設(shè)備置于用于字符識別的工作模式與待機(jī)模式之中的工作模式下;d’)檢測輸入對象對于一時間段是靜止的;以及e)在檢測到輸入對象是靜止的時候,基于由傳感器102所輸出的距離來確定最遠(yuǎn)距離值和最近距離值。
[0013]此外,處理器103還用于:g)確定當(dāng)前筆劃是新字符的開始筆劃,其中,筆劃對應(yīng)于輸入對象在當(dāng)傳感器102所輸出的距離變?yōu)樘幱谒龇秶鷥?nèi)時開始并且當(dāng)傳感器102所輸出的距離變?yōu)樘幱谒龇秶鈺r結(jié)束的時段期間的移動軌跡。
[0014]應(yīng)當(dāng)理解,在本發(fā)明的以下詳細(xì)描述中將發(fā)現(xiàn)本發(fā)明的更多方面和優(yōu)點。
【附圖說明】
[0015]正如描述中所說明的,將使用被包含以提供本發(fā)明的進(jìn)一步理解并且被并入該申請中且構(gòu)成該申請的一部分的附圖來示出本發(fā)明的實施例。本發(fā)明不限于實施例。
[0016]在附圖中:
[0017]圖1是示意性示出根據(jù)本發(fā)明的實施例的用于空間上輸入字符的系統(tǒng)的圖;
[0018]圖2是示出根據(jù)本發(fā)明的實施例的空間區(qū)域的定義的圖;
[0019]圖3A是示出在未使用本發(fā)明的情況下由相機(jī)101所捕獲并且輸出的用戶手的移動軌跡的圖;
[0020]圖3B是示出根據(jù)本發(fā)明的實施例的在過濾出無效輸入之后的用戶手的移動軌跡的圖;
[0021]圖4是示出根據(jù)本發(fā)明的實施例的用于識別字符的輸入的方法的流程圖;
[0022]圖5是示出根據(jù)本發(fā)明的實施例的前一字符與后一字符之間的位置關(guān)系的圖;以及
[0023]圖6是示出根據(jù)本發(fā)明的實施例的前一筆劃與后一筆劃之間的所有可能水平位置關(guān)系的圖。
【具體實施方式】
[0024]現(xiàn)將結(jié)合附圖詳細(xì)地描述本發(fā)明的實施例。在以下描述中,為了清楚和簡明,可以省略已知功能和配置的一些詳細(xì)描述。
[0025]圖1是示意性示出根據(jù)本發(fā)明的實施例的用于空間上輸入字符的系統(tǒng)的圖。系統(tǒng)包括相機(jī)101、深度(cbpth)傳感器102、處理器103和顯示器104。處理器103與相機(jī)101和深度傳感器102以及顯示器104連接。在該示例中,將相機(jī)101和深度傳感器102放置在顯示器104的頂部上。應(yīng)當(dāng)注意,可以將相機(jī)101和深度傳感器102放置在其它地方,例如顯示器框的底部或支撐顯示器104的桌子上等。在此,用于識別空間上所輸入的字符的識別設(shè)備包括相機(jī)101、深度傳感器102和處理器103。而且,用于識別空間上所輸入的字符的設(shè)備包括相機(jī)101、深度傳感器102、處理器103和顯示器104。系統(tǒng)的組件具有以下基本功能:
[0026]-使用相機(jī)101來捕獲并且輸出數(shù)字圖像;
[0027]-使用深度傳感器102來檢測并且輸出從手到深度傳感器102的距離。至于候選深度傳感器,可以使用以下傳感器。OptriCam是3D飛行時間(TOF)以及其它專有和專利技術(shù)深度傳感器,其在NIR光譜中運作,OptriCam提供了出色的背景光抑制、非常有限的運動模糊以及低圖像滯后。GrayPoint的BumbleBee基于立體圖像和子像素內(nèi)插技術(shù),其可以實時得到深度信息。PrimeSense光編碼深度傳感器使用激光散斑和另外技術(shù)。
[0028]-使用處理器103來處理數(shù)據(jù)并且將數(shù)據(jù)輸出到顯示器104;以及
[0029]-使用顯示器104來顯示其從處理器103所接收的數(shù)據(jù)。
[0030]本發(fā)明所解決的問題是:當(dāng)用戶使用他的手或?qū)τ谙鄼C(jī)101和深度傳感器102可識別的其它對象在空中空間地輸入或手寫字符的兩個或更多個筆劃時,系統(tǒng)如何忽略筆劃的開始與其先前筆劃的結(jié)束之間(例如,字符的第二筆劃的開始與第一筆劃的結(jié)束之間)的手的移動軌跡并且正確地識別字符的每一筆劃。為了解決該問題,使用了空間區(qū)域。作為示例,由兩個距離參數(shù)(即,最近距離參數(shù)和最遠(yuǎn)距離參數(shù))定義空間區(qū)域。圖2是示出根據(jù)本發(fā)明的實施例的空間區(qū)域的定義的圖。在圖2中,最近距