專利名稱:利用候選表進(jìn)行分類的模式識(shí)別設(shè)備及其方法
技術(shù)領(lǐng)域:
本發(fā)明涉及模式識(shí)別,并且更具體地涉及通過估計(jì)輸入模式或其特征向量所屬的種類識(shí)別模式的模式識(shí)別設(shè)備以及其方法。
近來(lái),為了使公司中的工作流更為有效,已經(jīng)開發(fā)出電子文件歸檔和根據(jù)需要進(jìn)行電子文件編碼的系統(tǒng)。從而,極為需要一種識(shí)別低質(zhì)量的文件例如傳真文件等的文件識(shí)別設(shè)備。尤其,為了編碼印刷后的字符串信息,字符識(shí)別設(shè)備是必可不少的。為了其實(shí)用性及普及性,在保持高識(shí)別精度的同時(shí)以高速估計(jì)字符種類是極為重要的。
另外,作為電子會(huì)議和保安系統(tǒng)中的一種技術(shù)要素識(shí)別人臉的技術(shù)變?yōu)楦又匾?。需要可以以高速和高精度?shí)時(shí)辨別人臉的人臉識(shí)別技術(shù)。
隨著諸如計(jì)算機(jī)圖形系統(tǒng)、CAD(計(jì)算機(jī)輔助設(shè)計(jì))系統(tǒng)、DTP(桌面出版)系統(tǒng)等變?yōu)槠占埃鳛橛行У匕讶S或二維物體輸入到計(jì)算機(jī)中并且實(shí)現(xiàn)重復(fù)使用的手段,識(shí)別三維物體或者二維圖形對(duì)象的技術(shù)變得更為重要。因此,以高速和高精度識(shí)別實(shí)際物體或者圖形對(duì)象的技術(shù)對(duì)于這些系統(tǒng)幾乎是最重要的。
如上面所述,高速及高精度識(shí)別模式的技術(shù)作為構(gòu)成不同類型的實(shí)際模式識(shí)別設(shè)備的技術(shù)要素起著重要的作用。這里,在下面簡(jiǎn)單定義模式識(shí)別中經(jīng)常使用的術(shù)語(yǔ)。
識(shí)別目標(biāo)被稱為模式,所有模式形成的集被稱為模式空間。從模式中抽取特性得到的一個(gè)或多個(gè)特性量的組合被稱為特征向量。特征向量的元素?cái)?shù)量被稱為特征向量的維數(shù)。
特征向量的各元素值的組合稱為特征向量的值。由所有的特征向量值形成的集稱為特征空間。特征空間的維數(shù)等于特征向量的維數(shù),特征向量是特征空間的元素。
特征向量的元素的子集稱為部分特征向量。部分特征向量的各個(gè)元素的值的組合稱為部分特征向量的值。由所有的部分特征向量的值形成的集稱為部分特征空間部分特征空間的維數(shù)等于部分特征向量的維數(shù),部分特征向量是部分特征空間的元素。
可被識(shí)別成為恒等類型的模式或者特征向量的集稱為種類。尤其,可被識(shí)別為恒等類型的模式的集稱為種類模式集,而可被識(shí)別為恒等類型的特征向量的集稱為種類特征集。
確定輸入的模式或特征向量屬于哪種種類(種類模式集或種類特征集)稱為模式識(shí)別。尤其,如果輸入的模式或特征向量可能屬于種類集中所包含的某種種類,則該種類集稱為候選種類集。
存在普通過壓縮特性從而明顯地減小進(jìn)行變換時(shí)用于計(jì)算距離的特征向量的維數(shù)而明顯減少處理時(shí)間的常規(guī)方法,即快速模式識(shí)別方法。
圖1是一個(gè)方塊圖,表示這種通過壓縮特性采取高速分類的模式識(shí)別設(shè)備的結(jié)構(gòu)。
圖1所示的模識(shí)別設(shè)備中,特征抽取單元1從輸入模式抽取特征向量,特征壓縮單元2進(jìn)行特征向量的線性變換,并且得到維數(shù)減少的壓縮特征向量;壓縮特征字典4包括和各個(gè)種類對(duì)應(yīng)的壓縮特征向量;而粗分類執(zhí)行單元3獲取由特征壓縮單元2得到的壓縮特征向量和壓縮特征字典4中每個(gè)壓縮特征向量之間的距離,按距離的升序分類種類,并且從距離最短的種類開始輸出預(yù)定數(shù)量的種類以作為候選種類集。
但是,常規(guī)模式識(shí)別具有下述問題。
在通過壓縮特征采用高速分類的模式識(shí)別下,當(dāng)壓縮特征向量和把特征向量變換成維數(shù)減少的壓縮特征向量時(shí)出現(xiàn)信息丟失。因此,有時(shí)可能不能獲得正確的候選種類集。這是因?yàn)榘ㄆ渚嚯x離輸入模式的壓縮特征向量為最短的壓縮特征向量在內(nèi)的種類并不總是包括輸入模式的壓縮特征向量。從而大大降低低質(zhì)量輸入模式的識(shí)別精度。并且還稍微降低高質(zhì)量輸入模式的識(shí)別精度。
本發(fā)明的一個(gè)目的是提供一種模式識(shí)別設(shè)備及其方法,這種設(shè)備可以在消除識(shí)別精度降低的同時(shí)使對(duì)候選種類集的計(jì)算更快。
作為本發(fā)明的第一方面,一種模式識(shí)別設(shè)備包括一個(gè)表存儲(chǔ)單元和一個(gè)候選種類計(jì)算單元。表存儲(chǔ)單元存儲(chǔ)說(shuō)明生成變換所需信息的候選表,變換的輸入是從模式的特征向量計(jì)算出的基準(zhǔn)特征向量的值,而變換的輸出是候選種類集。候選種類計(jì)算單元利用候選表得到對(duì)應(yīng)于一基準(zhǔn)特征向量的一給定值的候選種類,并且輸出所得到的候選種類集。
基準(zhǔn)特征向量一個(gè)由候選種類計(jì)算單元參照的特征向量。例如,由特征向量的部分元素組的一個(gè)部分特征向量可充當(dāng)準(zhǔn)特征向量。
照本發(fā)明的第二方面,種模式識(shí)別設(shè)備包括多個(gè)表存儲(chǔ)單元、多個(gè)候選種類計(jì)算單元以及一個(gè)種類篩選單元。多個(gè)表存儲(chǔ)單元的每個(gè)存儲(chǔ)說(shuō)明生成變換所需信息的候選表,變換的輸入是從模式的特征向量計(jì)算出的基準(zhǔn)特征向量的值,而變換的輸出是候選種類集。
候選種類計(jì)算單元配置成多個(gè)表存儲(chǔ)單元中的每一個(gè),它利用候選表得到對(duì)應(yīng)一給定基準(zhǔn)特征向量的值的候選種類集,并且輸出所得到的候選種類集。種類篩選單元篩選來(lái)多個(gè)候選種類計(jì)算元輸出多個(gè)候選種集,并且輸出篩選的結(jié)果。
作為本發(fā)明的三個(gè)方面,一模式識(shí)別設(shè)備包括個(gè)存儲(chǔ)單和一個(gè)候選類計(jì)算單元。存儲(chǔ)單元存儲(chǔ)表示模式的特征的特征量數(shù)據(jù)和特征種類集之間的對(duì)應(yīng)關(guān)系。候選種類計(jì)算單元通過利用該對(duì)應(yīng)關(guān)系獲得對(duì)應(yīng)于給定特征量數(shù)據(jù)的候選種類集,并且輸出所得到的候選種類集。
圖1是一個(gè)示意圖,表示常規(guī)模式識(shí)別設(shè)備的結(jié)構(gòu);圖2是一個(gè)示意圖,表示按照本發(fā)明的模式識(shí)別設(shè)備的原理。
圖3A是一個(gè)示意圖,表示候選表的一個(gè)記錄;圖3B是一個(gè)示意圖,表示種類和基準(zhǔn)特征空間;圖4是一個(gè)方塊圖,表示信息處理設(shè)備的結(jié)構(gòu);圖5表示候選表的結(jié)構(gòu);圖6是一個(gè)示意圖,表示第一模式識(shí)別設(shè)備的結(jié)構(gòu);圖7是個(gè)示意圖,表示第二模式識(shí)別設(shè)備的結(jié)構(gòu);圖8是一個(gè)示意圖,表示第一基準(zhǔn)特征空間;圖9舉例說(shuō)明第一候選表;圖10是一個(gè)示意圖,表示第三模式識(shí)別設(shè)備的結(jié)構(gòu);圖11是一個(gè)示意圖,表示Voronoi分區(qū);
圖12是一個(gè)示意圖,表示第二基準(zhǔn)特征空間;圖13是一個(gè)示意圖,表示第三基準(zhǔn)特征空間;圖14舉例說(shuō)明第二候選表;圖15是一個(gè)流程圖,表示利用學(xué)習(xí)模式生成候選表的處理;圖16是一個(gè)流程圖,表示利用學(xué)習(xí)模式進(jìn)行估計(jì)的處理;圖17是一個(gè)流程圖,表示生成候選種類集的處理;圖18是一個(gè)流程圖,表示利用Voronoi分區(qū)生成候選表的處理;圖19是一個(gè)流程圖,表示利用Voronoi分區(qū)進(jìn)行估計(jì)的處理;圖20是一個(gè)示意圖,表示第四模式識(shí)別設(shè)備的結(jié)構(gòu);圖21是一個(gè)示意圖,表示第五模式識(shí)別設(shè)備的結(jié)構(gòu);圖22是一個(gè)流程圖,表示第六模式識(shí)別設(shè)備的結(jié)構(gòu)。
參照附圖,下面詳細(xì)解釋根據(jù)本發(fā)明的各種實(shí)施例。
圖2是一個(gè)示意圖,表示根據(jù)本發(fā)明的模式識(shí)別設(shè)備的原理。圖2中所示的設(shè)備包括表存儲(chǔ)單元11和候選種類計(jì)算單元12。
表存儲(chǔ)單元11存儲(chǔ)候選表13,該表說(shuō)明為產(chǎn)生變換所需的信息,變換的輸入是從模式的特征向量計(jì)算出的基準(zhǔn)特征向量的值,而變換的輸出是候選種類集。
候選種類計(jì)算單元12利用候選表13得到對(duì)應(yīng)于一給定基準(zhǔn)特征向量的值的候選種類集,并且輸出所得到的候選種類集。
基準(zhǔn)征向量是一個(gè)由候選種類計(jì)算單元12參照的特征向量?;鶞?zhǔn)特征向量的素?cái)?shù)量稱之為準(zhǔn)特征向量的數(shù)?;鶞?zhǔn)特征向的值的集稱為基準(zhǔn)特空間?;鶞?zhǔn)特征空的維數(shù)等于基特征向量的維數(shù),基準(zhǔn)特征向量是基準(zhǔn)特征空間的一個(gè)元素。例如,由特征向量的部分元素構(gòu)成的部分特征向量充當(dāng)基準(zhǔn)特征向量。
候選表13存儲(chǔ)表示基準(zhǔn)特征向量的各個(gè)值和候選種類集之間的對(duì)應(yīng)關(guān)系的變換信息。因此,參照候選表13可以立即得到對(duì)應(yīng)于某特定基準(zhǔn)特征向量的值的候選種類集。當(dāng)給出基準(zhǔn)特征向量的值時(shí),候選種類計(jì)算單元12通過把該值輸入到候選表13的變換中得到對(duì)應(yīng)的候選種類集,并且輸出所得到的集。
借助這種模式識(shí)別設(shè)備,可以通過簡(jiǎn)單地參照候選表并且不必進(jìn)行對(duì)特征向量間的距離的麻煩的計(jì)算輸出候選種類表,從而明顯地提高模式識(shí)別處理的速度。此外,通過適當(dāng)?shù)卦O(shè)定候選表13中的變換,可把識(shí)別精度實(shí)現(xiàn)成和不應(yīng)用本發(fā)明的情況下幾乎相同的程度。
舉例來(lái)說(shuō),圖2所示的表存儲(chǔ)單元11對(duì)應(yīng)于后面說(shuō)明的圖4中的存儲(chǔ)器32,而候選種類計(jì)算單元12對(duì)應(yīng)于CPU(中央處理設(shè)備)31及存儲(chǔ)器32。
按照本發(fā)明,設(shè)置一個(gè)候選種類計(jì)算單元,其通過參照一個(gè)事先準(zhǔn)備的候選表并且不用計(jì)算特征各之間的距離來(lái)輸出候選種類集。候選表包括為產(chǎn)生換所需的信息的說(shuō)明,變換的輸入是從特征向量計(jì)算出的某個(gè)基特征向量的值變換的輸出是某個(gè)候選種類集。
候選種類計(jì)算單元根據(jù)輸入的基準(zhǔn)特征向量的值從候選表得到候選種類集,并且輸出得到的集。如果在候選表中存儲(chǔ)著作為基準(zhǔn)特征向量的值以及對(duì)種類集的變換的適當(dāng)信息,可以實(shí)現(xiàn)其速度明顯提高的分類處理,同時(shí)仍可把精度保持在和不應(yīng)用根據(jù)本發(fā)明的高速分類方法的情況下幾乎相同程度的精度上。
圖3A舉例說(shuō)明候選表中的一條記錄。圖3A中所示的基準(zhǔn)特性劃分元素“x”指示基準(zhǔn)特征向量的特定值的范圍或者一個(gè)特定值,并且對(duì)應(yīng)于基準(zhǔn)特征空間的特定區(qū)域或者點(diǎn)。如果對(duì)候選種類計(jì)算單元提供的基準(zhǔn)特征向量的值包含在基準(zhǔn)特征劃分元素“x”之內(nèi),作為分類的結(jié)果輸出對(duì)應(yīng)的候選種類集(B、C、G、H、K)。
圖3B表示種類和基準(zhǔn)特性空間之間的關(guān)系。當(dāng)產(chǎn)生候選表時(shí),基準(zhǔn)特征空間22根據(jù)適當(dāng)?shù)臉?biāo)準(zhǔn)被劃分為多個(gè)基準(zhǔn)特征劃分元素,并且對(duì)特征空間21對(duì)應(yīng)的各個(gè)種類A、B、C、D、E、F、G、H、I、J、K、L和M在基準(zhǔn)特征空間22中的投影(基準(zhǔn)特征投影)進(jìn)行估計(jì)。這樣,例如,得到一個(gè)各個(gè)基準(zhǔn)特征劃分元素的范圍和各個(gè)種類的基準(zhǔn)特征投影共用的部分,而且把擁有共用部分的種類集識(shí)別為對(duì)應(yīng)的候選種類集。
因?yàn)榉N類B、C、G、H和K的投影和基準(zhǔn)特處劃分元素“x”在本情況下共享一個(gè)部分,把這些種類包括成為其元素的集(B、C、G、H、K)將成為對(duì)應(yīng)于基準(zhǔn)特征劃分元素“x”的候選種類集,如圖3A中所示。以類似的方式可以得到對(duì)應(yīng)于另一個(gè)基準(zhǔn)特征劃分元素“y”的候選種類集。
如上面所述,一個(gè)包括著由基準(zhǔn)特征投影和基準(zhǔn)特征劃分元素共享部分的種類被識(shí)別成為一個(gè)候選種類集中的一個(gè)元素,并且把基特征劃分元素和候選種類集的組合存儲(chǔ)成候選表。從而候選種類計(jì)算單元得到包括著基準(zhǔn)特征向量的給定值的基準(zhǔn)特征劃分元素,并且利用候選表得到相應(yīng)的候選種類集。依靠這種處理,可以在不降低其精度的前提下實(shí)現(xiàn)高速分類。
圖4是一個(gè)方塊圖,表示用于這種模式識(shí)別設(shè)備的信息處理設(shè)備的結(jié)構(gòu)。圖4所示的信息處理設(shè)備包括CPU(中央處理設(shè)備)31、存儲(chǔ)器32、輸入設(shè)備33、輸出設(shè)備34、外部存儲(chǔ)設(shè)備35、介質(zhì)驅(qū)動(dòng)設(shè)備36、網(wǎng)絡(luò)連接設(shè)備37以及光電轉(zhuǎn)換器38。通過總線39,所有這些單元得到互連。
CPU31利用存儲(chǔ)在存儲(chǔ)器32中的程序以及候選表完成模式識(shí)別設(shè)備的處理。對(duì)于存儲(chǔ)器32,例如采用ROM(只讀存儲(chǔ)器)、RAM(隨機(jī)存取存儲(chǔ)器)等。
輸入設(shè)備33例如對(duì)應(yīng)鍵盤、指點(diǎn)器等。它用于輸入用戶的請(qǐng)求或指令。輸出設(shè)備34對(duì)應(yīng)顯示設(shè)備、打印機(jī)等。它用于輸出對(duì)用戶的詢問、處理的結(jié)果等。
外部存儲(chǔ)設(shè)備35例如對(duì)應(yīng)磁盤設(shè)備、光盤設(shè)備、磁光盤設(shè)備等。它可以存儲(chǔ)程序或數(shù)據(jù)。另外,它可用作存儲(chǔ)模式、特征向量、候補(bǔ)表等的數(shù)據(jù)庫(kù)。
介質(zhì)驅(qū)動(dòng)設(shè)備36驅(qū)動(dòng)可移動(dòng)的存儲(chǔ)介質(zhì)40,并可以訪問介質(zhì)存儲(chǔ)的內(nèi)容。對(duì)于可移動(dòng)的存儲(chǔ)介質(zhì)40,可以采用例如存儲(chǔ)器卡、軟盤、CD-ROM(大容量只讀存儲(chǔ)器)、光盤、磁光盤等中的任一種計(jì)算機(jī)可讀的存儲(chǔ)介質(zhì)。可移動(dòng)存儲(chǔ)介質(zhì)40存儲(chǔ)用于執(zhí)行模式識(shí)別處理的程序以及數(shù)據(jù)。
網(wǎng)絡(luò)連接設(shè)備37和任選的通信網(wǎng)絡(luò)例如LAN(局域網(wǎng))連接,并且除通信外還進(jìn)行數(shù)據(jù)轉(zhuǎn)換等。經(jīng)過網(wǎng)絡(luò)連接設(shè)備37,模式識(shí)別設(shè)備可以接收來(lái)自外部數(shù)據(jù)庫(kù)等的請(qǐng)求的數(shù)據(jù)或程序。光電轉(zhuǎn)換器38例如是圖象掃描器。它用于輸入要處理的模式。
參照?qǐng)D5至圖14,下面解釋基準(zhǔn)特征向量、候選表和模式識(shí)別設(shè)備結(jié)構(gòu)的具體例子。圖5表示用于該實(shí)施例的候選表的結(jié)構(gòu)。圖5所示的候選表存儲(chǔ)多個(gè)基準(zhǔn)特征劃分元素和候選種類集的組合,并用于分類基準(zhǔn)特征向量。
圖6示意表示包含候選表的第一模式識(shí)別設(shè)備的結(jié)構(gòu),該設(shè)備利用輸入特征向量的部分特征向量進(jìn)行高速分類。圖6所示的模式識(shí)別設(shè)備包括一個(gè)候選表41和一個(gè)候選種類計(jì)算單元42,候選表41存儲(chǔ)從特征向量計(jì)算出的基準(zhǔn)特征向量的值和種類集的各種組合。
候選種類計(jì)算單元42把輸入特征向量的某個(gè)部分識(shí)別為基準(zhǔn)特征向量,利用基準(zhǔn)特征向量的值及候選表41得到候選種類集,并且輸出所得到的集。
假定由特征向量構(gòu)成的特征空間是由“K”個(gè)不重疊的種類特征集C1、C2…、CK覆蓋。同時(shí),假定所有種類特征集的集是CSET,這可用下式表示CSET={C1、C2、…、CK}并假定特征空間的維數(shù)為“N”,特征向量“f”可用其元素表示成f=(f1、f2、…,fN)此時(shí),候選種類計(jì)算單元42估計(jì)包括著輸入特征向量fIN所屬于的種類CIN∈CSET的候選種類集CCAND,并且輸出估計(jì)的種類集。對(duì)于基準(zhǔn)特征向量,可采用特征向量的任何部分特征向量。
假定二維部分特征向量g=(f1、f2)是基準(zhǔn)特向量,通過二維部分特征向量的值和候選種類集的組合構(gòu)造候選表41。二維部分特征向量可能采取的所有的值被登記到候選表41中。假定特征向量“f”的每個(gè)元素可以取三個(gè)值“0”、“1”及“2”中的任一值,則候選表41將包括下述組合
((0,0), C(0,0))((0,1), C(0,1))((0,2), C(0,2))((1,0), C(1,0))((1,1), C(1,1))((1,2), C(1,2))((2,0), C(2,0))((2,1), C(2,1))((2,2), C(2,2))這里,C(p、q)CSET是一個(gè)候選種類集,其對(duì)應(yīng)于基準(zhǔn)特征向量的值(p、q)(p=0、1、2;q=0、1、2)。在該情況下,基準(zhǔn)特征空間中的點(diǎn)(p、q)將成為基準(zhǔn)特征劃分元素。
候選種類計(jì)算單元42從輸入的特征向量得到二維特征向量的值(p、q),從候選表41得帶左側(cè)元素為(p、q)的組合,并且輸出作為右側(cè)元素的候選種類集C(p、q)。
借助這種模式識(shí)別設(shè)備,通過參照候選表而無(wú)須計(jì)算距離就可以快速地得到候選種類集。如果存儲(chǔ)在候選表41中的有關(guān)候選種類集是適用的,可以實(shí)現(xiàn)以高速和高精度進(jìn)行模式識(shí)別的模式識(shí)別設(shè)備。
圖7示意表示第二模式識(shí)別設(shè)備的結(jié)構(gòu),該設(shè)備從輸入模式中得到特征向量,把特征向量的一部分識(shí)別為基準(zhǔn)特征向量,并且利用候選表進(jìn)行高速分類。
圖7所示的模式識(shí)別設(shè)備包括一個(gè)用于從輸入字符模式中抽取特征向量的特征抽取單元51,一個(gè)候選種類計(jì)算單元52和一個(gè)候選表53。候選表53例如是通過利用供學(xué)習(xí)進(jìn)程的字符模式集生成的。
假定字符模式的種類數(shù)量為“K”,并且由對(duì)應(yīng)的特征向量構(gòu)成的特征空間是由“K”個(gè)不重疊的種類特征集C1、C2、…、CK覆蓋的。此時(shí),所有種類特征集的集CSET可表示成CSET={C1、C2、…CK}候選種類計(jì)算單元52估計(jì)包括著輸入字符模式PIN所屬于的種類CIN∈CSET,并且輸出所估計(jì)的集。
首先解釋特征抽取單元51執(zhí)行的特征抽取處理。對(duì)于經(jīng)常用于從字符模式抽取特征的特征量,可以引用方向線元素特征量。這是一種通過把字符模式劃分成二維網(wǎng)格并且計(jì)算每個(gè)網(wǎng)格中外線方向分量(outlinedirection components)的數(shù)量得到的一種特征量。
假定采用7×7的網(wǎng)格,則網(wǎng)格數(shù)量總共為49個(gè)。并且假定把外線方向分量分類成四種主要的方向,例如水平、垂直、在斜線及左斜線四種方向,則由49×4結(jié)果可得到196個(gè)特征量。依靠這種處理,從輸入字符模式抽取一個(gè)196維的特征向量。
假定特征空間的維數(shù)為“N”,利用其元素特征向量“f”可以一般地表示成f=(f1、f2、…、fN)特征向量“f”的各個(gè)元素的值對(duì)應(yīng)于一個(gè)特定網(wǎng)格中所包括的外線象素上所具有的某特定方向分量的象素的數(shù)量。這例如用一個(gè)等于或大于“0”的整數(shù)值表示。
并且假定特征向量的一個(gè)元素“f1”是一個(gè)一維基準(zhǔn)特征向量“r”,而且該基準(zhǔn)特征向量可采取的值的范圍為A≤r<B,這樣區(qū)間〔A、B)將成為基準(zhǔn)特征空間。
假定把基準(zhǔn)特征空間〔A,B)劃分成網(wǎng)格,并且每個(gè)部分充當(dāng)基準(zhǔn)特征劃分元素,后者是候選表的元素。因?yàn)樵撉闆r下基準(zhǔn)特征空間是一維的,所以如果按如下把區(qū)間〔A,B)劃分成“L+1”個(gè)區(qū)間Ri=〔Si-1,Si)(i=0,1,…,L),則每個(gè)區(qū)間Ri將作為一個(gè)基準(zhǔn)特征劃分元素A=S-1<S0<S1<S2<…<SL=B如果基準(zhǔn)特征空間定義成無(wú)窮空間,則令“A=-∞”并令“B=+∞”是充分的。
例如,根據(jù)“L”為6的假設(shè),圖8所示的一維基準(zhǔn)特征空間55劃分成為七個(gè)基準(zhǔn)特征劃分元素R0=(-∞,S0)、R1=〔S0,S1)、R2=〔S1,S2)、R3=〔S2,S3)、R4=〔S3,S4)、R5=〔S4,S5)、R6=〔S5,+∞)。
對(duì)應(yīng)于每個(gè)基準(zhǔn)特征劃分元素“Ri”的候選種類集是通過估計(jì)學(xué)習(xí)字符模式集中的每個(gè)字符種類的基準(zhǔn)特征投影得到的。從而,通過利用所得到的各候選種類集生成候選表53。
但是,請(qǐng)注意,學(xué)習(xí)字符模式集包括屬于有關(guān)字符種類的字符模式,其數(shù)量是足夠的。按如下進(jìn)行對(duì)特定字符種類“CK”的基準(zhǔn)特征投影的估計(jì)首先,從學(xué)習(xí)字符模式集抽取屬于字符種類“CK”的字符模式,并且從字符模式抽取特征。接著,得到對(duì)應(yīng)的特征向量。然后,從得到的特征向量集獲得特征向量的第一元素“f1”的集FK,集FK構(gòu)成的分布接近字符種類CK的基準(zhǔn)特征投影。之后,得到集FK的元素的最小值MINK和最大值MAXK。從而,在考慮一特定裕度M下,可以把字符種類CK的基準(zhǔn)特征投影的估計(jì)值QK用下述閉區(qū)間定義QK=〔MINK-M,MAXK+M〕可以從上述的基準(zhǔn)特征劃分元素“Rj”和每個(gè)字符種類“CK”的基準(zhǔn)特征投影“QK”得到和各個(gè)特征劃分元素“Ri”相組合的候選種類集“Di”。
從而,用于基準(zhǔn)特征劃分元素“Ri”的候選種類集“Di”定義為字符種類“CK”集,在每個(gè)字符種類“CK”中某個(gè)基準(zhǔn)特征劃分元素“Ri”和基準(zhǔn)特征投影“QK”共享一個(gè)部分(“Ri”和“QK”的交集不是空集)。通過這種定義,候選種類集“Di”將成為一個(gè)字符種類表,分別具有屬于基準(zhǔn)特征劃分元素“Ri”的基準(zhǔn)特征向量的值的字符模式有可能屬于該表。
因此,可以得到足以包括保持識(shí)別精度的字符種類的候選種類集“Di”。通過組合基準(zhǔn)特征劃分元素“Ri”和候選種類集“Di”可構(gòu)造候選表53。
因?yàn)樵趫D8中示出種類B、C、G、H和K的投影和基準(zhǔn)特征劃分元素R3共享特征空間54的一部分,包括著作為其元素的各種類的集(B、C、G、H、K)成為對(duì)應(yīng)于基準(zhǔn)特征劃分元素R3的候選種類集。同樣,以類似的方式得到其它基準(zhǔn)特征劃分元素對(duì)應(yīng)的候選種類集。從而,候選表53例如將如圖9所示。
如果輸入特征向量的第一個(gè)元素的值是“r”,候選種類計(jì)算單元52把該值識(shí)別成基準(zhǔn)特征向量的值,并且得到值“r”屬于的基準(zhǔn)特征劃分元素“Ri”。由于在本情況下基準(zhǔn)特征劃分元素“Ri”是一個(gè)一維區(qū)間,很容易確定值“r”屬于那個(gè)區(qū)間。接著,候選種類計(jì)算單元52通過利用候選表53得到對(duì)應(yīng)于基準(zhǔn)特征劃分元素“Ri”的候選種類“Di”,并把得到的種類輸出為字符識(shí)別結(jié)果。預(yù)計(jì)輸入字符模式所屬于的字符種類包含在輸出候選種類集之中。
借助這種模式識(shí)別設(shè)備,無(wú)須計(jì)算距離而是對(duì)照表格,可以在不降低其精度的前提下快速得到輸入字符模式預(yù)期所屬于的候選種類。
圖10示意表示用于從輸入字符模式得到特征向量的第三模式識(shí)別設(shè)備的結(jié)構(gòu),該設(shè)備把特征向量的部分特征向量用作為基準(zhǔn)特征向量,并且利用候選表進(jìn)行高速細(xì)致分類。
圖10所示的模式識(shí)別設(shè)備包括特征抽取單元61、候選種類計(jì)算單元62、細(xì)分類執(zhí)行單元63、候選表64以及用于進(jìn)行細(xì)分類的字典65。特征抽取單元61從輸入字符模式中抽取特征向量。
此處,利用Voronoi分區(qū)生成候選表64,Voronoi分區(qū)是由在字典中登記的每個(gè)字符種類的一個(gè)代表特征向量構(gòu)成的。
Voronoi分區(qū)是根據(jù)離多個(gè)在一任意空間中給定的點(diǎn)的距離定義的一種類型的區(qū)域。它也稱為Voronoi區(qū)域。
種類特征集CSET、特征向量“f”、基準(zhǔn)特征空間、基準(zhǔn)劃分元素“Ri”等的注釋以及抽取特征的處理內(nèi)容類似于第二模式識(shí)別設(shè)備的有關(guān)說(shuō)明。候選種類計(jì)算單元62估計(jì)包含著輸入字符模式PIN所屬于的種類CIN∈CSET的候選種類集CCAND,并且輸出估計(jì)的集。
細(xì)分類執(zhí)行單元63把候選種類計(jì)算單元62輸出的候選種類作為輸入,并利用字典65計(jì)算距離。字典65存儲(chǔ)各個(gè)字符種類的代表特征向量。細(xì)分類執(zhí)行單元63得到一個(gè)離對(duì)應(yīng)于輸入字符模式的特征向量距離為最近的代表特征向量,并把對(duì)應(yīng)于所得到的向量的字符種類輸出為估計(jì)的字符種類。
這里,對(duì)應(yīng)于各個(gè)字符種類“CK”的基準(zhǔn)特征投影的估計(jì)值“QK”不僅是通過利用學(xué)習(xí)字符模式集而且是通過利用Voronoi分區(qū)“VK”得到的,Voronoi分區(qū)“VK”是從各對(duì)應(yīng)著登記在字典65中用于細(xì)分類的各個(gè)字符種類“Cj”的代表特征向量“Ej”的集得到的。
字符種類“CK”的Voronoi分區(qū)“VK”是特征向量“f”的一個(gè)集,當(dāng)?shù)玫揭粋€(gè)任意特征向量“f”和字典65中登記的所有代表特征向量之間的距離時(shí),該集到字符種類“CK”的代表特征向量“EK”的距離最短。已知可以基于距離計(jì)算通過利用細(xì)分類分割特征空間得到Voronoi分區(qū)。
例如,假定在一個(gè)二維特征空間中給出對(duì)應(yīng)于處類C1、C2、C3、C4、C5和C6的代表特征向量E1、E2、E3、E4、E5和E6,對(duì)應(yīng)的Voronoi分區(qū)V1、V2、V3、V4、V5和V6將如圖11中所示。在該圖中,Voronoi分區(qū)V3和V5之間邊界上的特征向量f=(f1,f2)對(duì)代表特征向量E3和E5是等距離的。對(duì)于其它邊界上其它點(diǎn)這種情況是相同的。
通常,如果在N維特征空間采用歐氏距離,Voronoi分區(qū)將成為由特征空間中的超平面構(gòu)成的一個(gè)超凸多面體。如果采用城市街區(qū)距離,Voroni分區(qū)將成為一個(gè)超多面體。此外,如果采用例如Mahalanobis距離的非線性距離,Voronoi分區(qū)將成為由超表面構(gòu)成的一個(gè)有界子集。
N維空間中的一個(gè)超表面表示一個(gè)N-1維的表面,而超平面表示它的一種特殊形式。后面將說(shuō)明各種距離如城市街區(qū)距離的定義和意義。
假定特征向量“f”的一個(gè)元素“f1”是基準(zhǔn)特征向量,Voronoi分區(qū)“VK”在基準(zhǔn)特征空間中的基準(zhǔn)特征投影的估計(jì)值“QK”規(guī)定為屬于Voronoi分區(qū)“VK”的值域。若距離為歐氏距離,則可用線性規(guī)劃方法得到Voronoi分區(qū)“VK”的基準(zhǔn)特征向量的最小值和最大值,并且可從這些值中得到基準(zhǔn)特征投影的估計(jì)值“QK”。
對(duì)于更一般的距離,若采用一維基準(zhǔn)特征向量,則可利用非線性規(guī)劃方法從Voronoi分區(qū)“VK”得到基準(zhǔn)特征投影的估計(jì)值“QK”。后面會(huì)說(shuō)明利用線性和非線性規(guī)劃方法估計(jì)基準(zhǔn)特征投影的方法。
接著,通過利用上述基準(zhǔn)特征劃分元素“Ri”和各個(gè)字符種類“CK”的基準(zhǔn)特征投影“QK”得到和每個(gè)基準(zhǔn)特征劃分元素“Ri”組合的候選種類集“Di”。
例如,這是充分的,即把每個(gè)字符種類“CK”中基準(zhǔn)特征劃分元素“Ri”和基準(zhǔn)特征投影“QK”共享著一個(gè)部分的字符種類“CK”的集定義為對(duì)應(yīng)于基準(zhǔn)特征劃分元素“Ri”的候選種類集“Di”。借助這種處理,候選種類集“Di”將成為一個(gè)字符種類表,具有屬于基準(zhǔn)特征劃分元素“Ri”的基準(zhǔn)特征向量的值的字符模式有可能屬于該表。
圖12是一個(gè)示意圖,表示種類的Voronoi分區(qū)和二維基準(zhǔn)特征空間之間的關(guān)系。在圖12的特征空間71中,對(duì)應(yīng)于各自種類的Voronoi分區(qū)A、B、C、D、E、F、G、H、I、H、K、L和M投影到基準(zhǔn)特征空間72,從而可以得到各個(gè)Voronoi分區(qū)在基準(zhǔn)特征空間72中的投影區(qū)域。這些區(qū)域?qū)⒊蔀榛鶞?zhǔn)特征投影的估計(jì)值。
接著,得到各個(gè)基準(zhǔn)特征劃分元素的區(qū)域和各個(gè)種類的基準(zhǔn)特征投影共享的部分,并且把包含著共享部分的種類集識(shí)別成相應(yīng)的候選種類集。
因?yàn)樵诒厩闆r下種類B、C、G、H和K的投影與基特征劃分元素“x”有共享部分,以這些種類作為其元素的集(B,C,G,H,K)將成為對(duì)應(yīng)于基準(zhǔn)特征劃分元素“x”的候選種類集,這類似于圖3A中所示記錄的方式。按類似方法還可以得到對(duì)應(yīng)于別的基準(zhǔn)特征劃分元素“y”的候選種類集。
候選表64由基準(zhǔn)特征劃分元素“Ri”和候選種類集“Di”的組合構(gòu)成。候選種類計(jì)算單元62按類似于第二模式識(shí)別設(shè)備的方式利用候選表64從輸入特征向量得到候選種類集,并且把得到的集傳送到細(xì)分類執(zhí)行單元63。
細(xì)分類執(zhí)行單元63通過參照字典65抽取屬于經(jīng)候選種類計(jì)算單元62篩選后的候選種類集的各個(gè)字符種類的代表特征向量。然后,細(xì)分類執(zhí)行單元63計(jì)算各代表特征向量與對(duì)應(yīng)于輸入字符模式的特征向量之間的距離,并且把其距離為最短的字符種類輸出為估計(jì)的字符種類。
如上面所述,得到用于細(xì)分類的對(duì)應(yīng)于各個(gè)字符種類的Voronoi分區(qū)的基準(zhǔn)特征投影,并且把對(duì)應(yīng)于與基準(zhǔn)特征劃分元素具有共用部分的基準(zhǔn)特征投影的字符種類識(shí)別為候選種類,從而可以得到用于細(xì)分類的包含充分及必要的字符種類的候選種類集。
借助這種處理,通過參照一個(gè)表可以快速篩選預(yù)期屬于輸入字符模式的各個(gè)候選種類,同時(shí)保證細(xì)分類的精度。從而,可以足夠地減少進(jìn)行細(xì)分類的目標(biāo)字符種類的數(shù)量,并且可以實(shí)現(xiàn)一種高精度下快速進(jìn)行識(shí)別的模式識(shí)別設(shè)備。
接著,考慮在圖10所示的模式識(shí)別設(shè)備中把特征向量“f”的二個(gè)元素(f1,f2)識(shí)別成二維基準(zhǔn)特征向量“r”的情況。假定基準(zhǔn)特征向量“r”的各個(gè)元素的可取值的范圍為f1∈〔A1,B1)及f2∈〔A2,B2),從而矩形區(qū)域〔A1,B1)×〔A2,B2)將成為基準(zhǔn)特征空間。
把基準(zhǔn)特征空間〔A1,B1)×〔A2,B2)劃分成網(wǎng)格,并且把網(wǎng)格作為將是候選表64中的元素的基準(zhǔn)特征劃分元素。因此,把區(qū)間〔A1,B1)劃分成“L1+1”個(gè)區(qū)段,把區(qū)間〔A2,B2)劃分成“L2+1”個(gè)區(qū)段。
A1=S-1<S0<S1<S2<…<SL1=B1A2=t-1<t0<t1<t2<…<tL2=B2如果采用標(biāo)志“i”和“j”,可按如下定義基準(zhǔn)特征劃分元素R(i,j)R(i,j)=矩形〔Si-1,sj)×〔ti-1,tj)其中i=0,1,…,L1,j=0,1,…,L2。從而,基準(zhǔn)特征劃分元素R(i,j)將成為一個(gè)二維矩形區(qū)域。例如,圖13所示的二維基準(zhǔn)空間74劃分成為24個(gè)(把L1和L2分別設(shè)為5和3,并且由(5+1)×(3+1)得到)基準(zhǔn)特征劃分元素。
然后,抽取屬于對(duì)應(yīng)于各個(gè)字符種類“CK”的Voronoi分區(qū)“VK”的全部特征向量,并且基準(zhǔn)特征向量(f1,f2)的值的范圍識(shí)別成基準(zhǔn)特征投影的估計(jì)值“QK”。并且把每個(gè)其中基準(zhǔn)特征劃分元素R(i,j)和基準(zhǔn)特征投影“QK”共享一個(gè)部分的字符種類“CK”的集識(shí)別成對(duì)應(yīng)于基準(zhǔn)特性劃分元素R(i,j)的候選種類集D(i,j)。
在該情況下,候選表64是由基準(zhǔn)特征劃分元素R(i,j)和候選種類集D(i,j)的組合構(gòu)成的。特征抽取單元61和細(xì)分類執(zhí)行單元63的處理類似于前面的說(shuō)明。
因?yàn)樵趫D13的特征空間73中種類B、C及K的投影和基特征劃分元素X=〔S2,S3)×〔t0,t1)共享一個(gè)部分,把這些種類包含為其元素的集(B,C,D)將成為對(duì)應(yīng)于基準(zhǔn)特征劃分元素X的候選種類集。另外,種類G、H及K的投影和基準(zhǔn)特性劃分元素Y=〔S2,S3)×〔t1,t2)共享一個(gè)部分,把這些種類G、H及K包含為其元素的集(G,H,K)將成為對(duì)應(yīng)于基準(zhǔn)特征劃分元素Y的候選種類集。因此,候選表64例如將如圖14所示。
如果輸入特征向量的第一和第二元素分別為“r1”和“r2”,候選種類計(jì)算單元62把r=(r1,r2)識(shí)別成基準(zhǔn)特征向量的值,并且首先得到該值所屬于的基準(zhǔn)特征劃分元素R(i,j)由于基準(zhǔn)特征劃分元素R(i,j)是一個(gè)二維矩形區(qū)域,很容易確定值“r”所屬于的區(qū)域。然后,候選種類計(jì)算單元62得到對(duì)應(yīng)于該基準(zhǔn)特征劃分元素R(i,j)的候選種類集D(i,j),并把得到的集傳送到細(xì)致分類執(zhí)行單元63。
如上面所述,基準(zhǔn)特征空間不局限于一維空間。通常,可能把它設(shè)成為任意維數(shù)的空間。下面概述當(dāng)基準(zhǔn)特征空間為二維或更多維時(shí)生成候選表的方法。下面的例子涉及基準(zhǔn)特征空間為二維的情況。但是,當(dāng)基準(zhǔn)特征空間為三維和三維以上時(shí)仍可用類似的方式生成候選表。
首先,考慮這種情況,即基準(zhǔn)特征空間是由垂直于坐標(biāo)軸的直線劃界的并且劃分成為網(wǎng)格,每個(gè)網(wǎng)格識(shí)別為一個(gè)基準(zhǔn)特征劃分元素。假定每個(gè)網(wǎng)格的二維標(biāo)志為(i,j),并且相應(yīng)的網(wǎng)格用K(i,j)表示。如果種類“C”在基準(zhǔn)特征空間的投影和網(wǎng)格K(i,j)共享一個(gè)部分,則種類“C”識(shí)別為網(wǎng)格K(i,j)的候選種類集S(i,j)中的一個(gè)元素。
因此基準(zhǔn)特征空間中所得到的每個(gè)網(wǎng)格K(i,j)和候選種類集S(i,j)的組合用該網(wǎng)格的標(biāo)志(i,j)及該候選種類集所屬的各個(gè)種類的標(biāo)志表示,并且存儲(chǔ)成候選表。
接著,考慮通過采用量化點(diǎn)進(jìn)行基準(zhǔn)特征空間的Voronoi分區(qū),并把每個(gè)Voronoi區(qū)域識(shí)別為基準(zhǔn)特征劃分元素的情況。在該情況下,假定代表基準(zhǔn)特征空間中的每個(gè)Voronoi區(qū)域的量化點(diǎn)的標(biāo)志為“i”,并且每個(gè)量化點(diǎn)用(xi,yi)表示。如果種類“C”在基準(zhǔn)特征空間中的投影和包含著量化點(diǎn)(xi,yi)的Voronoi區(qū)域“Vi”共享一個(gè)部分,則把種類“C”識(shí)別為用于Voronoi區(qū)域“Vi”的候選種類集S(i)中的一個(gè)元素。
在基準(zhǔn)特征空間中所得到的每個(gè)Voronoi區(qū)域“Vi”和候選種類集S(i)的組合從而利用代表基準(zhǔn)特征空間中的Voronoi區(qū)域“Vi”的量化點(diǎn)的標(biāo)志和屬于候選種類集中的各個(gè)種類的標(biāo)志表示的,而且作為候選表存儲(chǔ)。
例如,在上述說(shuō)明的例子中存在兩種作為得到某個(gè)種類在基準(zhǔn)特征空間中的投影的基礎(chǔ)的方法。一種方法是通過把對(duì)應(yīng)于供學(xué)習(xí)的模式集(學(xué)習(xí)模式)的特征向量投影到基準(zhǔn)特征空間來(lái)估計(jì)基準(zhǔn)特征投影的方法,另一種方法是基于Voronoi分區(qū)利用登記在一個(gè)字典中用于細(xì)分類的代表特征向量來(lái)估計(jì)基準(zhǔn)特征投影的方法。
下面參照?qǐng)D15至19解釋利用每種估計(jì)方法生成候選表的處理流程。
圖15是一個(gè)流程圖,表示利用學(xué)習(xí)模式生成候選表的處理。圖15所示的流程圖涉及一維基準(zhǔn)特征空間的情況。但是,該流程也可應(yīng)用于更多維數(shù)的基準(zhǔn)特征空間的情況。
一旦開始處理,模式識(shí)別設(shè)備首先得到基準(zhǔn)特征空間中的基準(zhǔn)特征劃分元素Ri=(Si-1,Si),i=0,1,…,L(步驟S1)。接著,模式識(shí)別設(shè)備利用學(xué)習(xí)模式對(duì)基準(zhǔn)特征空間的投影得到對(duì)應(yīng)于每個(gè)種類CK(K=1,…,K)的基準(zhǔn)特征投影的估計(jì)值QK=〔MINK,MAXK〕(步驟S2)。
接著,模式識(shí)別設(shè)備從估計(jì)值QK(K=1,…,K)得到用于每個(gè)基準(zhǔn)特征劃分元件“Ri”的候選種類集“Di”。然后,模式識(shí)別設(shè)備把各個(gè)基準(zhǔn)特征劃分元素“Rj”和候選種類集“Di”的組合存儲(chǔ)到候選表中(步驟S4),并結(jié)束處理。
圖16是一個(gè)流程圖,表示在圖15的步驟S2中進(jìn)行的估計(jì)基準(zhǔn)特征投影的處理。一旦開始該處理時(shí),模式識(shí)別設(shè)備首先為屬于種類“CK”的每個(gè)學(xué)習(xí)模式得到基準(zhǔn)特征向量“r”,并生成各基準(zhǔn)特征向量“r”的集“FK”(步驟S11)。
拉著,模式識(shí)別設(shè)備得到集“FK”的元件的最小值“MINK”和最大值“MAXK”(步驟S12),并且把閉區(qū)間〔MINK,MAXK〕設(shè)成估計(jì)值“QK”(步驟S13),并且把控制回送給圖15的處理。如果考慮一個(gè)裕量“M”,可把閉區(qū)間〔MINK-M,MAXK+M〕設(shè)成估計(jì)值“QK”。
圖17是一個(gè)流程,表示圖15的步驟S3中進(jìn)行的生成候選種類集的處理。一旦開始處理,模式識(shí)別設(shè)備把候選種類集“Di”的初始值識(shí)別為一個(gè)空集中(步驟S21),把控制變量“k”設(shè)成“1”(步驟S22),并得到基準(zhǔn)特征投影“QK”和基準(zhǔn)特征劃分元素“Ri”的交集“X”(步驟S23)。
接著模式識(shí)別設(shè)備判定交集“X”是否是一個(gè)空集(步驟S24)。若不是空集,模式識(shí)別設(shè)備把對(duì)應(yīng)于估計(jì)值“QK”的種類“CK”增添到候選種類集“Di”中(步驟S25),并把“k”的值和“K”比較(步驟S26)。如果“k”的值小于“K”,則模式識(shí)別設(shè)備對(duì)“k”值遞增1(步驟S27),并重復(fù)S23中及之后的處理。
若在步驟S24中交集“X”是空集,模式識(shí)別設(shè)備不向候選種類集“Di”增添種類“CK”而是立即進(jìn)行步驟S26的處理。當(dāng)“k”的值在步驟S26中達(dá)到“K”時(shí),模式識(shí)別設(shè)備把控制回送給圖15的處理。以這種方式,其中基準(zhǔn)特征劃分元素“Ri”和基準(zhǔn)特征投影“QK”共享一個(gè)部分的種類“CK”毫無(wú)例外地增添到候選種類集“Di”中。這個(gè)處理是對(duì)每個(gè)基準(zhǔn)特征劃分元素“Ri”都進(jìn)行的。
圖18是一個(gè)流程圖,表示利用Voronoi分區(qū)生成候選表的處理。圖18所示的流程圖涉及一維基準(zhǔn)特征空間的情況。但是,該流程也可應(yīng)用于更高維數(shù)的基準(zhǔn)特征空間的情況。
一旦開始處理,模式識(shí)別設(shè)備在基準(zhǔn)特征空間對(duì)i=0,1,…,L得到基準(zhǔn)特征劃分元素Ri=(Si-i,Si)(步驟S31)。接著,模式識(shí)別設(shè)備通過利用線性規(guī)劃方法基于特征空間中的Voronoi分區(qū)為每個(gè)種類Ck(k=1,…,K)得到基準(zhǔn)特征投影的估計(jì)值QK=〔MINK,MAXK〕(步驟S32)。
接著,模式識(shí)別設(shè)備按類似于圖17所示的生成候選種類集的處理方式從估計(jì)值QK(k=1,…,K)得到對(duì)應(yīng)于各個(gè)基準(zhǔn)特征劃分元素“Ri”的候選種類集“Di”(步驟S33)。設(shè)備把每個(gè)基準(zhǔn)特征劃分元素“Ri”和候選種類集“Di”的組合存儲(chǔ)到候選表里(步驟S34),并結(jié)束處理。
圖19是一個(gè)流程圖,表示圖18的步驟S32中進(jìn)行的估計(jì)基準(zhǔn)特征投影的處理。一旦開始處理,模式識(shí)別設(shè)備得到一個(gè)平面方程(等距平面),其與對(duì)應(yīng)于登記在字典中的種類“CK”的代表特征向量“EK”和對(duì)應(yīng)于別的種類Cj(j=1,…,K;j≠k)的代表特征向量“Ej”是等距的(步驟S41)。但請(qǐng)注意,在本情況下特征空間是N維空間。
當(dāng)在特征空間中把歐氏距離用作距離時(shí),Voronoi分區(qū)“VK”將成為特征空間中的一個(gè)超凸多面體,可以把它認(rèn)為是特征空間中由多個(gè)超平面構(gòu)成的一個(gè)子集。因此,其為一個(gè)對(duì)兩個(gè)代表向量等距的平面的超平面可以用一個(gè)線性方程表示,在該線性方程中特征向量f=(f1,f2,…,fN)充當(dāng)變量。
接著,模式識(shí)別設(shè)備通過利用已得到的超平面方程得到Voronoi分區(qū)“VK”對(duì)種類“CK”滿足的聯(lián)立線性不等方程組(步驟S42)。聯(lián)立線性不等方程組例如按如下表示
接著,設(shè)備把特征向量“f”和方向向量h=(h1,h2,…,hN)的內(nèi)積識(shí)別為一維基準(zhǔn)特征向量(基準(zhǔn)特征)“r”(步驟S43)。此時(shí),基準(zhǔn)特征向量“r”將變?yōu)槿缦聄=h1f1+h2f2+…+hNfN即,基準(zhǔn)特征“r”是用特征向量“f”的元素的線性組合表示的。
最后,獲得基準(zhǔn)特征投影QK的問題是一個(gè)得到滿足上述線性不等方程組的線性組合“r”的最小值和最大值的線性規(guī)劃問題。該問題可用周知的線性規(guī)劃方法求解。
從而,模式識(shí)別設(shè)備利用線性規(guī)劃方法在已得到的聯(lián)立不等式的限制下得到基準(zhǔn)特征“r”的最小值“MINK”和最大值“MAXK”(步驟S44),把閉區(qū)間〔MINK,MAXK〕識(shí)別成基準(zhǔn)特征投影的估計(jì)值“QK”(步驟S45),并把控制回送給圖18的處理。
此處,為估計(jì)處理采用線性規(guī)劃方法。通常,可以用非線性規(guī)劃方法得到一維區(qū)間中的最小值和最大值。在該情況下,例如把下面通過利用某個(gè)非線性函數(shù)“R”從特征向量的元素得到的值定義為基準(zhǔn)特征“r” 。
r=R(f1,f2,…,fN)這時(shí),Voronoi分區(qū)成為由特征空間中的超凸表面包圍的特征空間中的一個(gè)子集。因此,用于字符種類“CK”的Voronoi分區(qū)“VK”可用下述聯(lián)立非線性不等式組表示
最后,可知獲得基準(zhǔn)特性投影“QK”的問題是一個(gè)得到滿足上述聯(lián)立不等式組的基準(zhǔn)特征“r”的最小值和最大值的非線性規(guī)劃問題。由計(jì)算機(jī)進(jìn)行的非線性規(guī)劃問題的數(shù)值計(jì)算是周知的一種數(shù)學(xué)編程領(lǐng)域。通過這種計(jì)算求解這個(gè)問題。
在上述實(shí)施例中,為了得到候選種類采用一種類型的基準(zhǔn)特征向量。但是,可通過利用從一個(gè)特征向量計(jì)算出的多個(gè)基準(zhǔn)向量得到多個(gè)相應(yīng)的候選種類集,并且可輸出它們的邏輯積。
在這種情況下,設(shè)置多個(gè)對(duì)應(yīng)于不同基準(zhǔn)特征向量的候選表,并且對(duì)每個(gè)候選表配置一個(gè)候選種類計(jì)算單元。每個(gè)候選種類計(jì)算單元把一種特定類型的基準(zhǔn)特征向量的值作為輸入,對(duì)照相應(yīng)的候選表,并輸出相應(yīng)的候選種類集。另外,配置一個(gè)用于計(jì)算各候選種類集的邏輯積的候選種類篩選單元,以便在最后階段篩選候選種類及輸出篩選過的種類組。
圖20是一個(gè)示意圖,表示第四模式識(shí)別設(shè)備的結(jié)構(gòu),該設(shè)備利用二種類型的基準(zhǔn)特征向量在二級(jí)上計(jì)算候選種類。圖20所示的模式識(shí)別設(shè)備包括一個(gè)基準(zhǔn)特征向量計(jì)算單元81,候選表82和83,候選種類計(jì)算單元84和85,以及一個(gè)候選種類篩選單元86。
基準(zhǔn)特征向量計(jì)算單元81從一個(gè)輸入的N維特征向量“f”計(jì)算兩個(gè)基準(zhǔn)特征向量r1和r2。第一級(jí)的候選種類計(jì)算單元84把基準(zhǔn)特征向量r1作為輸入,并利用事先存儲(chǔ)的候選表82輸出候選種類集D1(r1)。第二級(jí)處的候選種類計(jì)算單元85把基準(zhǔn)特征向量r2作為輸入,并利用事先存儲(chǔ)的候選表83輸出候選種類集D2(r2)。
候選種類篩選單元86利用兩個(gè)候選種類集D1(r1)和D2(r2),得到它們的積D1(r1)∩D2(r2),并且把得到的積輸出為最終候選種類集。
基準(zhǔn)特征向量計(jì)算單元81例如分別把特征向量“f”的第一元素f1輸出為一維基準(zhǔn)特征向量r1,把特征向量“f”的第二元素f2輸出為一維基準(zhǔn)特征向量r2。假定各個(gè)基準(zhǔn)特征向量值的范圍是A1≤r1<B1及A2≤r2<B2,區(qū)間〔A1,B1)和〔A2,B2)分別成為第一和第二基準(zhǔn)特征空間。
這里,假定把各個(gè)基準(zhǔn)特征空間劃分為網(wǎng)格,并把它們用作將成為候選表的元素的基準(zhǔn)特征劃分元素。因?yàn)榛鶞?zhǔn)特征空間〔A1,B1)和〔A2,B2)都一維的,它們分別劃分為L(zhǎng)1個(gè)和L2個(gè)區(qū)間,并且各個(gè)區(qū)間被定義為基準(zhǔn)特征劃分元素A1=s0<s1<s2<…<sL1=B1A2=t0<t1<t2<…<tL2=B2從而,基準(zhǔn)特征空間〔A1,B1)中的各個(gè)區(qū)間〔Si-1,Si)將成為用于基準(zhǔn)特征向量r1的基準(zhǔn)特征劃分元素R1j,其中j=1,…,L1。同時(shí),基準(zhǔn)特征空間〔A2,B2)中的各個(gè)區(qū)間〔tj-1,tj)將成為用于基準(zhǔn)特征向量r2的基準(zhǔn)特征劃分元素R2j,其中j=1,…,L2。
通過利用學(xué)習(xí)特征向量集估計(jì)用于各個(gè)種類的基準(zhǔn)特征投影得到各個(gè)基準(zhǔn)特征劃分元素R1i和R2j和各個(gè)候選種類集。假定學(xué)習(xí)特征向量集包括足夠數(shù)量屬于各個(gè)種類的特征向量。下面說(shuō)明為某特定種類“CK”估計(jì)基準(zhǔn)特征投影的方法。
首先,從屬于學(xué)習(xí)特征向量集中的種類“CK”的特征向量集得到的特性向量的第一元素“f1”的集F1K。集F1K形成一種近似于種類“CK”的第一基準(zhǔn)特征投影的分布。得到集“F1K”的元素的最小值MIN(F1K)和最大值MAX(F1K),并在考慮一特定的裕度“M”下把種類“CK”的第一基準(zhǔn)特征投影的估計(jì)值“Q1K”定義為Q1K=〔MIN(F1K)-M,MAX(F1K)+M〕并且以類似的方式估計(jì)第二基準(zhǔn)特征投影。首先,從屬于學(xué)習(xí)特征向量集中的種類“CK”的特征向量集得到特征向量的第二元素“f2”的集F1K。集“F2K”形成一種近似于種類“CK”的第二基準(zhǔn)特征投影的分布。得到集“F2K”的元素的最小值MIN(F2K)和最大值MAX(F2K),并在考慮一特定的裕度“M”下把種類“CK”的第二基準(zhǔn)特征投影的估計(jì)值Q2K定義為Q2K=〔MIN(F2K)-M,MAX(F2K)+M〕接著,根據(jù)下述過程利用各個(gè)種類“CK”的基準(zhǔn)特征投影Q1K和Q2K得到和各個(gè)基準(zhǔn)特征劃分元素R1i和R2j組合的候選種類集D1(r1)=D1j和D2(r2)=D2j。
把其中基準(zhǔn)特征劃分元素R1i和對(duì)應(yīng)的基準(zhǔn)特征投影Q1K共享著一個(gè)部分的種類“CK”的集假定成是用于基準(zhǔn)特征劃分元素R1i的候選種類集D1i。基于該假定,可以列出其特征向量具有屬于基準(zhǔn)特征劃分元素R1i的基準(zhǔn)特征向量的值的種類,并且成為候選種類集D1i。
類似地,把其中基準(zhǔn)特征劃分元素“R2j”和對(duì)應(yīng)的基準(zhǔn)特征投影“Q2K”共享著一個(gè)部分的種類“CK”的集假定成是用于基準(zhǔn)特征劃分元素R2j的候選種類集D2j?;谠摷俣?,可以列出其特征向量具有屬于基準(zhǔn)特征劃分元素R2j的基準(zhǔn)特征向量的值的種類,并且成為候選種類集D2j。
候選種類計(jì)算單元84所參考的候選表82是用基準(zhǔn)特征劃分元素R1i和候選種類集D1j的組合構(gòu)成的。類似地,候選種類計(jì)算單元83所參考的候選表83是用基準(zhǔn)特征劃分元素R2j和候選種類集D2j的組合構(gòu)成的。
如果基準(zhǔn)特征向量的給定值是“r1”,候選種類計(jì)算單元84首先得到值r1所屬于的基準(zhǔn)特征劃分元素R1i。接著,該單元通過利用候選表82得到對(duì)應(yīng)于基準(zhǔn)特征劃分元素R1i的候選種類集D1i,并輸出得到的該集。輸出的候選種類集D1i預(yù)期包含著輸入特征向量屬于的種類。
類似地,如果基準(zhǔn)特征向量的給定值是“r2”,候選種類計(jì)算單元85首先得到值r2所屬于的基準(zhǔn)特征劃分元素R2j。接著,該單元通過利用候選表83得到對(duì)應(yīng)于基準(zhǔn)特征劃分元素R2j的候選種類集D2j,并輸出得到的該集。輸出的候選種類集D2j預(yù)期包含著輸入特征向量屬于的種類。
然后,候選種類篩選單元86得到兩個(gè)候選種類集D1i和D2j的積D1i∩D2j,并把該積識(shí)別為最終候選種類集??梢灶A(yù)計(jì)從候選種類篩選單元86輸出的候選種類集仍包含著輸入特征向量所屬于的種類。該候選種類集的元素?cái)?shù)量要比原始兩個(gè)候選種類集D1i和D2j的元素?cái)?shù)量少。因此,候選種類篩選單元86確定用作為最終級(jí)的篩選候選種類集。
因?yàn)榘凑者@種模式識(shí)別設(shè)備使用兩個(gè)一維基準(zhǔn)特征向量,和采用單個(gè)一維特征向量的情況相比可減少候選種類的數(shù)量。而且,和采用單個(gè)二維基準(zhǔn)特征向量的情況相比,明顯減少基準(zhǔn)特征劃分元素的數(shù)量,從而減少候選表所需的存儲(chǔ)容量。
通過如上述利用多個(gè)相對(duì)低維數(shù)的基準(zhǔn)特征向量,在存儲(chǔ)容量切實(shí)充足下可以實(shí)現(xiàn)以高精度快速識(shí)別模式的模式識(shí)別設(shè)備。這種得到多個(gè)候選種類集的處理可以串行進(jìn)行。但是,若并行進(jìn)行可以進(jìn)一步減少處理時(shí)間。
同時(shí),下面將說(shuō)明為什么根據(jù)本發(fā)明的模式識(shí)別設(shè)備幾乎不降低識(shí)別精度的原因。按照本發(fā)明在進(jìn)行高速分類之后,為了鑒別輸入模式的種類,正常地和追加地利用對(duì)原始特征向量的距離計(jì)算進(jìn)行細(xì)致分類。
識(shí)別精度的降低為“0”的現(xiàn)象意味著輸出的候選種類集的累積識(shí)別精度保證(不降低)在以后的級(jí)中進(jìn)行的細(xì)致分類的精度。累積積別精度表示任何候選種類集包括著輸入模式的真實(shí)種類的可能性。理想上,希望累積識(shí)別精度為100%。
實(shí)際上,并不總是需要把輸出的候選種類集的累積識(shí)別精度置為100%。累積識(shí)別精度等于或者高于在后面的級(jí)中進(jìn)行的細(xì)致分類的精度就夠了。因此,通過在候選表中登記包括足夠數(shù)量的候選種類的候選種類集可以實(shí)現(xiàn)其精度下降實(shí)際上為“0”的模式識(shí)別設(shè)備。
如果真實(shí)種類未包括在候選種類集中,即,如果出現(xiàn)分類誤差,類似的分類誤差有可能在細(xì)致分類階段發(fā)生。從而,最終的累積識(shí)別精度沒有什么差別。在這個(gè)意義上,根據(jù)本發(fā)明的高速分類明智地利用細(xì)致分類所施加的限制,從而在不降低精度的前提下實(shí)現(xiàn)高速分類。
按照本發(fā)明的基準(zhǔn)特征向量并不必須是如上所述的部分特征向量。任何可由特征向量計(jì)算出的向量可充當(dāng)基準(zhǔn)特征向量。例如,由圖1所示的模式識(shí)別設(shè)備采用的壓縮特征向量就是一種類型。
圖21是一個(gè)示意圖,表示第五模式識(shí)別設(shè)備的結(jié)構(gòu),該設(shè)備把壓縮特征向量用為基準(zhǔn)特征向量以得到候選種類集,并對(duì)得到的候選種類集進(jìn)行細(xì)致分類。圖21所示的模式識(shí)別設(shè)備21包括特征抽取單元91、特征壓縮單元92、候選種類計(jì)算單元93、細(xì)分類執(zhí)行單元94、候選表95和字典96。
特征抽取單元91從輸入模式抽取特征向量。特征壓縮單元92對(duì)特征向量進(jìn)行適當(dāng)?shù)淖儞Q以生成維數(shù)較少的壓縮特征向量。候選種類計(jì)算單元93參照候選表95,并得到對(duì)應(yīng)于給定壓縮特征向量的候選種類集。
細(xì)分類執(zhí)行單元94對(duì)候選種類計(jì)算單元93輸出的候選種類集中的每個(gè)候選種類計(jì)算存儲(chǔ)在字典96中的代表特征向量和輸入模式1的特征向量之間的距離。然后,細(xì)分類執(zhí)行單元94按距離的升序分類候選種類,并且從距離為最短的種類開始輸出規(guī)定數(shù)量的序列。
借助這種模式識(shí)別設(shè)備,通過適當(dāng)?shù)剡x擇用于壓縮特征的變換方法可以生成所需的基準(zhǔn)特征向量,而且通過利用對(duì)應(yīng)的候選表可以更有效地篩選候選種類集。另外,壓縮特征后所產(chǎn)生的壓縮特征向量不直接用于計(jì)算距離,而是充當(dāng)查閱候選表的值。由此,從原理上看不會(huì)降低處理精度。
圖22是一個(gè)示意圖,表示第六模式識(shí)別設(shè)備的結(jié)構(gòu),該設(shè)備通過把壓縮特征向量作為基準(zhǔn)特征向量以得到候選種類集,并且進(jìn)行粗分類和細(xì)分類。圖22所示的模式識(shí)別設(shè)備包括特征抽取單元101、特征壓縮單元102、候選種類計(jì)算單元103、粗分類執(zhí)行單元104、細(xì)分類執(zhí)行單元105、候選表106、壓縮特征字典107和字典108。
特征抽取單元101、特征壓縮單元102、候選種類計(jì)算單元103以及候選表106的性能類似于圖21所示的特征抽取單元91、特征壓縮單元92、候選種類計(jì)算單元93和候選表95的性能。
粗分類執(zhí)行單元104對(duì)候選種類計(jì)算單元103輸出的候選種類集中的每個(gè)候選種類計(jì)算存儲(chǔ)在壓縮特征字典107中的壓縮特征向量和輸入模式的壓縮特征向量之間的距離。粗分類執(zhí)行單元104按距離的升序分類候選種類,并從距離最短的種類開始把預(yù)定數(shù)量的種類序列輸出為候選種類集。
細(xì)分類執(zhí)行單元105對(duì)粗分類執(zhí)行單元104輸出的候選種類集中的每個(gè)候選種類計(jì)算存儲(chǔ)在字典108中的代表特征向量和輸入模式的特征向量之間的距離。細(xì)分類執(zhí)行單元105按距離的升序分類候選種類,并從距離最短的種類開始輸出預(yù)定數(shù)量的種類序列。
借助這種模式識(shí)別設(shè)備,粗分類執(zhí)行單元104篩選從候選種類計(jì)算單元103輸出的候選種類集,并且把篩選后的集傳送到細(xì)分類執(zhí)行單元105。因此,瞄向細(xì)分類的候選種類得到進(jìn)一步的限制,從而改善處理速度。
按照?qǐng)D21和22所示的模式識(shí)別設(shè)備,不改變地把壓縮特征向量用作為基準(zhǔn)特征向量。但是可把壓縮特征向量的部分特征向量用作基準(zhǔn)特征向量。在這種情況下,進(jìn)一步減少基準(zhǔn)特征向量的維數(shù)并且改善處理速度。
對(duì)于從特征向量生成壓縮特征向量的變換,可使用線性變換。因?yàn)榫€性變換通過進(jìn)行相對(duì)簡(jiǎn)單的計(jì)算,即變換矩陣和向量相乘來(lái)壓縮特征向量,它的計(jì)算效率高于非線性變換。至于利用線性變換壓縮特性的方法,正則判別分析、主分量分析等是周知的方法。
利用正則判別分析,從各種種類提供的樣本模式的N維特征向量計(jì)算一個(gè)互種類方差矩陣和一個(gè)內(nèi)種類方差矩陣,并且利用這些方差矩陣得到本征向量。這樣,選擇“M”個(gè)(M<N)本征向量并定義一個(gè)M維空間。若輸入一個(gè)未知的模式,計(jì)算其特征向量和各個(gè)本征向量的內(nèi)積,從而生成其元素是內(nèi)積的計(jì)算結(jié)果的M維壓縮特征向量。
依靠這種分析方法,N維平均特征向量投影到由“M”個(gè)本征向量規(guī)定的“M”個(gè)坐標(biāo)軸上,從而使互種類散布變大和使內(nèi)種類散布變小。借助這種處理,進(jìn)行變換,從而在特征壓縮之后不同類型的模式分離而相同類型的模式靠近在M維空間中。
另一方面,借助主分量分析,為各個(gè)種類計(jì)算主分量向量的組合從而使各種種類分離。接著,為每個(gè)種類生成其中把主分量向量用作為其坐標(biāo)軸的另一個(gè)新空間,并且通過把輸入模式的特征向量投影到各個(gè)種類的主分量向量上生成壓縮特征向量。通過利用壓縮特征向量計(jì)算輸入模式和各個(gè)種類之間的距離。
依靠這種分析方法,如果在特征空間的閉區(qū)域中存在相似的種類,通過把要識(shí)別的模式的特征向量投影到對(duì)應(yīng)于每個(gè)種類的主分量向量中可以得到更準(zhǔn)確的識(shí)別結(jié)果。該方法主要用于識(shí)別具有少數(shù)種類的相似字符模式。
在上面所說(shuō)明的實(shí)施例中,對(duì)于生成Voronoi分區(qū)的處理以及對(duì)于進(jìn)行候選種類的粗、細(xì)分類的處理都必須計(jì)算向量間的距離。此時(shí),除了常規(guī)歐氏距離之外還可以定義和使用任何距離。例如,可采用周知的各種距離,如城市街區(qū)距離、Mahalanobis距離、修正Mahalanobis距離、Bayes(貝葉斯)判別函數(shù)、修正Bayes判別函數(shù)等。
這里,把向量g=(g1,g2,…,gn)和向量p=(P1,P2,…,pn)之間的距離定義為城市街區(qū)距離DCB(g,p)=Σi=1n|gi-pi|]]>Mahalanobis距離Dm(g,p)=(g-p)TΣj-1(g-p)]]>其中“p”是某特定種類的各學(xué)習(xí)模式“Pi”(i=1,2,…,N)的平均,而“∑j1”是由下列方程式定義的協(xié)方差矩陣(也稱為方差矩陣)∑j=(1/N)∑(Pi-P)(Pi-P)T假定∑j的本征值為λ1,λ2,…,λn,(λ1>λ2>…>λn),對(duì)應(yīng)的本征向量分別為Φ1,Φ2,…Φn,則Φ=(Φ1,Φ2,…,Φn)、Dm(g,p)可按如下表示 Dm2(g,p)=Σi=1n(φT(g-p))2λi]]>注意λi=λ(常數(shù))(m<<n,M+1≤i≤n)修正Mahalanobis距離是為了克服Mahalanobis距離的實(shí)際問題(計(jì)算量和精度)而提出的,并且基于后面描述的修正Bayes判別函數(shù)的概念。
〔Bayes判別函數(shù)〕f(g)=(g-p)T∑-1(g-p)+|n|∑|Bayes判別函數(shù)(二次判別函數(shù))表示向量“g”和“p”之間的距離。若目標(biāo)按正態(tài)分布并已知特征向量的平均值及協(xié)方差矩陣時(shí)它是最優(yōu)判別函數(shù)。f2(g)=Σi=1k{ΦiT(g-p)}2λi]]>+Σi=k+1n{ΦiT(g-p)}2λk+1]]>+ln(Πi=1kλi•Πi=k+1nλk+1)]]>修正Bayes判別函數(shù)是一種函數(shù),當(dāng)要辯別復(fù)雜的字符模式等時(shí)用來(lái)克服高維本征向量的計(jì)算精度問題。
這些距離基于種類特征集的分布是正態(tài)分布的并且每種種類的出現(xiàn)概率相等的假設(shè)。若各個(gè)種類的分布的協(xié)方差矩陣相同,基于Mahalanobisk距離修正Mahalanobis距離進(jìn)行細(xì)致分類。若協(xié)方差矩陣不同,即它們是普通的,基于修正Bayes判別函數(shù)進(jìn)行細(xì)致分類。
本發(fā)明不僅可應(yīng)用于字符模式,并且也是一種用于識(shí)別任何模式例如二維圖形、三維物體和人臉圖象的技術(shù)。
根據(jù)本發(fā)明,在識(shí)別任何模式的處理中利用候選表允許把識(shí)別精度的下降遏止為最少并使種類分類更快速。尤其,如果基于和登記在字典中用于細(xì)分類的種類相似的分區(qū)生成候選表,有可能防止細(xì)分類精度的下降。
權(quán)利要求
1.一種模式識(shí)別設(shè)備,包括表存儲(chǔ)裝置,用于存儲(chǔ)說(shuō)明生成一種變換所需信息的候選表,該變換的輸入是從模式的特征向量計(jì)算出的基準(zhǔn)特征向量的值,其輸出是候選種類集;以及候選種類計(jì)算裝置,通過使用候選表得到對(duì)應(yīng)于給定基準(zhǔn)特征向量的值的候選種類集,并輸出得到的候選種類集。
2.根據(jù)權(quán)利要求1的模式識(shí)別設(shè)備,還包括基準(zhǔn)特征向量計(jì)算裝置,用于從模式的特征向量計(jì)算基準(zhǔn)特征向量。
3.根據(jù)權(quán)利要求2的模式識(shí)別設(shè)備,其中所述基準(zhǔn)特征向量計(jì)算裝置把模式的特征向量的一個(gè)或多個(gè)部分特征向量輸出為一個(gè)或多個(gè)基準(zhǔn)特征向量。
4.根據(jù)權(quán)利要求1的模式識(shí)別設(shè)備,其中所述表存儲(chǔ)裝置通過利用把由基準(zhǔn)特征向量的值的集構(gòu)成的基準(zhǔn)特征空間劃分成兩個(gè)或多個(gè)空間,以作為基準(zhǔn)特征劃分元素而得到的各個(gè)子集,存儲(chǔ)包含著關(guān)于基準(zhǔn)特征劃分元素和候選種類集組合的信息的候選表;以及所述候選種類計(jì)算裝置得到包含著給定基準(zhǔn)特征向量的值的基準(zhǔn)特征劃分元素并通過利用候選表得到和已獲得的基準(zhǔn)特征劃分元素對(duì)應(yīng)的候選種類集。
5.根據(jù)權(quán)利要求4的模式識(shí)別設(shè)備,其中所述表存儲(chǔ)裝置存儲(chǔ)關(guān)于通過以網(wǎng)格方式劃分基準(zhǔn)特征空間而得到的基準(zhǔn)特征劃分元素的信息。
6.根據(jù)權(quán)利要求4的模式識(shí)別設(shè)備,其中所述表存儲(chǔ)裝置存儲(chǔ)通過估計(jì)對(duì)應(yīng)于每個(gè)種類的特征向量集在基準(zhǔn)特征空間中的投影的范圍及利用所得到的估計(jì)值而生成的候選表。
7.根據(jù)權(quán)利要求6的模式識(shí)別設(shè)備,其中當(dāng)基準(zhǔn)特征劃分元素和估計(jì)值共享一個(gè)部分時(shí),通過把對(duì)應(yīng)于估計(jì)值的種類用作為對(duì)應(yīng)于基準(zhǔn)特征劃分元素的候選種類集中的元素生成所述候選表。
8.根據(jù)權(quán)利要求6的模式識(shí)別設(shè)備,其中通過得到作為投影到對(duì)應(yīng)于各個(gè)種類的一維基準(zhǔn)特征空間的估計(jì)值的一維基準(zhǔn)特征向量的最小值和最大值生成所述候選表。
9.根據(jù)權(quán)利要求6的模式識(shí)別設(shè)備,其中所述候選表是基于通過利用線性規(guī)則方法得到的估計(jì)值生成的。
10.根據(jù)權(quán)利要求6的模式識(shí)別設(shè)備,其中所述候選表是基于通過利用非線性規(guī)劃法得到的估計(jì)值生成的。
11.根據(jù)權(quán)利要求6的模式識(shí)別設(shè)備,其中候選表是基于通過利用從一組供學(xué)習(xí)的模式集獲得的基準(zhǔn)特征向量的值的分布得到的估計(jì)值生成的。
12.根據(jù)權(quán)利要求6的模式識(shí)別設(shè)備,其中所述候選表是基于通過把基于登記在字典中的各個(gè)種類的代表特征向量的特征空間里的Voronoi分區(qū)元素在基準(zhǔn)特征空間投影所得到的估計(jì)值生成的。
13.根據(jù)權(quán)利要求1的模式識(shí)別設(shè)備,還包括特征抽取裝置,用于從輸入模式生成模式的特征向量。
14.根據(jù)權(quán)利要求1的模式識(shí)別設(shè)備,還包括字典存儲(chǔ)裝置,用于存儲(chǔ)登記各個(gè)種類的代表特征向量的細(xì)分類字典;以及細(xì)分類執(zhí)行裝置,用于利用細(xì)分類字典得到包含在候選種類集中的每個(gè)候選種類的代表特征向量,用于得到每個(gè)候選種類的代表特征向量和模式的特征向量之間的距離,及用于按距離的升序輸出預(yù)定數(shù)量的候選種類。
15.根據(jù)權(quán)利要求1的模式識(shí)別設(shè)備,還包括特壓縮裝置,用于對(duì)模式的特征向量進(jìn)行預(yù)定的變換并得到低維的壓縮特征向量,其中所述候選種類計(jì)算裝置利用從給定壓縮特征向量的值計(jì)算出的基準(zhǔn)特征向量的值得到候選種類集。
16.根據(jù)權(quán)利要求15的模式識(shí)別設(shè)備,其中所述候選種類計(jì)算裝置把壓縮特征向量的部分特征向量用作基準(zhǔn)特征向量。
17.根據(jù)權(quán)利要求15的模式識(shí)別設(shè)備,還包括字典存儲(chǔ)裝置,用于存儲(chǔ)登記各個(gè)種類的壓縮特征向量的壓縮特征字典;以及粗分類執(zhí)行裝置,用于利用壓縮特征字典得到各個(gè)候選種類的壓縮特征向量,用于得到各個(gè)候選種類的壓縮特征向量和從所述特征壓縮裝置輸出的壓縮特征向量之間的距離,及用于按距離的升序輸出預(yù)定數(shù)量的候選種類。
18.根據(jù)權(quán)利要求17的模式識(shí)別設(shè)備,其中所述粗分類執(zhí)行裝置利用歐氏距離、城市街區(qū)距離、Mahalanobis距離、修正Mahalanobis距離、Bayes判別函數(shù)及修正Bayes判別函數(shù)中的一種作為對(duì)距離的定義。
19.根據(jù)權(quán)利要求17的模式識(shí)別設(shè)備,還包括字典存儲(chǔ)裝置,用于存儲(chǔ)登記各個(gè)種類的代表特征向量的細(xì)分類字典;以及細(xì)分類執(zhí)行單元,用于通過利用細(xì)分類字典得到從所述粗分類執(zhí)行裝置輸出的各候選種類的代表特征向量,用于得到各候選種類的代表特征向量和模式的特征向量之間的距離,及用于按升序的距離輸出預(yù)定數(shù)量的候選種類。
20.根據(jù)權(quán)利要求19的模式識(shí)別設(shè)備,其中所述細(xì)分類執(zhí)行裝置把歐氏距離、城市街區(qū)距離、Mahalanobis距離、修正Mahalanobis距離、Bayes判別函數(shù)及修正Bayes判別函數(shù)中的一種作為距離的定義。
21.根據(jù)權(quán)利要求15的模式識(shí)別設(shè)備,其中所述特征壓縮裝置利用線性變換生成壓縮特征向量。
22.根據(jù)權(quán)利要求21的模式識(shí)別設(shè)備,其中所述特征壓縮裝置通過利用特征空間中的主分量分析得到線性變換。
23.根據(jù)權(quán)利要求21的模式識(shí)別設(shè)備,其中所述特征壓縮裝置通過利用特征空間中的正則判別分析得到線性變換。
24.根據(jù)權(quán)利要求1的模式識(shí)別設(shè)備,其中模式對(duì)應(yīng)于字符、人臉、三維物體和二維圖形中的至少一種類型的信息。
25.一種模式識(shí)別設(shè)備,包括多個(gè)表存儲(chǔ)裝置,各用于存儲(chǔ)說(shuō)明生成一種變換所需信息的候選表,該變換的輸入是從模式的特征向量計(jì)算出的基準(zhǔn)特征向量值,其輸出是候選種類集;多個(gè)候選種類計(jì)算裝置,分別配置給所述多個(gè)表存儲(chǔ)裝置,各用于通過使用候選表得到對(duì)應(yīng)于給定基準(zhǔn)特征向量的值的候選種類集并輸出得到的候選種類集;以及種類篩選裝置,用于篩選從所述多個(gè)候選種類計(jì)算裝置輸出的多個(gè)候選種類集并輸出篩選結(jié)果。
26.根據(jù)權(quán)利要求25的模式識(shí)別設(shè)備,其中所述種類篩選裝置計(jì)算多個(gè)候選種類集的邏輯積并篩選多個(gè)候選種類集。
27.一種模式識(shí)別設(shè)備,包括存儲(chǔ)裝置,用于存儲(chǔ)表示模式的特征的特征量數(shù)據(jù)和候選種類集之間的對(duì)應(yīng)關(guān)系,以及候選種類計(jì)算裝置,用于通過該對(duì)應(yīng)關(guān)系得到對(duì)應(yīng)于給定特征量數(shù)據(jù)的候選種類集并且輸出得到的候選種類集。
28.一種計(jì)算機(jī)可讀的存儲(chǔ)介質(zhì),當(dāng)其由計(jì)算機(jī)使用時(shí)用于使計(jì)算機(jī)執(zhí)行下述操作通過利用說(shuō)明生成一種變換的所需信息的候選表得到對(duì)應(yīng)于給定基準(zhǔn)特征向量的值的候選種類集,該變換的輸入是從模式的特征向量計(jì)算出的基準(zhǔn)特征向量的值,其輸出是候選種類集;以及輸出得到的候選種類集。
29.一種計(jì)算機(jī)可讀的存儲(chǔ)介質(zhì),當(dāng)其由計(jì)算機(jī)使用時(shí)用于使計(jì)算機(jī)執(zhí)行下述操作通過利用表示模式的特征的特征量數(shù)據(jù)和候選種類表之間的對(duì)應(yīng)關(guān)系得到對(duì)應(yīng)于給定特征量數(shù)據(jù)的候選種類集;以及輸出得到的候選種類集。
30.一種模式識(shí)別方法,包括步驟通過利用說(shuō)明生成一種變換的所需信息的候選表得到對(duì)應(yīng)于給定基準(zhǔn)特征向量的值的候選種類集,該變換的輸入是從模式的特征向量計(jì)算出的基準(zhǔn)特征向量的值,其輸出是候選種類集;以及輸出得到的候選種類集。
31.一種模式識(shí)別方法,包括步驟通過利用表示模式的特征的特征量數(shù)據(jù)和候選種類集之間的對(duì)應(yīng)關(guān)系得到對(duì)應(yīng)于給定特征量數(shù)據(jù)的候選種類集;以及輸出得到的候選種類集。
全文摘要
通過在候選表中說(shuō)明的變換,從輸入模式的特征向量計(jì)算出的基準(zhǔn)特征向量的值變換為候選種類集。然后,利用候選種類集進(jìn)行模式識(shí)別。通過適當(dāng)設(shè)定變換,在保持識(shí)別精度的同時(shí)進(jìn)行高速處理。
文檔編號(hào)G06K9/68GK1190764SQ97120419
公開日1998年8月19日 申請(qǐng)日期1997年10月9日 優(yōu)先權(quán)日1997年2月12日
發(fā)明者藤本克仁, 鐮田洋 申請(qǐng)人:富士通株式會(huì)社