欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

信息處理裝置和字符識別方法

文檔序號:6546022閱讀:168來源:國知局
信息處理裝置和字符識別方法
【專利摘要】一種字符識別方法和信息處理裝置,該信息處理裝置包括:存儲單元,其被配置成存儲其中字符的字符代碼和圖像數(shù)據(jù)彼此相關(guān)聯(lián)的第一信息;以及操作單元。操作單元被配置成:檢測指示通過手寫輸入而輸入的多個字符中的每個字符的輸入位置的第二信息,并且檢測與所述多個字符相關(guān)聯(lián)的多個字符代碼;通過參考第一信息來獲取與所述多個字符代碼相關(guān)聯(lián)的多個第一圖像數(shù)據(jù);通過基于第二信息對所述多個第一圖像數(shù)據(jù)進行組合來生成第二圖像數(shù)據(jù);以及通過參考第一信息來輸出與所述第二圖像數(shù)據(jù)相關(guān)聯(lián)的字符的圖像數(shù)據(jù)或者與該第二圖像數(shù)據(jù)相關(guān)聯(lián)的字符代碼。
【專利說明】信息處理裝置和字符識別方法

【技術(shù)領(lǐng)域】
[0001]本文所討論的實施方式涉及一種信息處理裝置、一種字符識別方法以及一種其中存儲有字符識別程序的存儲介質(zhì)。

【背景技術(shù)】
[0002]所謂的字符識別技術(shù)已投入使用。執(zhí)行字符識別的裝置接收由用戶使用輸入設(shè)備(例如觸摸面板或鼠標)輸入的字符的手寫輸入,并估計用戶打算輸入的字符的字符代碼。當(dāng)針對該字符代碼存在多個候選項時,裝置可以提示用戶選擇所述候選項中之一。字符識別技術(shù)中的問題之一在于需要提高字符的識別準確度。
[0003]例如,存在如下一種建議的方法:其中,在字符的輸入?yún)^(qū)域中形成多個輸入框,并將通過劃分單個漢字而獲得的多個部件(例如,編、旁、冠)輸入到每個輸入框。在所建議的技術(shù)中,將部件集與字符的對應(yīng)關(guān)系預(yù)先存儲在存儲模塊中,以對在每個輸入框中輸入的部件集與存儲在存儲模塊中的部件集進行比較,從而在顯示裝置中顯示包含在該框中輸入的部件集的字符。
[0004]另外,存在如下另一種建議的方法:其中,結(jié)合針對每一個筆畫先前輸入的筆畫數(shù)據(jù)來生成手寫輸入的筆畫數(shù)據(jù),針對每一個筆畫先前輸入的筆畫數(shù)據(jù)指示在手寫于手寫中輸入的字符時單次移動形成的線;并將該筆畫數(shù)據(jù)與由預(yù)先準備的筆畫數(shù)據(jù)組成的字典字符數(shù)據(jù)進行比較,以執(zhí)行字符識別,同時確定手寫輸入的筆畫數(shù)據(jù)與字典字符數(shù)據(jù)之間的相似度。當(dāng)手寫輸入的筆畫數(shù)據(jù)與字典字符數(shù)據(jù)的相似度變?yōu)榱銜r,將通過之前的一個筆畫的手寫輸入所生成的、手寫輸入的筆畫數(shù)據(jù)分割為單個字符,并將包含手寫輸入的筆畫數(shù)據(jù)的字典字符數(shù)據(jù)顯示為候選字符。
[0005]例如,參見日本特開平H7-121660號公報和日本特開平H11-134437號公報。
[0006]在上述方法中,針對待識別的每個目標字符,預(yù)先準備用于與部件集或筆畫數(shù)據(jù)進行比對的字典數(shù)據(jù)。然而,字符的數(shù)目龐大,因此不容易將所有字符采集到字典數(shù)據(jù)中。例如,字典數(shù)據(jù)的準備工作需要例如從多個用戶提取成為每個字符的樣本的多個筆畫信息以及將該筆畫信息登記在字典數(shù)據(jù)中的時間。因此,一些字符可能未被登記在字典數(shù)據(jù)中。例如,具有低使用頻率的一些字符(如異體字或外來字)可能未被登記在字典數(shù)據(jù)中。因此,如何高準確度地識別未登記在字典數(shù)據(jù)中的字符成為問題。
[0007]本公開內(nèi)容的一個方面旨在提供能夠高準確度地識別未登記在字典數(shù)據(jù)中的字符的程序、信息處理裝置和字符識別方法。


【發(fā)明內(nèi)容】

[0008]根據(jù)實施方式的一個方面,信息處理裝置包括:存儲單元,其被配置成存儲其中字符的字符代碼和圖像數(shù)據(jù)彼此相關(guān)聯(lián)的第一信息;以及操作單元。操作單元被配置成:檢測指示通過手寫輸入而輸入的多個字符中的每個字符的輸入位置的第二信息,并且檢測與所述多個字符相關(guān)聯(lián)的多個字符代碼;通過參考第一信息來獲取與所述多個字符代碼相關(guān)聯(lián)的多個第一圖像數(shù)據(jù);通過基于第二信息對所述多個第一圖像數(shù)據(jù)進行組合來生成第二圖像數(shù)據(jù);以及通過參考第一信息來輸出與所述第二圖像數(shù)據(jù)相關(guān)聯(lián)的字符的圖像數(shù)據(jù)或者與該第二圖像數(shù)據(jù)相關(guān)聯(lián)的字符代碼。
[0009]本公開內(nèi)容的目的和優(yōu)點將借助于權(quán)利要求中特別指出的元素和組合來實現(xiàn)和獲取。要理解的是,以上的一般描述和以下的詳細描述二者均為示例性和說明性的,并非如權(quán)利要求主張的那樣限制本發(fā)明。
[0010]根據(jù)本公開內(nèi)容的一個方面,可以高準確度地識別未登記在字典數(shù)據(jù)中的字符。

【專利附圖】

【附圖說明】
[0011]圖1是示出第一實施方式的信息處理裝置的視圖;
[0012]圖2是示出第二實施方式的客戶端設(shè)備的視圖;
[0013]圖3是示出客戶端設(shè)備的硬件的示例的視圖;
[0014]圖4是示出客戶端設(shè)備的功能的示例的視圖;
[0015]圖5是示出字符形狀表的示例的視圖;
[0016]圖6是示出字典表的示例的視圖;
[0017]圖7是示出輸入歷史表的示例的視圖;
[0018]圖8是示出相似度歷史表的示例的視圖;
[0019]圖9是示出組合表的示例的視圖;
[0020]圖10是示出字符識別過程的示例的流程圖;
[0021]圖11是示出字符識別過程的(延續(xù)的)示例的流程圖;
[0022]圖12A至圖12C是示出部件字符確定的具體示例的視圖;
[0023]圖13A至圖13D是示出部件字符確定的(延續(xù)的)具體示例的視圖;
[0024]圖14是示出經(jīng)變形的圖像數(shù)據(jù)的示例的視圖;
[0025]圖15A至圖15C是示出經(jīng)變形的圖像數(shù)據(jù)的合成的示例的視圖;以及
[0026]圖16是示出最終結(jié)果的輸出的示例的視圖。

【具體實施方式】
[0027][第一實施方式]
[0028]在下文中,將參照附圖詳細地描述本公開內(nèi)容中公開的顯示控制裝置、系統(tǒng)和顯示控制程序的示例性實施方式。此外,實施方式并非旨在限制所公開的技術(shù)。圖1是示出第一實施方式的信息處理裝置的視圖。第一信息處理裝置I對由用戶手寫輸入的字符執(zhí)行字符識別。例如,通過使用設(shè)置在第一信息處理裝置中的輸入設(shè)備,如觸摸面板、觸摸板或鼠標,用戶可以對該第一信息處理裝置執(zhí)行手寫輸入。輸入設(shè)備可以是第一信息處理裝置的外部連接設(shè)備。此處,可以將針對手寫輸入的字符在手寫中的單次移動形成的線條稱為筆畫。另外,可以將包含形成單個字符的筆畫集或書寫順序(筆畫的順序)的信息稱為筆畫信息。
[0029]第一信息處理裝置包括存儲單元Ia和操作單元lb。存儲單元Ia可以為:非易失性存儲設(shè)備,例如隨機存取存儲器(RAM);或者易失性存儲設(shè)備,例如硬盤驅(qū)動器(HDD)或閃速存儲器。操作單元Ib可以包括例如中央處理單元(CPU)、數(shù)字信號處理器(DSP)、專用集成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)。操作單元Ib可以為執(zhí)行程序的處理器。還可以包括多個處理器集(多處理器)作為“處理器”。
[0030]存儲單元Ia存儲其中字符的字符代碼和圖像數(shù)據(jù)彼此相關(guān)聯(lián)的字符形狀數(shù)據(jù)2。例如,字符形狀數(shù)據(jù)2包括:例如,字符代碼Al與圖像數(shù)據(jù)Xl (其指示字符“火”)之間的關(guān)聯(lián)關(guān)系;字符代碼A2與圖像數(shù)據(jù)X2(其指示字符“々”)之間的關(guān)聯(lián);字符代碼A3與圖像數(shù)據(jù)X3 (其表示字符“臼”)之間的關(guān)聯(lián);以及字符代碼A4與圖像數(shù)據(jù)X4 (其指示字符的異體字“焰”)之間的關(guān)聯(lián)。
[0031]此外,存儲單元Ia存儲其中字符代碼和參考筆畫信息彼此相關(guān)聯(lián)的字典數(shù)據(jù)3。例如,字典數(shù)據(jù)3包括:字符代碼Al與筆畫信息Px之間的關(guān)聯(lián);字符代碼A2與筆畫信息Py之間的關(guān)聯(lián);以及字符代碼A3與筆畫信息Pz之間的關(guān)聯(lián)。此處,關(guān)于字符代碼A4的筆畫信息未登記在字典數(shù)據(jù)3中。
[0032]操作單元Ib檢測如下位置信息:該位置信息指示由用戶通過手寫輸入而輸入的多個字符的輸入位置。例如,操作單元Ib基于手寫輸入的筆畫信息和存儲在存儲單元Ia中的字典數(shù)據(jù)3來檢測與多個輸入字符相關(guān)聯(lián)的多個字符代碼。
[0033]例如,操作單元Ib接收通過手寫輸入的輸入數(shù)據(jù)4。輸入數(shù)據(jù)4包括字符4a、4b和4c。字符4a、4b和4c中的每個字符是由通過用戶輸入的多個筆畫形成的。操作單元Ib檢測字符4a、4b和4c以及指示字符4a、4b和4c中的每個字符的輸入位置的位置信息。操作單元Ib可以將字符4a、4b和4c中的每個字符的筆畫信息與登記在字典數(shù)據(jù)3中的筆畫信息Px、Py和Pz中的每個筆畫信息進行比對,以檢測與字符4a、4b和4c相關(guān)聯(lián)的字符代碼 A1、A2 和 A3。
[0034]另外,操作單元Ib可以從字符形狀數(shù)據(jù)2中指定與字符4a、4b和4c相關(guān)聯(lián)的圖像數(shù)據(jù),以獲取用于字符4a、4b和4c的字符代碼A1、A2和A3。另外,操作單元Ib可以將從字符形狀數(shù)據(jù)2和字典數(shù)據(jù)3獲取的相應(yīng)字符代碼的候選項合并,以檢測與字符4a、4b和4c相關(guān)聯(lián)的字符代碼A1、A2和A3。例如,對于字符4a,可以從字符形狀數(shù)據(jù)2檢測到多個字符代碼的候選項,并且因此,可以從字典數(shù)據(jù)3檢測到多個字符代碼的候選項。在這種情況下,可以將通過字符形狀數(shù)據(jù)2與字典數(shù)據(jù)3 二者的比對而被確定為具有高準確度的字符代碼的候選項確定為字符4a的字符代碼。
[0035]操作單元Ib參考字符形狀數(shù)據(jù)2以獲取與多個所檢測到的字符代碼相關(guān)聯(lián)的多個第一圖像數(shù)據(jù)。例如,操作單元Ib參考字符形狀數(shù)據(jù)2以獲取用于字符代碼A1、A2和A3的圖像數(shù)據(jù)X1、X2和X3。
[0036]操作單元Ib基于所檢測到的位置信息來組合多個第一圖像數(shù)據(jù),以生成第二圖像數(shù)據(jù)。例如,操作單元Ib基于所檢測到的字符4a、4b和4c中的每個字符的位置信息來保持輸入字符4a、4b和4c之間的相對位置關(guān)系,以將圖像數(shù)據(jù)X1、X2和X3設(shè)置并形成為單個圖像數(shù)據(jù)來生成圖像數(shù)據(jù)5。
[0037]在此情況下,操作單元Ib可以分別對圖像數(shù)據(jù)X1、X2和X3進行變形以生成圖像數(shù)據(jù)5a、5b和5c。圖像數(shù)據(jù)5a是通過對圖像數(shù)據(jù)Xl進行變形而獲得的。圖像數(shù)據(jù)5b是通過對圖像數(shù)據(jù)X2進行變形而獲得的。圖像數(shù)據(jù)5c是通過對圖像數(shù)據(jù)X3進行變形而獲得的。
[0038]例如,可以基于字符4a的位置信息來指定指示字符4a的輸入?yún)^(qū)域的矩形,并且可以使圖像數(shù)據(jù)5a的縱橫比與該矩形的縱橫比相匹配。通過應(yīng)用相同的規(guī)則,將圖像數(shù)據(jù)X2變形為圖像數(shù)據(jù)5b。將圖像數(shù)據(jù)X3變形為圖像數(shù)據(jù)5c。另外,可以考慮使關(guān)于圖像數(shù)據(jù)X1、X2和X3中的每個圖像數(shù)據(jù)所指定的每個矩形的面積比與圖像數(shù)據(jù)5a、5b和5c中的每個圖像數(shù)據(jù)的面積比相匹配。通過這樣做,操作單元Ib可以組合通過對圖像數(shù)據(jù)X1、X2和X3進行變形而獲得的圖像數(shù)據(jù)5a、5b和5c以生成圖像數(shù)據(jù)5。
[0039]操作單元Ib參考字符形狀數(shù)據(jù)2以輸出與所生成的圖像數(shù)據(jù)相關(guān)聯(lián)的字符的圖像數(shù)據(jù)或與該圖像數(shù)據(jù)相關(guān)聯(lián)的字符代碼。例如,操作單元Ib輸出與圖像數(shù)據(jù)5相關(guān)聯(lián)的字符的圖像數(shù)據(jù)X4或與圖像數(shù)據(jù)X4相關(guān)聯(lián)的字符代碼A4。例如,操作單元Ib可以將圖像數(shù)據(jù)5與包含在字符形狀數(shù)據(jù)2中的每個圖像數(shù)據(jù)進行比對,以在字符形狀數(shù)據(jù)2中指定與圖像數(shù)據(jù)5最相似的圖像數(shù)據(jù)X4。
[0040]在信息處理裝置I中,操作單元Ib檢測:指示由用戶通過手寫輸入所輸入的字符4a、4b和4c中的每個字符的輸入位置的位置信息;以及分別與字符4a、4b和4c相關(guān)聯(lián)的字符代碼A1、A2和A3。此外,操作單元Ib參考字符形狀數(shù)據(jù)2以獲取與字符代碼Al、A2和A3相關(guān)聯(lián)的圖像數(shù)據(jù)X1、X2和X3,并生成通過基于該位置信息對圖像數(shù)據(jù)X1、X2和X3進行組合所獲得的圖像數(shù)據(jù)5。操作單元Ib參考字符形狀數(shù)據(jù)2以輸出與圖像數(shù)據(jù)5相關(guān)聯(lián)的字符的圖像數(shù)據(jù)X4或與圖像數(shù)據(jù)X4相關(guān)聯(lián)的字符代碼A4。
[0041 ] 因此,可以高準確度地識別未登記在字典數(shù)據(jù)中的字符。例如,針對待識別的每個目標字符預(yù)先準備用于與部件集或筆畫信息進行比對的字典數(shù)據(jù),以執(zhí)行字符識別。然而,字符的數(shù)目是龐大的,因此不容易將所有字符采集到字典數(shù)據(jù)中。
[0042]例如,字典數(shù)據(jù)3的準備工作需要相當(dāng)長的時間從而例如登記每個字符的筆畫信息。例如,單個字符的筆畫布置式樣或書寫順序因人而異。因此,字典數(shù)據(jù)3的準備需要大量的成本來進行如下工作:例如,針對每個字符從多個用戶提取樣本如筆畫的輸入式樣,并且對待登記的所提取樣本進行整合和編輯。因此,可以省略將具有低使用頻率的字符——例如異體字或外來字(包括傳統(tǒng)的字符形狀)——登記在字典數(shù)據(jù)3中。此外,用戶自己可以準備字符以將該字符登記在字符形狀數(shù)據(jù)2中。預(yù)先將由用戶自己準備的字符登記在字典數(shù)據(jù)3中可能并不優(yōu)選。
[0043]因此,高準確度地識別未登記在字典數(shù)據(jù)3中的字符的方法成為問題。例如,可能存在如下情況:其中,當(dāng)輸入用戶視為未被登記在字典數(shù)據(jù)3中的字符的輸入數(shù)據(jù)4時,輸入數(shù)據(jù)4與登記在字符形狀數(shù)據(jù)2中的每個圖像數(shù)據(jù)進行比對。然而,在作為包含在輸入數(shù)據(jù)4中的每個部件的字符的形狀彎曲(collapse)的情況下,可能降低輸入數(shù)據(jù)4的識別準確度。
[0044]信息處理裝置I將輸入數(shù)據(jù)4作為多個字符的組合來處理。具體地,信息處理裝置I基于字典數(shù)據(jù)3來識別多個字符,以檢測多個字符的字符代碼。信息處理裝置I從字符形狀數(shù)據(jù)2中提取與多個字符代碼相關(guān)聯(lián)的多個圖像數(shù)據(jù)并將其進行組合,以將輸入數(shù)據(jù)4成形為圖像數(shù)據(jù)5。此外,信息處理裝置I將圖像數(shù)據(jù)5與包含在字符形狀數(shù)據(jù)2中的每個圖像數(shù)據(jù)進行比對,以指定用于輸入數(shù)據(jù)4的圖像數(shù)據(jù)X4。因此,即使在與輸入數(shù)據(jù)4相關(guān)聯(lián)的字符未登記在字典數(shù)據(jù)3中的情況下,也可以使用登記在字典數(shù)據(jù)3中的筆畫信息而適當(dāng)?shù)刂付ㄓ脩舸蛩爿斎氲淖址膱D像數(shù)據(jù)X4或字符代碼A4。
[0045]在此情況下,如上所述,信息處理裝置I可以基于由用戶輸入的字符4a、4b和4c的輸入位置對圖像數(shù)據(jù)X1、X2和X3進行變形和組合,以生成圖像數(shù)據(jù)5。通過這樣做,可以通過圖像數(shù)據(jù)X1、X2和X3來再現(xiàn)作為漢字部首(例如“編”或“旁”)輸入的部件以適當(dāng)?shù)卦趫D像數(shù)據(jù)5中反映所再現(xiàn)的部件。
[0046][第二實施方式]
[0047]圖2為示出第二實施方式的客戶端設(shè)備的視圖。客戶端設(shè)備100為信息處理裝置,例如移動電話、平板設(shè)備或計算機??蛻舳嗽O(shè)備100執(zhí)行字符識別。當(dāng)接收到用戶的手寫輸入時,客戶端設(shè)備100估計用戶打算輸入的字符的字符代碼。然后客戶端設(shè)備100在估計字符代碼時使用字典數(shù)據(jù)。字典數(shù)據(jù)為其中字符代碼和筆畫信息彼此相關(guān)聯(lián)的信息。
[0048]例如,用戶可以通過使用手200的任意手指或觸控筆在客戶端設(shè)備100中設(shè)置的觸摸面板上重寫字符來執(zhí)行手寫輸入。例如,用戶可以通過在預(yù)定輸入?yún)^(qū)域R中的手寫輸入來輸入字符??蛻舳嗽O(shè)備100可以以將輸入?yún)^(qū)域R作為用于輸入字符的輸入?yún)^(qū)域顯示在顯示屏上的方式向用戶呈現(xiàn)輸入?yún)^(qū)域。在以下描述中,將朝向地面的輸入?yún)^(qū)域R的左上頂點定義為坐標原點“O”。此外,將相對于坐標原點“O”在右方的坐標軸定義為X軸且將相對于坐標原點“O”在下方的坐標軸定義為Y軸。
[0049]例如,客戶端設(shè)備100在顯示屏上顯示與所估計的字符代碼相關(guān)聯(lián)的字符的圖像數(shù)據(jù)。例如,當(dāng)在顯示屏上顯示的字符的圖像數(shù)據(jù)為用戶打算輸入的數(shù)據(jù)時,用戶可以確定字符的輸入以用于操縱。
[0050]圖3是示出了客戶端設(shè)備100的硬件的示例的視圖??蛻舳嗽O(shè)備100包括處理器101、RAM102、閃速存儲器103、無線單元104、顯示屏105、觸摸面板106、語音單元107和介質(zhì)讀出單元108。各單元均連接至客戶端設(shè)備100的總線。
[0051]處理器101控制客戶端設(shè)備100的信息處理。處理器101可以為例如CPU、DSP、ASIC或FPGA。處理器101也可以為多處理器。處理器101可以為兩個或更多個部件(例如 CPU、DSP、ASIC 或 FPGA)的組合。
[0052]RAM102為客戶端設(shè)備100的主存儲設(shè)備。RAM102暫時存儲操作系統(tǒng)(OS)程序或由處理器101執(zhí)行的應(yīng)用程序的至少一部分。此外,RAM102存儲用于由處理器101執(zhí)行的處理的各種數(shù)據(jù)。
[0053]閃速存儲器103為客戶端設(shè)備100的輔助存儲設(shè)備。閃速存儲器103在其中存儲例如OS程序、應(yīng)用程序或各種數(shù)據(jù)。閃速存儲器103可以為能夠從客戶端設(shè)備100上拆卸的便攜式記錄介質(zhì)。
[0054]無線單元104為能夠執(zhí)行無線通信的接口。無線單元104可以與接入點10通信以訪問接入點10所連接的網(wǎng)絡(luò)。無線單元104可以對去往和來自連接至網(wǎng)絡(luò)的其他計算機的程序或數(shù)據(jù)進行發(fā)送和接收。此外,客戶端設(shè)備100可以設(shè)置有能夠進行有線通信的接口,以替代無線單元104或者與無線單元一起工作。
[0055]顯示屏105根據(jù)從處理器101發(fā)出的指令來輸出圖像。例如,顯示屏105可以為液晶顯示屏或者電致發(fā)光(EL)顯示屏。
[0056]觸摸面板106檢測由例如用戶進行的觸摸操縱。用戶可以使用手指或者觸控筆來觸摸觸摸面板106。當(dāng)檢測到觸摸操縱時,觸摸面板106檢測在其上手指或觸控筆進行接觸的位置并將該位置輸出至處理器101。當(dāng)通過手指或觸控筆在觸摸面板106上執(zhí)行重寫操縱時,觸摸面板106繼續(xù)檢測在軌跡上包含的位置并將所檢測到的位置輸出至處理器101。
[0057]此外,觸摸面板106可以為連接至客戶端設(shè)備100的外部設(shè)備。此外,客戶端設(shè)備100可以連接至其他定點設(shè)備,例如觸摸板或鼠標,以接收使用其他定點設(shè)備進行的手寫輸入。
[0058]語音單元107實現(xiàn)呼叫功能。例如,語音單元107被設(shè)置有麥克風(fēng)或揚聲器。語音單兀107對由麥克風(fēng)輸入的聲音模擬信號執(zhí)行信號轉(zhuǎn)換處理,以生成聲音數(shù)據(jù)并將該聲音數(shù)據(jù)輸出至處理器101。此外,語音單元107將從處理器101獲取的聲音數(shù)據(jù)轉(zhuǎn)換成聲音模擬信號并使用揚聲器輸出聲音。
[0059]介質(zhì)讀出單元108可以根據(jù)從處理器101發(fā)出的指令來從便攜式記錄介質(zhì)11讀取程序或數(shù)據(jù)、或者將程序或數(shù)據(jù)記錄在記錄介質(zhì)11上。例如,記錄介質(zhì)11為至介質(zhì)讀出單元108的可拆卸卡式記錄介質(zhì)(例如存儲卡)。介質(zhì)讀出單元108將從記錄介質(zhì)11讀取的程序或數(shù)據(jù)存儲在RAM102或閃速存儲器103中。介質(zhì)讀出單元108可以為使用例如激光來讀取記錄在光盤中的程序或數(shù)據(jù)的驅(qū)動設(shè)備(例如在客戶端設(shè)備100為計算機的情況下)。
[0060]在這樣的情況下,光盤可以被用作記錄介質(zhì)11。例如,可以將數(shù)字通用磁盤(DVD)、DVD-RAM、只讀光盤存儲器(CD-ROM)、可記錄/可重寫式光盤(CD-R/RW)用作光盤。例如,介質(zhì)讀出單元108根據(jù)從處理器101發(fā)出的指令將從光盤讀取的程序或數(shù)據(jù)存儲在RAM102或閃速存儲器103 (或者其他存儲設(shè)備如HDD)中。
[0061]圖4是示出客戶端設(shè)備100的功能的示例的視圖??蛻舳嗽O(shè)備100包括例如存儲單元110、字符確定單元120、部件字符組合單元130和字符比較單元140。存儲單元110可以由固定在RAM102或閃速存儲器103中的存儲區(qū)來實現(xiàn)。字符確定單元120、部件字符組合單元130和字符比較單元140可以由通過處理器101執(zhí)行的軟件模塊來實現(xiàn)。
[0062]存儲單元110存儲用于由字符確定單元120、部件字符組合單元130和字符比較單元140執(zhí)行的處理的各種信息。存儲在存儲單元10中的信息包括字符形狀表、字典表、輸入歷史表、相似度歷史表和組合表。
[0063]字符形狀表為指示字符代碼與字符字體(例如表示字符形狀的圖像數(shù)據(jù))之間的關(guān)聯(lián)關(guān)系的表。字典表為指示字符代碼與參考筆畫信息之間的關(guān)聯(lián)關(guān)系的表。輸入歷史表為存儲關(guān)于筆畫輸入的信息的表。相似度歷史表為存儲手寫輸入的筆畫與筆畫信息之間的相似度的計算歷史的表。組合表為用于組合圖像數(shù)據(jù)的表。
[0064]字符確定單元120接收用戶的手寫輸入。字符確定單元120將指示與由觸摸面板106檢測到的每個筆畫相關(guān)聯(lián)的軌跡的一組坐標存儲到在存儲單元110中存儲的輸入歷史表中。根據(jù)在輸入最后筆畫之后的、其間未輸入任何筆畫的時間段是否持續(xù)達到預(yù)定時間,字符確定單元120指定手寫輸入的單個字符。
[0065]字符確定單元120基于手寫輸入的信息來估計輸入的字符,并指定與該字符相關(guān)聯(lián)的字符代碼。字符確定單元120可以根據(jù)手寫輸入的信息、基于存儲在存儲單元中的字符形狀表和字典表來指定字符代碼。例如,對登記在字典表中的字符執(zhí)行字符識別的情況。
[0066]字符確定單元120接收手寫輸入的單個筆畫。字符確定單元120將登記在字典表中的每個筆畫信息與手寫輸入的筆畫信息進行比較,以評估筆畫信息的第一相似度。此處,相似度以數(shù)值顯示。此外,假設(shè)相似度隨著相似度的數(shù)值的變大而變高,而不相似度隨著相似度數(shù)值的變小而變高。字符確定單元120可以從字典表中提取與具有較大數(shù)值的第一相似度的筆畫信息相關(guān)聯(lián)的一個或多個字符代碼。
[0067]此外,字符確定單元120對登記在字符形狀表中的每個圖像數(shù)據(jù)與手寫輸入的圖像數(shù)據(jù)進行比較,以評估圖像式樣的第二相似度。例如,當(dāng)字符由具有二進制值的點圖形表示時,可以通過點位置或點圖形之間的匹配度來計算第二相似度。字符確定單元120可以從字符形狀表中提取與具有較大數(shù)值的第二相似度的圖像數(shù)據(jù)相關(guān)聯(lián)的一個或多個字符代碼。
[0068]此外,字符確定單元120在從字符形狀表和字典表中提取的字符代碼中指定該手寫輸入的字符代碼。具體地,字符確定單元120通過對作為第一相似度和第二相似度獲得的結(jié)果進行綜合確定來計算相似度,并指定字符代碼的候選項中變?yōu)榫哂凶畲笙嗨贫鹊淖址a。例如,字符確定單元120可以通過對同一字符代碼的第一相似度和第二相似度取平均來計算每個字符代碼的綜合相似度。然而,字符確定單元120可以使用僅第一相似度來指定手寫輸入的字符代碼(可以省略第二相似度的計算)。
[0069]同時,用戶可能打算輸入如下字符以進行手寫輸入:該字符被認為是未登記在字典數(shù)據(jù)3中的字符。因此,在輸入單個字符的第一筆畫之后的直到輸入該單個字符的最后筆畫為止的時間段中,每當(dāng)輸入單個筆畫時,字符確定單元120就計算相似度。具體地,字符確定單元120將未登記在字典表中的字符作為多個子字符的組合(例如,在下文中,可以將多個子字符稱為部件字符)來處理,并針對多個部件字符中的每個部件字符執(zhí)行字符識另O。如以下將描述的,字符確定單元120通過檢測相似度的變化來檢測單個部件字符。當(dāng)在單個字符的輸入時期內(nèi)檢測到多個部件字符時,字符確定單元120將每個部件字符的每個字符代碼輸出至部件字符組合單元130。
[0070]部件字符組合單元130基于從字符確定單元120獲取的多個部件字符的字符代碼來從字符形狀表中獲取每個部件字符的圖像數(shù)據(jù)。部件字符組合單元130基于指示每個部件字符被輸入的位置的位置信息對每個所獲取部件字符的圖像數(shù)據(jù)進行組合。部件字符組合單元130可以根據(jù)存儲在存儲單元110中的筆畫輸入歷史來指定每個部件字符的位置信肩、O
[0071]部件字符組合單元130基于位置信息來指定指示每個部件字符被輸入的區(qū)域的矩形。部件字符組合單元130對每個部件字符的圖像數(shù)據(jù)進行變形以適合于每個矩形中,從而對每個部件字符進行組合(在下文描述中,可以將變形之后的圖像數(shù)據(jù)稱為經(jīng)變形的圖像數(shù)據(jù))。此外,部件字符組合單元130生成單個圖像數(shù)據(jù)(例如,在下文中可以將單個圖像數(shù)據(jù)稱為合成圖像數(shù)據(jù))并將該單個圖像數(shù)據(jù)作為組合結(jié)果輸出至字符比較單元140。
[0072]字符比較單元140從部件字符組合單元130獲取合成圖像數(shù)據(jù)。字符比較單元140將存儲在存儲單元110中的字符形狀表的每個圖像數(shù)據(jù)與合成圖像數(shù)據(jù)進行比對,以指定并輸出與合成圖像數(shù)據(jù)相關(guān)聯(lián)的圖像數(shù)據(jù)或與該圖像數(shù)據(jù)相關(guān)聯(lián)的字符代碼。例如,字符比較單元140可以在顯示屏105上顯示與合成圖像數(shù)據(jù)相關(guān)聯(lián)的圖像數(shù)據(jù)。此外,字符比較單元140可以將與該圖像數(shù)據(jù)相關(guān)聯(lián)的字符代碼輸出至例如在客戶端設(shè)備100或者與客戶端設(shè)備100通信的其他設(shè)備上運行的預(yù)定軟件。
[0073]圖5是示出字符形狀表111的示例的視圖。字符形狀表111預(yù)先存儲在存儲單元110中。字符形狀表111可以為由客戶端設(shè)備100的操作系統(tǒng)提供的字體的信息。另外,字符形狀表111可以為由字符確定單元120使用字體的信息(例如通過復(fù)制字體的信息)所準備的信息。
[0074]字符形狀表111包括字符代碼字段和圖像數(shù)據(jù)字段。字符代碼被登記在字符代碼字段中。指示字體的圖像數(shù)據(jù)(例如位圖數(shù)據(jù))被登記在圖像數(shù)據(jù)字段中。
[0075]例如,指示字符代碼為“706b”且圖像數(shù)據(jù)為“G1 (火)”的信息被登記在字符形狀表111中。這表示針對字符代碼“706b”指示字符“火”的圖像數(shù)據(jù)“G1”已經(jīng)被登記。
[0076]可以由用戶添加登記在字符形狀表111中的內(nèi)容。例如,用戶可以通過將異體字或外來字與未使用的字符代碼相關(guān)聯(lián)而將該異體字或外來字登記在字符形狀表111中。此夕卜,用戶還可以準備其自己的字符的圖像數(shù)據(jù),并將該圖像數(shù)據(jù)與未使用的字符代碼相關(guān)聯(lián)以被登記在字符形狀表111中。例如,在字符形狀表111中登記針對字符代碼“7130”的異體字的圖像數(shù)據(jù)“G7”。圖像數(shù)據(jù)“G7”為字符的異體字“焰”的字體。
[0077]此外,統(tǒng)一碼(Unicode)被例示為字符代碼的示例,但在第二實施方式中也可以使用其他字符代碼(例如JIS碼或Shift JIS碼)。
[0078]圖6是示出字典表112的示例的視圖。字典表112預(yù)先存儲在存儲單元110中。字典表112包括字符代碼字段和筆畫信息字段。字符代碼被登記在字符代碼字段中。參考筆畫信息被登記在筆畫信息字段中。例如,對于單個字符,筆畫信息可以包括多種圖形,例如每個筆畫的書寫起始位置和書寫完成位置、每個筆畫的書寫完成位置與下一筆畫的書寫起始位置之間的相對位置關(guān)系、或者形成單個字符的書寫順序。
[0079]例如,指示字符代碼為“30bd”且筆畫信息為“P1”的信息被登記在字典表112中。例如,關(guān)于字符的異體字“焰”的筆畫信息未被登記在字典表112中。
[0080]圖7是示出輸入歷史表113的示例的視圖。輸入歷史表113存儲在存儲單元110中。輸入歷史表113包括順序字段和所檢測點字段。筆畫的輸入順序被登記在順序字段中。與由用戶輸入的筆畫有關(guān)的一組坐標被登記在所檢測點字段中。例如,將順序為“I”且所檢測到的點為“NI, N2,..?”的信息登記在輸入歷史表113中。這表明關(guān)于第一筆畫輸入檢測到坐標“NI,N2,..?”。
[0081]筆畫的輸入順序可以由登記在輸入歷史表113中的順序來指定。此外,可以根據(jù)某一筆畫的最后檢測到的點和下一筆畫的最先檢測到的點來指定各個筆畫之間的相對位置關(guān)系。登記在輸入歷史表113中的連續(xù)輸入的多個筆畫的集合形成單個字符(或者單個部件字符)。
[0082]圖8是示出相似度歷史表114的示例的視圖。相似度歷史表114存儲在存儲單元110中。每當(dāng)用戶輸入單個筆畫時,在相似度歷史表114中添加新條目。當(dāng)檢測到單個部件字符時,清除在相似度歷史表114中登記的內(nèi)容。相似度歷史表114包括輸入筆畫數(shù)字段、字符代碼字段和相似度字段。
[0083]輸入筆畫數(shù)(例如每個部件字符的筆畫數(shù))被登記在輸入筆畫數(shù)字段中。字符代碼被登記在字符代碼字段中。由字符確定單元120針對用戶的手寫輸入評估的相似度被登記在相似度字段中。在此,作為示例,最大相似度值被設(shè)定為“100”。
[0084]例如,在相似度歷史表114中登記了指示輸入筆畫數(shù)為“I”、字符代碼為“30bd”且相似度為“17”的信息。這表示對于第一筆畫檢測到字符代碼“30bd”且此時的相似度為“17”。
[0085]此外,例如,在相似度歷史表114中登記了指示輸入筆畫數(shù)為“2”、字符代碼為“706b”且相似度為“53”的信息。這表示對于第一筆畫和第二筆畫的組合檢測到字符代碼“ 706b ”且此時的相似度為“ 53 ”。
[0086]圖9是示出組合表115的示例的視圖。組合表115存儲在存儲單元110中。組合表115包括字符代碼字段、經(jīng)變形的圖像數(shù)據(jù)字段、最小坐標字段和最大坐標字段。
[0087]字符代碼被登記在字符代碼字段中。部件字符的經(jīng)變形圖像數(shù)據(jù)被登記在經(jīng)變形的圖像數(shù)據(jù)字段中。針對部件字符所檢測的X軸和Y軸的一對最小坐標(簡稱為最小坐標)被登記在最小坐標字段中。針對部件字符所檢測的X軸和Y軸的一對最大坐標(簡稱為最大坐標)被登記在最大坐標字段中。
[0088]例如,在組合表115中登記了指示字符代碼為“706b”、經(jīng)變形的圖像數(shù)據(jù)為“G11”、最小坐標為“(3,25) ”且最大坐標為“(42,78) ”的信息。這表明對于字符代碼“706b”生成了經(jīng)變形的圖像數(shù)據(jù)“G11”。此外,這表明在輸入與字符代碼相關(guān)聯(lián)的部件字符時的最小坐標為“(3,25) ”且最大坐標為“(42,78) ”。此外,最小坐標和最大坐標還可以被用作用于確定放置經(jīng)變形的圖像數(shù)據(jù)的位置的信息(例如指示與其他經(jīng)變形的圖像數(shù)據(jù)的相對位置關(guān)系的信息)。
[0089]圖10是示出字符識別過程的示例的流程圖。在下文中,將根據(jù)步驟編號來描述圖10所述的過程。字符確定單元120接收用戶的指示字符識別開始的操縱輸入。字符確定單元120分別將數(shù)字“I”代入變量“n”,將相似度VO設(shè)定為“O”且將結(jié)束標志設(shè)定為“假,,(Sll)。
[0090]字符確定單元120接收由用戶手寫輸入的單個筆畫(S12)?!敖邮諉蝹€筆畫”的表述是指檢測到單個筆畫的書寫完成點。字符確定單元120將指示輸入筆畫的信息(例如指示由觸摸面板106檢測到的筆畫的軌跡的一組坐標)存儲在存儲單元110中。
[0091]字符確定單元120從存儲在存儲單元110中的輸入歷史表113中提取尚未被決定為形成哪個字符的筆畫集(例如,稱為一組未決定的筆畫)(S13)。字符確定單元120基于該組未決定的筆畫以及存儲在存儲單元110中的字符形狀表111和字典表112來計算該組未決定的筆畫與每個字符之間的相似度Vn。例如,字符確定單元120將該組未決定的筆畫與字典表112中的每個筆畫信息進行比對,以計算該組未決定的筆畫與每個字符之間的第一相似度。此外,字符確定單元120將由該組未決定的筆畫表示的點圖形與字符形狀表111的圖像數(shù)據(jù)進行比對,以計算該組未決定的筆畫與每個字符之間的第二相似度。此外,字符確定單元120基于第一相似度和第二相似度來綜合地確定該組未決定的筆畫與每個字符之間的相似度。例如,如上所述,可以將第一相似度和第二相似度的平均值設(shè)定為該組未決定的筆畫與每個字符之間的相似度。此外,將最大相似度設(shè)定為Vn并將與相似度Vn相關(guān)聯(lián)的字符代碼設(shè)定為字符代碼Cn。字符確定單元120將輸入筆畫數(shù)“η”、字符代碼Cn和相似度Vn登記在相似度歷史表114中。
[0092]字符確定單元120判定是否在步驟S12處接收到所述筆畫的輸入之后的預(yù)定限制時間“Τ”內(nèi)開始下一筆畫(例如由手寫過程中的單次移動形成的下一線條)的輸入(S14)?!伴_始下一筆畫的輸入”的表述是指檢測到下一筆畫的書寫開始點。當(dāng)確定下一筆畫是在限制時間“Τ”內(nèi)開始時,過程進行到步驟S15。當(dāng)確定下一筆畫未在限制時間“Τ”內(nèi)開始時,過程進行到步驟S19。例如,可以將限制時間“Τ”設(shè)定為從0.2秒到I秒的序列上的任意時間段。根據(jù)用戶的輸入方法,可以允許限制時間“Τ”將設(shè)定時間改變成時間段。
[0093]字符確定單元120判定變量“η”是否大于“I”(S15)。當(dāng)確定“η”大于“I”時,則過程轉(zhuǎn)至步驟S16。否則,當(dāng)“η”小于等于I時,過程轉(zhuǎn)至步驟S18。
[0094]字符確定單元120判定相似度Vn是否小于等于相似度Vn-1且相似度Vn-1是否大于等于閾值Q(S16)。當(dāng)確定相似度Vn小于等于相似度Vn-1且相似度Vn-1大于等于閾值Q時,過程轉(zhuǎn)至步驟S17。當(dāng)確定相似度Vn大于相似度Vn-1并且相似度Vn-1小于閾值Q時,過程轉(zhuǎn)至步驟S18。
[0095]字符確定單元120指定字符代碼Cn-1作為部件字符(S17)。字符確定單元120將字符代碼Cn-1登記到存儲在存儲單元110中的組合表115中。字符確定單元120將字符代碼Cn-1輸出到部件字符組合單元130中,并且過程轉(zhuǎn)至圖11的步驟S31。
[0096]字符確定單元120將變量“η”增加一(將“η”的值加一 )(S18),并且過程轉(zhuǎn)至步驟S12。符號確定單元120將結(jié)束標志設(shè)定為“真”(S19)。
[0097]字符確定單元120將字符代碼Cn指定為部件字符(S20)。字符確定單元120將字符代碼Cn登記在組合表115中。字符確定單元120參考組合表115來判定所獲取的部件字符的數(shù)目是否為一(S21)。當(dāng)確定所獲取的部件字符的數(shù)目為一時,過程轉(zhuǎn)至步驟S22。否則,當(dāng)所獲取的部件字符的數(shù)目不為一時,字符確定單元120將該字符代碼Cn輸出至部件字符組合單元130,并且過程轉(zhuǎn)至圖11的步驟S31。
[0098]字符確定單元120獲取從字符形狀表111輸出的字符代碼Cn的圖像數(shù)據(jù)(其僅對應(yīng)于所獲取的字符代碼)并將所獲取的圖像數(shù)據(jù)輸出至顯示屏105 (S22)。否則,字符確定單元120可以將字符代碼Cn輸出到其他軟件或設(shè)備。例如,用戶可以瀏覽在顯示屏105中顯示的字符的圖像以識別該字符是否為用戶自己打算輸入的字符。字符確定單元120清除每個表中的內(nèi)容以用于下一字符的識別,并且還結(jié)束單個字符的識別過程。
[0099]此外,如上所述,可以通過在步驟S13處僅使用與字典表112比對的結(jié)果來獲取相似度Vn和字符代碼Cn。此外,字符的第一筆畫的輸入大多數(shù)對應(yīng)于線條,例如水平線或垂直線“ I ”,因此,該字符與字符“一”之間的相似度被計算為較大。因此,當(dāng)在第二筆畫中相似度極大地降低時,步驟S16的判定結(jié)果變成肯定,使得可能錯誤地檢測到部件字符。因此,如步驟S15中在第一筆畫的情況下不執(zhí)行步驟S16的判定,并且因此可以減小錯誤地檢測部件字符的可能性。
[0100]圖11是示出字符識別過程的示例的流程圖(從圖10繼續(xù))。在下文中,將參照步驟編號來描述圖11中示出的過程。部件字符組合單元130參考字符形狀表111以獲取與在步驟S17處獲取的部件字符的字符代碼Cn-1相關(guān)聯(lián)的圖像數(shù)據(jù)(字體圖像)(S31)。否貝U,部件字符組合單元130獲取與在步驟S20處獲取的部件字符的字符代碼Cn相關(guān)聯(lián)的圖像數(shù)據(jù)。
[0101]部件字符組合單元130關(guān)于在步驟S17或步驟S20處所檢測到的部件字符來參考存儲在存儲單元I1中的輸入歷史表113,以從輸入的部件字符的坐標中獲取最小坐標和最大坐標(S32)。部件字符組合單元130將部件字符的最小坐標和最大坐標登記在組合表115 中。
[0102]部件字符組合單元130指定以在步驟S32處所獲得的最小坐標和最大坐標作為一對對角相對頂點(例如未共用同一邊的兩個頂點)的矩形。矩形的兩邊與X軸平行,而其他兩邊與Y軸平行。部件字符組合單元130對在步驟S31處所獲取的部件字符的圖像數(shù)據(jù)進行變形以被裝入所述矩形中,來生成經(jīng)變形的圖像數(shù)據(jù)。具體地,部件字符組合單元130沿X軸方向和Y軸方向改變(延伸和收縮)原圖像數(shù)據(jù)的長度,使得部件字符的原圖像數(shù)據(jù)的大小變成與所述矩形的大小相同的大小。也就是說,經(jīng)變形的圖像數(shù)據(jù)的縱橫比變成與矩形的縱橫比相同的比率。此外,原圖像數(shù)據(jù)的大小可能不一定是相同的大小,其可以是允許如下預(yù)定裕度的大小:該預(yù)定裕度等同于在某方面比矩形的大小大或小預(yù)定比率的尺寸。此外,部件字符組合單元130確定待布置的經(jīng)變形圖像數(shù)據(jù)的位置,使得所生成的經(jīng)變形圖像數(shù)據(jù)的頂點與矩形的對應(yīng)頂點相匹配(S33)。部件字符組合單元130將部件字符的經(jīng)變形圖像數(shù)據(jù)登記在組合表115中。
[0103]部件字符組合單元130判定結(jié)束標志是否為“真”(S34)。當(dāng)判定結(jié)束標志為“真”時,過程轉(zhuǎn)至步驟S37。否則,當(dāng)結(jié)束標志不為“真”(即,結(jié)束標志保持為“假”)時,將過程控制轉(zhuǎn)移到字符確定單元120,并且過程轉(zhuǎn)至步驟S35。
[0104]字符確定單元120刪除相似度歷史表114中的條目(S35)。字符確定單元120將“I”代入變量“n”(S36),過程轉(zhuǎn)至圖10的步驟S12。也就是說,過程轉(zhuǎn)至用于檢測下一部件字符的處理。
[0105]部件字符組合單元130在步驟S33處所確定的位置上對存儲在組合表115中的每個經(jīng)變形的圖像數(shù)據(jù)進行布置和組合,以生成合成圖像數(shù)據(jù)。部件字符組合單元130將合成圖像數(shù)據(jù)輸出到字符比較單元140 (S37)。
[0106]字符比較單元140參考字符形狀表111以檢索與所獲取的合成圖像數(shù)據(jù)相關(guān)聯(lián)的字體的圖像數(shù)據(jù)(例如字體圖像)。例如,字符比較單元140可以檢測包含在合成圖像數(shù)據(jù)中的漢字部首,以通過漢字部首來縮減字符形狀表111的圖像數(shù)據(jù)。字符比較單元140計算合成圖像數(shù)據(jù)與登記在字符形狀表111中的每個圖像數(shù)據(jù)之間的點位置或點圖形的匹配度作為相似度,并指定具有最大相似度的圖像數(shù)據(jù)作為與合成圖像數(shù)據(jù)相關(guān)聯(lián)的圖像數(shù)據(jù)(S38)。
[0107]字符比較單元140將在步驟S38處所指定的圖像數(shù)據(jù)輸出至顯示屏105 (S39)。另夕卜,字符比較單元140可以從字符形狀表111獲取與圖像數(shù)據(jù)相關(guān)聯(lián)的字符代碼,以將所獲取的字符代碼輸出到其他軟件或其他設(shè)備。例如,用戶可以瀏覽在顯示屏105中顯示的字符圖像,以識別該字符圖像是否與用戶打算輸入的字符相對應(yīng)。字符比較單元140清除相似度歷史表114和組合表115中的內(nèi)容以用于下一字符的識別。然后,單個字符的識別過程結(jié)束。
[0108]此外,可以在步驟S37緊之前執(zhí)行步驟S33。在此情況下,在步驟S32之后執(zhí)行步驟S34,并且當(dāng)在步驟S34處的判定結(jié)果為“是”時,執(zhí)行步驟S33。
[0109]接下來,將描述由字符確定單元120進行的處理的具體示例。在以下描述中,例示對字符的異體字“焰”進行識別的情況。在以下描述中,當(dāng)引用輸入筆畫數(shù)時,輸入筆畫數(shù)被表示為異體字整體的筆畫數(shù)(例如,在以下示例中存在共12 (十二)畫)。此外,作為示例,相似度的閾值Q被設(shè)定為“80”。
[0110]圖12Α、圖12Β和圖12C是示出部件字符確定的具體示例的視圖。圖12Α例示針對接收到第三筆畫輸入的情況的相似度歷史表114a。字符確定單元120將輸入筆畫數(shù)為“3”、字符代碼為“706b (與字符“火”相關(guān)聯(lián))且相似度為“68”的條目登記在相似度歷史表114a中。此處,僅表示出最新的條目而其他條目被縮寫成(在下文中,可以類似地進行表示)。
[0111]圖12B例示針對接收到第四筆畫輸入的情況的相似度歷史表114b。字符確定單元120將輸入筆畫數(shù)為“4”、字符代碼為“706b”(與字符“火”相關(guān)聯(lián))且相似度為“91”的條目登記在相似度歷史表114b中。
[0112]圖12C例示針對接收到第五筆畫輸入的情況的相似度歷史表114c。字符確定單元120將輸入筆畫數(shù)為“5”、字符代碼為“72ac”(與字符“犬”相關(guān)聯(lián))且相似度為“28”的條目登記在相似度歷史表114c中。此處,當(dāng)將相似度歷史表114b和114c彼此比較時,相似度V5 = 28落入等于或小于相似度V4 = 91的范圍內(nèi)。此外,相似度V4 = 91相當(dāng)于等于或大于閾值Q = 80的范圍。因此,字符確定單元120將由如圖12B所示的筆畫輸入獲得的輸入圖像檢測為單個部件字符。部件字符的字符代碼為“706b”。字符確定單元120清除相似度歷史表114c中的登記內(nèi)容。
[0113]圖13A、圖13B和圖13C為示出部件字符確定(自圖12延續(xù))的具體示例的圖。圖13A例示針對接收到圖12C的第六筆畫(由于相似度歷史表114被清除,所以為了管理將筆畫變成第一筆畫)輸入的情況的相似度歷史表114d。字符確定單元120將輸入筆畫數(shù)為“I”、字符代碼為“30af”(與字符“々”相關(guān)聯(lián))且相似度為“86”的條目登記在相似度歷史表114d中。
[0114]圖13B例示針對接收到第七筆畫輸入的情況的相似度歷史表114e。字符確定單元120將輸入筆畫數(shù)為“2”、字符代碼為“ff 17”(與字符“7”相關(guān)聯(lián))且相似度為“39”的條目登記在相似度歷史表114e中。此處,當(dāng)將相似度歷史表114d和114e彼此比較時,相似度V5 = 39落入等于或小于相似度V4 = 86的范圍內(nèi)。此外,相似度Vl = 86相當(dāng)于等于或大于閾值Q = 80的范圍。因此,字符確定單元120將由如圖13A所示的筆畫輸入所獲得的輸入圖像檢測為單個部件字符。部件字符的字符代碼為“30af”。字符確定單元120清除登記在相似度歷史表114e中的內(nèi)容。
[0115]圖13C例示針對接收到第i^一筆畫輸入的情況的相似度歷史表114f。字符確定單元120將輸入筆畫數(shù)為“4”、字符代碼為“81fc”(與字符“臼”相關(guān)聯(lián))且相似度為“72”的條目登記在相似度歷史表114f中。
[0116]圖13D例示針對接收到第十二筆畫輸入的情況的相似度歷史表114g。字符確定單元120將輸入筆畫數(shù)為“5”、字符代碼為“81fc”(與字符“臼”相關(guān)聯(lián))且相似度為“86”的條目登記在相似度歷史表114f中。在檢測到第十二筆畫輸入之后未開始下一個輸入的情況下,字符確定單元120將由執(zhí)行十二次輸入獲得的筆畫輸入所獲得的輸入圖像檢測為單個部件字符。部件字符組合單元130對由字符確定單元120檢測到的每個部件字符的圖像數(shù)據(jù)進行變形和組合以生成合成圖像數(shù)據(jù)。接下來,將例示由部件字符組合單元130對圖像數(shù)據(jù)進行的變形過程。
[0117]圖14是示出經(jīng)變形的圖像數(shù)據(jù)的示例的視圖。部件字符組合單元130參考字符形狀表111以獲取與部件字符(例如字符“火”)的字符代碼“706b”相關(guān)聯(lián)的圖像數(shù)據(jù)Gl0此外,部件字符組合單元130從直至圖12B的第四筆畫為止的輸入歷史獲取最小坐標“(3,25) ”和最大坐標“(42,78) ”。此外,假設(shè)在圖14的示例中的輸入?yún)^(qū)域“R”中,X軸的最大值為“ 100”且Y軸的最大值為“ 100”。
[0118]部件字符組合單元130指定以最小坐標和最大坐標作為對角相對頂點的矩形“H”。矩形“H”的沿水平方向的兩邊與X軸平行。矩形“H”沿垂直方向的兩邊與Y軸平行。此外,對圖像數(shù)據(jù)Gl進行變形使得圖像數(shù)據(jù)Gl可以被布置成被裝入到矩形“H”中。具體地,將圖像數(shù)據(jù)Gl的沿與X軸平行的方向的長度延伸和收縮成與矩形“H”的水平邊的長度(例如“39”)相同。此外,將圖像數(shù)據(jù)Gl的沿與Y軸平行的方向的長度延伸和收縮成與矩形“H”的垂直邊的長度(例如“53”)相同。因此,生成經(jīng)變形的圖像數(shù)據(jù)G11。
[0119]換言之,也就是說,經(jīng)變形的圖像數(shù)據(jù)Gll的縱橫比被變形為與矩形“H”的縱橫比相匹配。例如,當(dāng)矩形“H”的縱橫比為高:寬= “2:1”的比率時,也將圖像數(shù)據(jù)Gl的縱橫比設(shè)定為“2:1”的比率。然而,變形之后的縱橫比可以在預(yù)定比率的范圍內(nèi)進行調(diào)節(jié)。例如,相對于矩形“H”的縱橫比“2:1”,圖像數(shù)據(jù)Gl的縱橫比可以在預(yù)定比率的范圍內(nèi)改變,例如“2.2:1.9”。
[0120]通過這樣做,部件字符組合單元130從圖像數(shù)據(jù)Gl生成經(jīng)變形的圖像數(shù)據(jù)G11。此外,部件字符組合單元130確定輸入?yún)^(qū)域“R”中的矩形“H”的每個頂點與經(jīng)變形的圖像數(shù)據(jù)Gll的每個頂點(例如,在矩形“H”的頂點中與最小坐標相對應(yīng)的頂點和在調(diào)節(jié)縱橫比的情況下的經(jīng)變形圖像數(shù)據(jù)Gll的對應(yīng)頂點)被布置成彼此重疊。
[0121]圖15A、圖15B和圖15C是示出經(jīng)變形的圖像數(shù)據(jù)的組合的示例的視圖。圖15A例示用于部件字符“,”的經(jīng)變形圖像數(shù)據(jù)G21。圖15B例示用于部件字符“臼”的經(jīng)變形圖像數(shù)據(jù)G31。部件字符組合單元130可以通過應(yīng)用如圖14所描述的相同方法來生成經(jīng)變形的圖像數(shù)據(jù)G21和G31。
[0122]圖15C例示通過組合經(jīng)變形的圖像數(shù)據(jù)Gil、G21和G31而形成的合成圖像數(shù)據(jù)GX。部件字符組合單元130將經(jīng)變形的圖像數(shù)據(jù)G11、G21和G31中的每一個布置在預(yù)定位置上以形成單個圖像數(shù)據(jù),從而獲得合成圖像數(shù)據(jù)GX。經(jīng)變形的圖像數(shù)據(jù)Gil、G21和G31以如下方式進行布置:所布置的經(jīng)變形圖像數(shù)據(jù)G11、G21和G31的相應(yīng)頂點與指示每個部件字符的輸入?yún)^(qū)域的矩形的相應(yīng)頂點相匹配。因此,經(jīng)變形的圖像數(shù)據(jù)Gil、G21和G31中的每一個的區(qū)域與每個對應(yīng)矩形的區(qū)域相匹配。因此,換言之,經(jīng)變形的圖像數(shù)據(jù)G11、G21和G31的面積比被變形成與指示每個部件字符被輸入的區(qū)域的每個矩形的面積比相匹配。例如,當(dāng)指示每個部件字符被輸入的區(qū)域的每個矩形的面積比為“4:3:6”的比率時,布置經(jīng)變形的圖像數(shù)據(jù)G11、G21和G31的區(qū)域的面積比也被設(shè)定為“4:3:6”的比率。
[0123]然而,面積比可以不必與矩形的面積比相匹配并且在對準方面可以允許一些差異。例如,當(dāng)指示每個部件字符被輸入的區(qū)域的每個矩形的面積比為“4:3:6”的比率時,布置經(jīng)變形的圖像數(shù)據(jù)Gl1、G21和G31的區(qū)域的面積比可以在預(yù)定比率的范圍內(nèi)改變,例如為“3.8:3.1:6.3”。部件字符組合單元130將合成圖像數(shù)據(jù)GX輸出到字符比較單元140。
[0124]圖16是示出最終結(jié)果的輸出的示例的視圖。字符比較單元140將合成圖像數(shù)據(jù)GX與登記在字符形狀表111中的每個字符的圖像數(shù)據(jù)進行比對。此外,字符比較單元140估計與圖像數(shù)據(jù)最匹配的圖像數(shù)據(jù)G7作為由用戶輸入的字符。字符比較單元140可以顯示圖像數(shù)據(jù)G7以提示用戶確認圖像數(shù)據(jù)G7。字符比較單元140可以從字符形狀表111獲取與圖像數(shù)據(jù)G7相關(guān)聯(lián)的字符代碼,以將所獲取的字符代碼輸出到在客戶端設(shè)備100上運行的其他軟件。此外,字符比較單元140可以將與圖像數(shù)據(jù)G7相關(guān)聯(lián)的字符代碼“7130”輸出到其他設(shè)備。
[0125]如上所述,客戶端設(shè)備100檢測包含在單個字符中的多個部件字符,并生成通過組合所述部件字符而形成的合成圖像數(shù)據(jù)GX。此外,客戶端設(shè)備100將合成圖像數(shù)據(jù)GX與字符形狀表111中的每個字符進行比對,以獲得最終字符識別結(jié)果。因此,可以高精度地識別甚至未登記在字典表112中的字符。例如,當(dāng)要執(zhí)行字符識別時,針對要識別的每個目標字符預(yù)先準備要成為樣本的筆畫信息。
[0126]然而,字符的數(shù)目是龐大的,因此相對于關(guān)于所有字符的手寫輸入來預(yù)先采集用于字符識別的筆畫信息是不容易的。例如,在登記中可能會使用異體字。一些異體字僅在非常少的登記處(例如一個登記處)中使用。例如,難以針對在數(shù)萬的序列上存在的所有異體字從要測試的約十到三十人提取筆畫的樣本,并且即使登記了筆畫但與工作成本相比效用也較低。因此,可以不將與具有較低使用頻率的字符(例如異體字或外來字)有關(guān)的筆畫信息登記在字典表112中。
[0127]此外,用戶可以任意地將由其自己準備的字符登記在字符形狀表111中。鑒于這樣的字符,難以準備待用作樣本的筆畫信息。
[0128]因此,如何高準確度地識別未登記在字典表112中的字符成為問題。例如,還可能會存在指示手寫輸入的線條的組合的圖像數(shù)據(jù)與登記在字符形狀表111中的每個字符的圖像數(shù)據(jù)進行比對的情況。然而,從作為字符的形式的角度來看,手寫輸入的線條可能疊并。因此,當(dāng)將指示手寫輸入的線條的組合的圖像數(shù)據(jù)與登記在字符形狀表111中的每個字符的圖像數(shù)據(jù)進行比對時,可能降低字符識別的準確度。
[0129]相反,客戶端設(shè)備100將單個字符作為多個部件字符的組合來處理。也就是說,由打算輸入單個字符的用戶在輸入?yún)^(qū)域R中手寫輸入的字符被客戶端設(shè)備100檢測為多個部件字符的組合??蛻舳嗽O(shè)備100將基于字典表112所識別的每個部件字符的圖像數(shù)據(jù)進行組合以獲得合成圖像數(shù)據(jù)GX。在此情況下,基于指示由用戶輸入的字符的位置的信息對部件字符的圖像數(shù)據(jù)進行變形和組合。因此,作為漢字部首(例如“編”或“旁”)輸入的部件可以通過使用登記在字符形狀表111中的圖像數(shù)據(jù)而再現(xiàn),并且被適當(dāng)?shù)胤从碁楹铣蓤D像數(shù)據(jù)GX。因此,與無變形地將手寫輸入的線條的組合與字符形狀表111中的圖像數(shù)據(jù)進行比對的情況相比,可以高準確度地進行識別。
[0130]此外,使用現(xiàn)有的筆畫信息,可以容易以高準確度對甚至如下異體字或外來字執(zhí)行字符識別:對于該異體字或外來字,未準備有手寫的用于字符識別的筆畫信息。此外,對于具有較低使用頻率的異體字或外來字,可以不準備單獨的筆畫信息。因此,可以節(jié)約對待用作樣本的筆畫信息進行采集和登記工作的勞動力。此外,可以減少待登記在字典表112中的字符以抑制筆畫信息的不斷增加。
[0131]此外,如上所述,第一實施方式的信息處理可以通過使操作單元Ib執(zhí)行程序來實現(xiàn)。此外,第二實施方式的信息處理可以通過使處理器101執(zhí)行程序來實現(xiàn)。程序可以被記錄在計算機可讀記錄介質(zhì)(例如、光盤、存儲設(shè)備和存儲卡)中。
[0132]例如,其中記錄有程序的記錄介質(zhì)可以被分發(fā)以傳播該程序。此外,程序可以在存儲在其他計算機中時經(jīng)由網(wǎng)絡(luò)進行分發(fā)??蛻舳嗽O(shè)備例如計算機可以將例如記錄在記錄介質(zhì)中的程序或從其他計算機接收的程序存儲(安裝)在RAM或HDD中,并且從存儲設(shè)備中讀取該程序以執(zhí)行該程序。
[0133]可知本公開涵蓋了但是不限于如下技術(shù)方案:
[0134]1.一種存儲有字符識別程序的計算機可讀記錄介質(zhì),所述字符識別程序在被執(zhí)行時使計算機執(zhí)行字符識別方法,所述字符識別方法包括:
[0135]檢測指示通過手寫輸入而輸入的多個字符中的每個字符的輸入位置的第一信息,并且檢測與所述多個字符相關(guān)聯(lián)的多個字符代碼;
[0136]通過參考第二信息來獲取與所述多個字符代碼中的每個字符代碼相關(guān)聯(lián)的多個第一圖像數(shù)據(jù),在所述第二信息中所述字符的字符代碼與圖像數(shù)據(jù)彼此相關(guān)聯(lián);
[0137]通過基于所述第一信息對所述多個第一圖像數(shù)據(jù)進行組合來生成第二圖像數(shù)據(jù);以及
[0138]通過參考所述第二信息來輸出與所述第二圖像數(shù)據(jù)相關(guān)聯(lián)的字符的圖像數(shù)據(jù)或與所述第二圖像數(shù)據(jù)相關(guān)聯(lián)的字符代碼。
[0139]2.根據(jù)方案I所述的計算機可讀記錄介質(zhì),其中,所述生成包括:
[0140]基于所述第一信息對所述多個第一圖像數(shù)據(jù)進行變形;以及
[0141]通過對在所述變形處變形的所述多個第一圖像數(shù)據(jù)進行組合來生成所述第二圖像數(shù)據(jù)。
[0142]3.根據(jù)方案2所述的計算機可讀記錄介質(zhì),其中,所述變形包括:
[0143]基于所述第一信息來指定指示所述多個字符被輸入的區(qū)域的多個矩形;以及
[0144]使在所述變形處變形的所述多個第一圖像數(shù)據(jù)中的每個第一圖像數(shù)據(jù)的縱橫比與所述多個矩形中的每個矩形的縱橫比相匹配。
[0145]4.根據(jù)方案3所述的計算機可讀記錄介質(zhì),其中,所述變形包括:使所述多個第一圖像數(shù)據(jù)中的每個第一圖像數(shù)據(jù)的面積比與所述多個矩形中的每個矩形的面積比相匹配。
[0146]5.根據(jù)方案I所述的計算機可讀記錄介質(zhì),其中,所述生成包括:
[0147]基于所述第一信息來指定所述多個字符的輸入位置之間的相對位置關(guān)系;以及
[0148]保持所述相對位置關(guān)系以組合所述多個第一圖像數(shù)據(jù)。
[0149]6.根據(jù)方案I所述的計算機可讀記錄介質(zhì),其中,所述檢測包括:
[0150]每當(dāng)接收到手寫的一個筆畫時,每次通過參考字典數(shù)據(jù)來將指示包含在所述字典數(shù)據(jù)中的參考筆畫的信息與輸入筆畫中的沒有被決定為用于形成字符的筆畫集進行比對,在所述字典數(shù)據(jù)中登記有字符代碼與指示參考筆畫的信息之間的多個關(guān)聯(lián);以及
[0151 ] 基于比對結(jié)果來依次檢測所述多個字符代碼中的每個字符代碼。
[0152]7.根據(jù)方案6所述的計算機可讀記錄介質(zhì),其中,所述比對包括:
[0153]計算沒有被決定為用于形成字符的所述筆畫集與包含在所述字典數(shù)據(jù)中的多個參考筆畫之間的相似度,以獲取與具有最大相似度的參考筆畫相關(guān)聯(lián)的字符代碼;以及
[0154]當(dāng)在當(dāng)前時間處的最大相似度小于或等于在先前時間處的最大相似度并且所述在先前時間處的最大相似度等于或大于閾值時,針對在沒有被決定為用于形成字符的所述筆畫集中的直到所述先前時間為止所輸入的筆畫集,決定在所述先前時間處獲取的字符代碼。
[0155]8.根據(jù)方案7所述的計算機可讀記錄介質(zhì),其中,所述比對包括:
[0156]當(dāng)在接收到所述筆畫的輸入之后的限制時間內(nèi)沒有開始下一筆畫的輸入時,通過針對沒有被決定為用于形成字符的所述筆畫集決定最后獲取的字符代碼來檢測所述多個字符代碼中的最后字符代碼。
[0157]9.根據(jù)方案I所述的計算機可讀記錄介質(zhì),其中,所述第二信息為由所述計算機預(yù)先保持的字體的信息或基于所述字體的信息而準備的信息。
[0158]本文所陳述的所有示例和條件性語言旨在教導(dǎo)的目的,以幫助讀者理解本發(fā)明和由發(fā)明人為推進本領(lǐng)域而貢獻的概念,并且其應(yīng)被解釋為不受限于這樣的具體陳述的示例和條件,并且本說明書中的這樣的示例的組織也不涉及示出本發(fā)明的優(yōu)勢和劣勢。盡管已經(jīng)詳細描述了本發(fā)明的實施方式,但應(yīng)當(dāng)理解的是,在不背離本發(fā)明的精神和范圍的情況下,可以對其做出各種改變、替換和變更。
【權(quán)利要求】
1.一種字符識別方法,所述字符識別方法包括: 檢測指示通過手寫輸入而輸入的多個字符中的每個字符的輸入位置的第一信息,并且檢測與所述多個字符相關(guān)聯(lián)的多個字符代碼; 通過參考第二信息來獲取與所述多個字符代碼中的每個字符代碼相關(guān)聯(lián)的多個第一圖像數(shù)據(jù),在所述第二信息中所述字符的字符代碼與圖像數(shù)據(jù)彼此相關(guān)聯(lián); 通過基于所述第一信息對所述多個第一圖像數(shù)據(jù)進行組合來生成第二圖像數(shù)據(jù);以及通過參考所述第二信息來輸出與所述第二圖像數(shù)據(jù)相關(guān)聯(lián)的字符的圖像數(shù)據(jù)或與所述第二圖像數(shù)據(jù)相關(guān)聯(lián)的字符代碼。
2.根據(jù)權(quán)利要求1所述的字符識別方法,其中,所述生成包括: 基于所述第一信息對所述多個第一圖像數(shù)據(jù)進行變形;以及 通過對在所述變形處變形的所述多個第一圖像數(shù)據(jù)進行組合來生成所述第二圖像數(shù)據(jù)。
3.根據(jù)權(quán)利要求2所述的字符識別方法,其中,所述變形包括: 基于所述第一信息來指定指示所述多個字符被輸入的區(qū)域的多個矩形;以及使在所述變形處變形的所述多個第一圖像數(shù)據(jù)中的每個第一圖像數(shù)據(jù)的縱橫比與所述多個矩形中的每個矩形的縱橫比相匹配。
4.根據(jù)權(quán)利要求3所述的字符識別方法,其中,所述變形包括:使所述多個第一圖像數(shù)據(jù)中的每個第一圖像數(shù)據(jù)的面積比與所述多個矩形中的每個矩形的面積比相匹配。
5.根據(jù)權(quán)利要求1所述的字符識別方法,其中,所述生成包括: 基于所述第一信息來指定所述多個字符的輸入位置之間的相對位置關(guān)系;以及 保持所述相對位置關(guān)系以組合所述多個第一圖像數(shù)據(jù)。
6.根據(jù)權(quán)利要求1所述的字符識別方法,其中,所述檢測包括: 每當(dāng)接收到手寫的一個筆畫時,每次通過參考字典數(shù)據(jù)來將指示包含在所述字典數(shù)據(jù)中的參考筆畫的信息與輸入筆畫中的沒有被決定為用于形成字符的筆畫集進行比對,在所述字典數(shù)據(jù)中登記有字符代碼與指示參考筆畫的信息之間的多個關(guān)聯(lián);以及基于比對結(jié)果來依次檢測所述多個字符代碼中的每個字符代碼。
7.根據(jù)權(quán)利要求6所述的字符識別方法,其中,所述比對包括: 計算沒有被決定為用于形成字符的所述筆畫集與包含在所述字典數(shù)據(jù)中的多個參考筆畫之間的相似度,以獲取與具有最大相似度的參考筆畫相關(guān)聯(lián)的字符代碼;以及 當(dāng)在當(dāng)前時間處的最大相似度小于或等于在先前時間處的最大相似度并且所述在先前時間處的最大相似度等于或大于閾值時,針對在沒有被決定為用于形成字符的所述筆畫集中的直到所述先前時間為止所輸入的筆畫集,決定在所述先前時間處獲取的字符代碼。
8.根據(jù)權(quán)利要求7所述的字符識別方法,其中,所述比對包括: 當(dāng)在接收到所述筆畫的輸入之后的限制時間內(nèi)沒有開始下一筆畫的輸入時,通過針對沒有被決定為用于形成字符的所述筆畫集決定最后獲取的字符代碼來檢測所述多個字符代碼中的最后字符代碼。
9.根據(jù)權(quán)利要求1所述的字符識別方法,其中,所述第二信息為由所述計算機預(yù)先保持的字體的信息或基于所述字體的信息而準備的信息。
10.一種信息處理裝置,包括: 存儲單元,所述存儲單元被配置成存儲其中字符的字符代碼和圖像數(shù)據(jù)彼此相關(guān)聯(lián)的第一信息;以及操作單元, 其中,所述操作單元被配置成: 檢測指示通過手寫輸入而輸入的多個字符中的每個字符的輸入位置的第二信息,并且檢測與所述多個字符相關(guān)聯(lián)的多個字符代碼; 通過參考所述第一信息來獲取與所述多個字符代碼相關(guān)聯(lián)的多個第一圖像數(shù)據(jù); 通過基于所述第二信息對所述多個第一圖像數(shù)據(jù)進行組合來生成第二圖像數(shù)據(jù);以及通過參考所述第一信息來輸出與所述第二圖像數(shù)據(jù)相關(guān)聯(lián)的字符的圖像數(shù)據(jù)或與所述第二圖像數(shù)據(jù)相關(guān)聯(lián)的字符代碼。
【文檔編號】G06K9/20GK104166474SQ201410195310
【公開日】2014年11月26日 申請日期:2014年5月9日 優(yōu)先權(quán)日:2013年5月16日
【發(fā)明者】高杉綾, 星哲郎 申請人:富士通株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
鄯善县| 金沙县| 民乐县| 弋阳县| 五峰| 河间市| 临颍县| 蒲江县| 雅江县| 东海县| 依安县| 白河县| 车致| 沾化县| 丹凤县| 弥勒县| 密云县| 祁门县| 沭阳县| 皋兰县| 磴口县| 中牟县| 万州区| 临澧县| 崇义县| 留坝县| 山丹县| 肇东市| 长寿区| 伽师县| 永春县| 隆回县| 安岳县| 迭部县| 怀来县| 浪卡子县| 泰顺县| 南郑县| 英超| 丰宁| 安义县|