欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

手持電子設(shè)備中的多語言文本輸入的制作方法

文檔序號:6656906閱讀:171來源:國知局
專利名稱:手持電子設(shè)備中的多語言文本輸入的制作方法
技術(shù)領(lǐng)域
本發(fā)明大體上涉及一種手持電子設(shè)備,更具體地,涉及一種在一個(gè)或多個(gè)應(yīng)用程序(如,由手持電子設(shè)備運(yùn)行的文本輸入應(yīng)用程序)中輸入不同的語言的方法和系統(tǒng)。
背景技術(shù)
手持電子設(shè)備正在普及。示例包括例如個(gè)人數(shù)據(jù)助理(PDA)、手持計(jì)算機(jī)、雙向?qū)ず魴C(jī)、蜂窩電話、文本消息設(shè)備等。許多這種手持電子設(shè)備結(jié)合了無線通信,不過其它手持電子設(shè)備是不能與其它設(shè)備進(jìn)行通信的單機(jī)設(shè)備。
隨著手持電子設(shè)備變得更加普及,存在對于更多功能和復(fù)雜性的增長的需求。盡管普遍提供了多種功能,例如地址簿、拼寫檢查和文本輸入,但是文本輸入尤其變得更加復(fù)雜。這至少部分是由于使這些手持電子設(shè)備且更小重量上更輕的趨勢。如果鍵要直接由人的手指激勵,則制造更小的手持電子設(shè)備的限制在于鍵盤的物理尺寸。一般地,有兩種解決這種問題的方式。一種方式是調(diào)整用于文本輸入的移動電話固有的十?dāng)?shù)字鍵區(qū)。這要求每一個(gè)按鍵支持多字符輸入。第二種方式是通過集中(double up)字符來減少按鍵的數(shù)量,以尋求縮小傳統(tǒng)的全鍵盤,例如“qwerty”鍵盤。在這兩種情況下,通過對代表多個(gè)字符的按鍵的激勵而產(chǎn)生的輸入是不清楚的。設(shè)計(jì)不同的方案來對來自多個(gè)字符按鍵的輸入進(jìn)行解譯。一些方案要求激勵按鍵特定次數(shù)來標(biāo)識所期望的字符。其它的方案使用軟件來逐步縮小特定順序的鍵擊所預(yù)期的字母的可能組合。例如,這種方式使用能夠包含前綴、普通詞(generic word)、書面詞等的多個(gè)列表。
典型地,不同的應(yīng)用程序具有它們所利用的自己的數(shù)據(jù)庫或者多個(gè)數(shù)據(jù)庫。因此,地址簿應(yīng)用程序具有僅用于該應(yīng)用程序的它自己的地址列表,拼寫檢查程序具有它自己的單詞數(shù)據(jù)庫,以及盡管文本應(yīng)用程序可以具有特定一種語言的多個(gè)列表(例如,單詞列表;前綴列表;n-gram列表;學(xué)習(xí)列表),但是那些列表僅由該文本應(yīng)用程序使用。這會導(dǎo)致數(shù)據(jù)的重復(fù)和存儲器的低效率使用,限制了減少手持電子設(shè)備的大小、重量和能量使用的能力。
在可能期望多種不同語言的輸入(例如,英語/法語或英語/西班牙語)時(shí),文本輸入的無歧義問題甚至更加重要。在語言之間進(jìn)行切換以輸入該語言的單詞是不靈便的。此外,對于設(shè)備的空間需求更高。
存在對用于手持電子設(shè)備中的多語言文本輸入的系統(tǒng)和方法的改進(jìn)空間。

發(fā)明內(nèi)容
本發(fā)明滿足了這些需求及其它,本發(fā)明允許采用使用相同書寫字母或字母表(例如,拉丁文;西里爾字母)的多種不同語言中的語言數(shù)據(jù)的多語言文本輸入。這節(jié)省了空間,并且不需要在文本輸入期間在不同的語言之間進(jìn)行切換。
根據(jù)本發(fā)明的方案,手持電子設(shè)備中的一個(gè)或多個(gè)應(yīng)用程序(包括文本輸入應(yīng)用程序)共享一個(gè)或多個(gè)不同的語言數(shù)據(jù)庫,從而減小了存儲器的負(fù)擔(dān)。因此,例如,文本輸入應(yīng)用程序可以使用一個(gè)或多個(gè)不同的語言數(shù)據(jù)庫,用于來自多種不同語言的語言數(shù)據(jù)的多語言文本輸入。通常,應(yīng)用程序可以訪問來自一個(gè)語言數(shù)據(jù)庫的語言數(shù)據(jù),不同的語言數(shù)據(jù)庫中的一些或所有都包含可由它使用的語言數(shù)據(jù)。
根據(jù)本發(fā)明的一方面,一種用于手持電子設(shè)備中的多語言文本輸入的系統(tǒng)包括在手持電子設(shè)備中實(shí)現(xiàn)的至少一個(gè)應(yīng)用程序,所述至少一個(gè)應(yīng)用程序包括要求對可用的語言數(shù)據(jù)進(jìn)行訪問的文本輸入應(yīng)用程序;至少一個(gè)語言數(shù)據(jù)庫,包含來自多種不同語言的語言數(shù)據(jù),其中,多種不同的語言可由包括文本輸入應(yīng)用程序的所述至少一個(gè)應(yīng)用程序中的至少一個(gè)所使用;以及接口,用于向所述至少一個(gè)應(yīng)用程序提供對所述至少一個(gè)語言數(shù)據(jù)庫的不同語言的語言數(shù)據(jù)中的至少一些的訪問,以便包括文本輸入應(yīng)用程序的所述至少一個(gè)應(yīng)用程序接收不同的語言。
所述至少一個(gè)語言數(shù)據(jù)庫可以是包含來自兩種或更多種不同語言的混合信息的單個(gè)語言數(shù)據(jù)庫。
語言數(shù)據(jù)可以包括使用相同的書寫字母(script)或字母表的多種不同語言的混合。
所述至少一個(gè)語言數(shù)據(jù)庫可以是包含來自多種不同語言的信息的多個(gè)語言數(shù)據(jù)庫。
不同語言數(shù)據(jù)庫中的第一個(gè)可以包含來自不同語言中的第一語言的信息;以及不同語言數(shù)據(jù)庫中的第二個(gè)可以包含來自不同語言中的第二語言的信息。
不同語言數(shù)據(jù)庫中的第一個(gè)可以包含來自不同語言中的第一語言的信息;以及不同語言數(shù)據(jù)庫中的第二個(gè)可以包含來自不同語言中的第二語言和第三語言的信息。
作為本發(fā)明的另一方面,一種手持電子設(shè)備中的多語言文本輸入的方法包括在手持電子設(shè)備中實(shí)現(xiàn)至少一個(gè)應(yīng)用程序,所述至少一個(gè)應(yīng)用程序包括要求對可用的語言數(shù)據(jù)進(jìn)行訪問的文本輸入應(yīng)用程序;使用至少一個(gè)語言數(shù)據(jù)庫,所述至少一個(gè)語言數(shù)據(jù)庫包含來自多種不同語言的語言數(shù)據(jù),其中,多種不同語言可由包括文本輸入應(yīng)用程序的所述至少一個(gè)應(yīng)用程序中的至少一個(gè)所使用;以及將至少一個(gè)應(yīng)用程序與所述至少一個(gè)語言數(shù)據(jù)庫的不同語言的語言數(shù)據(jù)中的至少一些相接口,以便包括文本輸入應(yīng)用程序的所述至少一個(gè)應(yīng)用程序接收不同的語言。
該方法可以將包括來自兩種或更多種不同語言的混合信息的單個(gè)語言數(shù)據(jù)庫用作所述至少一個(gè)語言數(shù)據(jù)庫。
該方法可以將文本輸入應(yīng)用程序和拼寫檢查應(yīng)用程序用作所述至少一個(gè)應(yīng)用程序;并將可由文本輸入應(yīng)用程序和拼寫檢查應(yīng)用程序使用的多個(gè)單詞、以及僅可由文本輸入應(yīng)用程序使用的單詞的頻率數(shù)據(jù)包括在不同語言的語言數(shù)據(jù)中。
該方法可以輸入包括不同語言的語言數(shù)據(jù)中的至少一些的文本輸入;以及無縫地提供預(yù)測文本而不考慮不同語言的文本輸入。
該方法可以包括所述不同語言的所述語言數(shù)據(jù)中的所述至少一些包括使用相同的書寫字母或字母表的多種不同語言的混合。
該方法可以將包括來自多種不同語言的信息的多個(gè)不同語言數(shù)據(jù)庫用作至少一個(gè)語言數(shù)據(jù)庫。


當(dāng)結(jié)合附圖閱讀時(shí),可以從以下對優(yōu)選實(shí)施例的描述中獲得對本發(fā)明的全面理解,其中圖1是結(jié)合本發(fā)明的手持電子設(shè)備的前視圖。
圖2是示出了圖1的手持電子設(shè)備的主要組件的結(jié)構(gòu)框圖。
圖3是圖2示出的組件之一的數(shù)據(jù)適配器的功能圖。
圖4是示出了根據(jù)本發(fā)明實(shí)施例的圖1的手持電子設(shè)備的其它主要組件的結(jié)構(gòu)框圖。
圖5是示出了創(chuàng)建緊湊的語言數(shù)據(jù)的方法的流程圖。
具體實(shí)施例方式
盡管本發(fā)明可應(yīng)用于廣泛范圍內(nèi)的手持電子設(shè)備,但是結(jié)合縮減鍵盤5和文本輸入的歧義消解來公開本發(fā)明。
圖1示出了無線手持電子設(shè)備1,這只是可以應(yīng)用本發(fā)明的一種類型的手持電子設(shè)備。手持電子設(shè)備1包括鍵盤5和指輪6形式的輸入設(shè)備3,用于控制手持電子設(shè)備的功能并生成文本和其它輸入。鍵盤5構(gòu)成了緊湊的“qwerty”鍵盤,其中,每個(gè)按鍵7用于輸入字母表中的兩個(gè)或者甚至三個(gè)字母。因而,最初通過按下這些按鍵之一而生成的輸入的模糊之處在于,不確定想要選擇哪個(gè)字母。如先前所討論的,設(shè)計(jì)了不同的方案來消除由分配了多個(gè)字母用于輸入的這些按鍵7所生成的輸入的歧義。所使用的特定方案與本發(fā)明無關(guān)。然而,使用軟件來逐漸縮小特定順序的鍵擊所預(yù)期的字母的可能組合的文本輸入應(yīng)用程序使用特定一種語言的多個(gè)語言列表。公知地,在顯示器9上顯示通過鍵盤5和指輪6所提供的輸入。
轉(zhuǎn)向圖2,輸入設(shè)備3提供了對執(zhí)行系統(tǒng)11的鍵擊輸入,其中,執(zhí)行系統(tǒng)11可以是操作系統(tǒng)、java虛擬機(jī)、運(yùn)行時(shí)間環(huán)境等。手持電子設(shè)備1實(shí)現(xiàn)了多個(gè)應(yīng)用程序13。這些應(yīng)用程序可以包括地址簿15、文本輸入17、解譯應(yīng)用程序19、拼寫檢查應(yīng)用程序21和多個(gè)其它應(yīng)用程序,直至應(yīng)用程序n 23。
應(yīng)用程序13中的每個(gè)都要求對該應(yīng)用程序運(yùn)行并產(chǎn)生有意義輸出所需的數(shù)據(jù)進(jìn)行訪問。這種數(shù)據(jù)存儲于多個(gè)數(shù)據(jù)庫25中。例如,地址簿應(yīng)用程序15要求對存儲于地址數(shù)據(jù)庫27中的收件人姓名、郵件地址和/或電子郵件地址等進(jìn)行訪問。地址簿應(yīng)用程序15與多數(shù)其它應(yīng)用程序13的不同之處在于,地址簿應(yīng)用程序15僅從地址數(shù)據(jù)庫27中提取信息,地址數(shù)據(jù)庫27是尋址所需的特定數(shù)據(jù)的唯一位置。僅從一個(gè)數(shù)據(jù)庫中進(jìn)行提取的另一應(yīng)用程序是自動文本應(yīng)用程序(未示出)。自動文本應(yīng)用程序?qū)ν耆奈谋咎峁┝撕喕妮斎?如為“bestregards”提供“BR”)和其它簡寫的輸入。這種應(yīng)用程序通過允許用戶僅通過提供常用的單詞或詞組的隱含代碼來加速輸入而提高了效率。因此,其它更一般的數(shù)據(jù)庫不能向自動文本應(yīng)用程序提供有用的信息。
一些應(yīng)用程序13(如,文本輸入應(yīng)用程序17)利用多種類型的語言數(shù)據(jù)。例如,典型的無歧義類型的文本輸入應(yīng)用程序利用存儲于普通詞列表數(shù)據(jù)庫29中的普通詞列表。這種文本輸入應(yīng)用程序也可以使用存儲于新單詞列表數(shù)據(jù)庫31中的新單詞列表和存儲于學(xué)習(xí)列表數(shù)據(jù)庫33中的學(xué)習(xí)列表。文本輸入應(yīng)用程序17可以使用的、在圖2中未示出的附加列表可以包括前綴列表和n-gram列表。也可以提供主要與應(yīng)用程序23中的一個(gè)或多個(gè)相關(guān)聯(lián)的附加數(shù)據(jù)庫35(例如,不受限制地,一種或多種不同語言的語言)。
實(shí)現(xiàn)無歧義的文本輸入應(yīng)用程序17顯示在按鍵輸入序列中每一階段處可能的變量,其中,變量根據(jù)使用頻率進(jìn)行排序、并且整個(gè)單詞優(yōu)先。因此,主要與文本輸入應(yīng)用程序17相關(guān)聯(lián)、或?yàn)槲谋据斎霊?yīng)用程序17的使用所創(chuàng)建的數(shù)據(jù)庫包括使用數(shù)據(jù)的頻率,作為語言數(shù)據(jù)的一部分。例如,這包括普通詞列表數(shù)據(jù)庫29、新單詞列表數(shù)據(jù)庫31和學(xué)習(xí)列表數(shù)據(jù)庫33。
其它應(yīng)用程序可以使用主要用于一個(gè)應(yīng)用程序的數(shù)據(jù)庫。例如,拼寫檢查應(yīng)用程序21(在示例系統(tǒng)中,該應(yīng)用程序不具有特別為它創(chuàng)建的特定數(shù)據(jù)庫)可以利用其它數(shù)據(jù)庫中的數(shù)據(jù)。因此,拼寫檢查應(yīng)用程序從普通詞列表數(shù)據(jù)庫29、新單詞列表數(shù)據(jù)庫31和學(xué)習(xí)列表數(shù)據(jù)庫33中進(jìn)行提取。然而,拼寫檢查不需要、因而不使用這些數(shù)據(jù)庫中的使用數(shù)據(jù)頻率。這示出了以下示例一些數(shù)據(jù)庫包含了特定應(yīng)用程序可以使用的一些信息和不能使用的一些信息。
另一方面,利用使用數(shù)據(jù)頻率的文本輸入應(yīng)用程序17可以利用不提供使用數(shù)據(jù)頻率的數(shù)據(jù)庫,如,地址數(shù)據(jù)庫27。如將會解釋的,可以在不存在使用頻率的地方自動地分配使用頻率。應(yīng)當(dāng)注意,拼寫檢查應(yīng)用程序21也可以利用存儲于地址數(shù)據(jù)庫27中的數(shù)據(jù)。拼寫檢查應(yīng)用程序21不需要使用頻率,因而不需要生成如文本輸入應(yīng)用程序17的情況下的那種數(shù)據(jù)。
應(yīng)用程序13中的每個(gè)與數(shù)據(jù)庫25進(jìn)行通信,數(shù)據(jù)庫25包含應(yīng)用程序可以通過接口37使用的數(shù)據(jù)。在地址簿應(yīng)用程序15的情況下(僅可以利用來自地址數(shù)據(jù)庫27的數(shù)據(jù)),直接連接39提供了該接口。這種直接連接是公知的,其中,應(yīng)用程序可以形成對數(shù)據(jù)的請求,并以固定格式對響應(yīng)進(jìn)行處理??梢岳枚鄠€(gè)數(shù)據(jù)庫25中的數(shù)據(jù)的應(yīng)用程序(如,文本輸入應(yīng)用程序17)需要與每個(gè)這種數(shù)據(jù)庫相關(guān)聯(lián)的數(shù)據(jù)適配器41、以及數(shù)據(jù)適配器與應(yīng)用程序之間的通路43,作為接口37。在這種設(shè)置下,應(yīng)用程序用公式表達(dá)(formulate)了數(shù)據(jù)請求,該數(shù)據(jù)請求在適合的路徑43上轉(zhuǎn)發(fā)至與多個(gè)數(shù)據(jù)庫25相關(guān)聯(lián)的數(shù)據(jù)適配器41,其中,數(shù)據(jù)庫25包含數(shù)據(jù)請求可用的數(shù)據(jù)。數(shù)據(jù)適配器41從相關(guān)聯(lián)的數(shù)據(jù)庫中獲得所請求的數(shù)據(jù),并經(jīng)由適合的路徑43將數(shù)據(jù)返回應(yīng)用程序。因此,應(yīng)用程序可以響應(yīng)對數(shù)據(jù)的單個(gè)請求,接收來自多個(gè)數(shù)據(jù)庫的響應(yīng)。然后,例如,應(yīng)用程序通過消除重復(fù)響應(yīng)和對響應(yīng)進(jìn)行分類,來從由多個(gè)數(shù)據(jù)庫返回的響應(yīng)中進(jìn)行選擇。對響應(yīng)進(jìn)行分類可以包括根據(jù)使用頻率對響應(yīng)進(jìn)行分類。
圖3示出了數(shù)據(jù)適配器41的功能組織。接口模塊45接收對來自應(yīng)用程序13的數(shù)據(jù)的請求,并將該數(shù)據(jù)請求傳送至邏輯電路47,邏輯電路47用公式表達(dá)可由讀取器49理解的查詢,其中,該查詢包含來自應(yīng)用程序的數(shù)據(jù)請求中的自變量(argument)。讀取器49從相關(guān)聯(lián)的數(shù)據(jù)庫25中讀取所請求的數(shù)據(jù),并將該數(shù)據(jù)返回邏輯電路,邏輯電路通過接口模塊45,生成返回請求應(yīng)用程序13的響應(yīng)。在生成響應(yīng)的過程中,所選擇的邏輯電路47可以應(yīng)用于從數(shù)據(jù)庫接收到的結(jié)果。例如,當(dāng)請求應(yīng)用程序需要使用數(shù)據(jù)的頻率,而數(shù)據(jù)庫并不包含該信息時(shí),邏輯電路可以分配使用頻率。在示例性數(shù)據(jù)適配器41中,邏輯電路47應(yīng)用了使用頻率范圍內(nèi)的大約前25%的使用頻率??梢允褂闷渌O(shè)置來在所需時(shí)分配使用頻率。在分配使用頻率、或者從數(shù)據(jù)庫接收到使用頻率作為由讀取器返回的結(jié)果的一部分時(shí),可以在生成響應(yīng)的過程中應(yīng)用如根據(jù)使用頻率進(jìn)行分類之類的附加邏輯電路。然后,將由邏輯電路生成的響應(yīng)通過接口模塊返回請求應(yīng)用程序。
從以上可以理解,通過由多個(gè)應(yīng)用程序來共享多個(gè)數(shù)據(jù)庫,可以更加有效地使用手持電子設(shè)備的存儲資源,從而可以減小這種設(shè)備的尺寸、重量和能量消耗。
在處理語言詞典(如,語言數(shù)據(jù)庫35)的過程中包括與以上結(jié)合圖2和3所討論的相同的處理。盡管可以使用全鍵盤(未示出)或其它適合的輸入設(shè)備,但是所公開的方法和系統(tǒng)允許從圖1的縮減鍵盤5輸入來自不同語言的字符。如圖4所示,所公開的方法和系統(tǒng)使用圖1的手持電子設(shè)備中的一個(gè)或多個(gè)不同的語言數(shù)據(jù)庫51、53、55、57,提供了多語言文本輸入。在手持電子設(shè)備1中實(shí)現(xiàn)一個(gè)或多個(gè)應(yīng)用程序13(包括文本輸入應(yīng)用程序17),并且該應(yīng)用程序要求對可使用的語言數(shù)據(jù)進(jìn)行訪問。例如,每個(gè)應(yīng)用程序(如,圖4的17、21和23)需要對可由該應(yīng)用程序使用的不同語言數(shù)據(jù)59、61、63、65進(jìn)行訪問。不同的語言數(shù)據(jù)庫51、53、55、57包含來自可由應(yīng)用程序使用的多種不同語言的各個(gè)不同語言數(shù)據(jù)59、61、63、65。因而,接口41可以向應(yīng)用程序13中的一個(gè)或多個(gè)提供對不同語言數(shù)據(jù)庫51、53、55、57中的一個(gè)、一些或所有的訪問,以便包括文本輸入應(yīng)用程序17的那些應(yīng)用程序接收所述一個(gè)或多個(gè)數(shù)據(jù)庫的不同語言的語言數(shù)據(jù)中的至少一些。
將會理解,應(yīng)用程序13中的一些可以訪問不同語言數(shù)據(jù)庫51、53、55、57中的一個(gè)、一些或所有,以及各個(gè)不同的語言數(shù)據(jù)59、61、63、65。
所公開的方法和系統(tǒng)提供了使用相同的書寫字母或字母表的不同語言數(shù)據(jù)的多語言文本輸入(如,59、61、63、65),其中包括兩種或多種不同語言之間的混合(例如,不受限制地,英語、法語和德語)。這里,存在多個(gè)示例。
示例1第一示例是一個(gè)語言源51,包含來自兩種或多種不同語言的混合信息(例如,不受限制地,英語單詞、法語單詞和德語單詞,以及這些單詞中的每個(gè)的頻率)。
示例2第二示例是兩個(gè)或多個(gè)不同的語言源53、55,包含來自兩種或多種不同語言的各自不同的語言數(shù)據(jù)61、63。這里,不同的語言數(shù)據(jù)庫53、55包含來自使用相同的書寫字母或字母表的多種不同語言的信息。
示例3作為示例2的更加特定的示例,可以存在包含來自第一語言(例如,不受限制地,英語)的信息61的第一語言源53,以及包含來自第二、不同的語言(例如,不受限制地,德語)的信息63的第二、不同的語言源55。
示例4作為示例2的另一更加特定的示例,可以存在包含來自第一語言(例如,不受限制地,英語)的信息61的第一語言源53,以及包含來自兩個(gè)或多個(gè)第二、不同的語言(例如,不受限制地,法語和德語)的信息65的第二、不同的語言源57。
可以如以下結(jié)合示例5所討論地來創(chuàng)建語言數(shù)據(jù)(如,61)。
示例5圖5是示出了創(chuàng)建緊湊語言數(shù)據(jù)的方法的流程圖。該方法使用包含單詞頻率信息的單詞列表來產(chǎn)生緊湊語言數(shù)據(jù),并包括單詞前綴索引和統(tǒng)計(jì)字符替換。例如,見美國專利申請序列號No.10/289,656。
該方法在步驟500處,從由單詞頻率計(jì)算方法產(chǎn)生的輸出文件中讀取單詞列表。然后,對單詞列表中的單詞按照字母進(jìn)行分類。
該方法在步驟501繼續(xù),對單詞列表中的絕對頻率進(jìn)行歸一化。由相對頻率來代替每個(gè)絕對頻率。通過應(yīng)用可由用戶指定的函數(shù),將絕對頻率映射至相對頻率。可能的函數(shù)包括拋物線、高斯、雙曲線或線性分布。
該方法在的步驟502繼續(xù),創(chuàng)建字符映射表。字符映射表用于在后續(xù)步驟中對單詞進(jìn)行編碼。當(dāng)執(zhí)行編碼時(shí),使用字符映射表中的那些字符的字符索引來代替原始單詞中的字符。由于字母語言的字母表的大小遠(yuǎn)小于256,所以單個(gè)字節(jié)足以存儲統(tǒng)一字符編碼標(biāo)準(zhǔn)(Unicode)的字符數(shù)據(jù)。例如,如果統(tǒng)一字符編碼標(biāo)準(zhǔn)的字符0x3600位于字符映射表中的索引10處,則可以將該字符表示為10。字符在字符映射表中的位置并不重要,它基于字符出現(xiàn)在所給單詞列表中的順序。
該方法在步驟504繼續(xù),對單詞列表中的單詞進(jìn)行分組。每組中的單詞具有給定長度的公共前綴,并通過頻率來分類。單詞最初由兩個(gè)字符長的前綴進(jìn)行分組。如果以相同的兩字符前綴開始的單詞多于256個(gè),則將使用更長的前綴來執(zhí)行額外的分組。例如,如果單詞列表包含具有前綴“co”的520個(gè)單詞,則將會把該組分為具有前綴“com”、“con”等的前綴。
該方法在步驟506繼續(xù),產(chǎn)生為每組單詞設(shè)置的頻率。為了減小存儲頻率信息所需的空間量,僅以全精度保留每組單詞的最大頻率。將每個(gè)其它單詞的頻率保持為該組中的單詞最大頻率的百分比。該技術(shù)引起了一些精度損失,但是這對于文本輸入預(yù)測來說是可以接受的,并導(dǎo)致了頻率信息的較小存儲需求。
該方法以步驟508繼續(xù)。為了減小將單詞存儲于單詞列表中所需的數(shù)據(jù)量,使用替換索引來代替單詞中最頻繁出現(xiàn)的字符序列。n-gram(即,n個(gè)字符的序列)的替換實(shí)現(xiàn)了由單個(gè)字符來表示多個(gè)字符。將該信息存儲于替換表中。對替換表編索引,從而將每個(gè)n-gram映射至替換索引。然后,可以在每次n-gram出現(xiàn)在單詞中時(shí),通過使用替換表中的替換索引來代替每個(gè)n-gram,以將單詞壓縮。
該方法在步驟510繼續(xù),在步驟510中,如上所述,使用字符映射表和替換表,將單詞組編碼為字節(jié)序列。從單詞本身中刪除用于將單詞集合成組的前綴。結(jié)果,每個(gè)單詞由字節(jié)序列來表示,字節(jié)序列包括在給定前綴的情況下找到原始單詞所需的所有數(shù)據(jù)。
該方法在步驟511繼續(xù),創(chuàng)建單詞定義表。單詞定義表存儲在步驟506處計(jì)算的頻率設(shè)置和在510處產(chǎn)生的編碼后的數(shù)據(jù)。
該方法在步驟512繼續(xù),創(chuàng)建偏移表。偏移表包含表示單詞組的字節(jié)序列。該表實(shí)現(xiàn)了對表示特定單詞組的字節(jié)序列的開始的標(biāo)識。偏移表用于對字節(jié)序列進(jìn)行定位,該字節(jié)序列包括以公共前綴開始的特定組的編碼后的單詞。
該方法以步驟514結(jié)束。在該步驟中,將由該方法所產(chǎn)生的語言數(shù)據(jù)存儲于已經(jīng)創(chuàng)建了的表中。將數(shù)據(jù)表(包括字符映射表、替換表、偏移表和單詞定義表)存儲于輸出文件中。
可選地,可以在步驟514處存儲在創(chuàng)建緊湊語言數(shù)據(jù)的方法期間收集的統(tǒng)計(jì)數(shù)據(jù)。統(tǒng)計(jì)數(shù)據(jù)包括存儲于替換表中的n-gram在語言數(shù)據(jù)中的單詞中出現(xiàn)的頻率、語言數(shù)據(jù)中的單詞的個(gè)數(shù)、單詞列表和從中生成單詞列表的語料庫(corpus)、語言數(shù)據(jù)中的單詞個(gè)數(shù)與單詞列表和語料庫之間的比。
將會理解,以上的示例5的教導(dǎo)可以應(yīng)用于使用相同的書寫字母或字母表的不同語言(例如,英語;法語;德語)。
以下的示例6-8包括使用圖4的不同語言數(shù)據(jù)庫51、53、55、57中的一個(gè)、一些或所有的不同應(yīng)用程序13。這些應(yīng)用程序以相同的方式工作,除了對于文本預(yù)測(示例6和7),應(yīng)用程序17請求以不同的可能前綴開始的所有單詞,而對于歧義消解,應(yīng)用程序17僅請求對于每個(gè)可能前綴的最頻繁使用的單詞。
示例6文本應(yīng)用程序17包括使用圖1的縮減鍵盤5的文本預(yù)測。在文本輸入時(shí),系統(tǒng)使用來自不同的語言源51、53、55、57的一個(gè)、一些或所有的不同語言數(shù)據(jù)59、61、63、65中的一個(gè)、一些或所有,以無縫地提供預(yù)測文本,而不考慮輸入文本屬于什么語言。
示例7諸如23的另一文本輸入應(yīng)用程序包括使用全鍵盤(未示出)的文本預(yù)測。同樣,在文本輸入時(shí),系統(tǒng)使用來自不同的語言源51、53、55、57的一個(gè)、一些或所有的不同語言數(shù)據(jù)59、61、63、65中的一個(gè)、一些或所有,來無縫地提供預(yù)測文本,而不考慮輸入文本屬于什么語言。
示例8應(yīng)用程序21包括拼寫檢查。系統(tǒng)包括文本輸入應(yīng)用程序17和拼寫檢查應(yīng)用程序21。不同的語言數(shù)據(jù)庫51、53、55、57包括可由文本輸入應(yīng)用程序17和拼寫檢查應(yīng)用程序21使用的多個(gè)單詞、以及僅可由文本輸入應(yīng)用程序17使用的單詞的頻率數(shù)據(jù)67、69、71、73。
盡管為了公開的清楚,這里參考了示例性顯示器9,用于顯示在按鍵輸入序列中的每個(gè)階段處可能的不同情況、以及來自執(zhí)行系統(tǒng)11的其它輸出信息,但是將會理解,這種信息可以在硬拷貝上存儲、打印,可以經(jīng)計(jì)算機(jī)修改,或者可以與其它數(shù)據(jù)組合。應(yīng)當(dāng)認(rèn)為所有這種處理均落入了這里所使用的術(shù)語“顯示器(display)”或“顯示(displaying)”的范圍內(nèi)。
盡管詳細(xì)地示出了本發(fā)明的特定實(shí)施例,但是本領(lǐng)域的技術(shù)人員將會理解,根據(jù)該公開的整個(gè)教導(dǎo),可以對細(xì)節(jié)進(jìn)行不同的修改和改變。因此,所公開的特定設(shè)置僅是示意性的,但是并不作為對本發(fā)明范圍的限制,本發(fā)明的范圍由所附權(quán)利要求及其等同物給出。
權(quán)利要求
1.一種用于手持電子設(shè)備中的多語言文本輸入的系統(tǒng),所述系統(tǒng)包括在所述手持電子設(shè)備中實(shí)現(xiàn)的至少一個(gè)應(yīng)用程序,所述至少一個(gè)應(yīng)用程序包括要求對可由所述至少一個(gè)應(yīng)用程序使用的語言數(shù)據(jù)進(jìn)行訪問的文本輸入應(yīng)用程序;至少一個(gè)語言數(shù)據(jù)庫,所述至少一個(gè)語言數(shù)據(jù)庫包含來自多種不同語言的語言數(shù)據(jù),所述語言數(shù)據(jù)可由包括所述文本輸入應(yīng)用程序的所述至少一個(gè)應(yīng)用程序中的至少一個(gè)使用;以及接口,用于向所述至少一個(gè)應(yīng)用程序提供對所述至少一個(gè)語言數(shù)據(jù)庫的所述不同語言的所述語言數(shù)據(jù)中的至少一些進(jìn)行訪問,以便包括所述文本輸入應(yīng)用程序的所述至少一個(gè)應(yīng)用程序接收所述不同的語言。
2.如權(quán)利要求1所述的系統(tǒng),其中,所述至少一個(gè)語言數(shù)據(jù)庫是單個(gè)語言數(shù)據(jù)庫,包含來自兩種或多種不同語言的混合信息。
3.如權(quán)利要求1或2所述的系統(tǒng),其中,所述至少一個(gè)應(yīng)用程序包括所述文本輸入應(yīng)用程序和拼寫檢查應(yīng)用程序。
4.如權(quán)利要求1至3之一所述的系統(tǒng),其中,所述文本輸入應(yīng)用程序使用縮減鍵盤。
5.如權(quán)利要求1至4之一所述的系統(tǒng),其中,所述語言數(shù)據(jù)包括使用相同書寫字母或字母表的多種不同語言的混合。
6.如權(quán)利要求1至5之一所述的系統(tǒng),其中,所述至少一個(gè)語言數(shù)據(jù)庫是包含來自多種不同語言的信息的多個(gè)語言數(shù)據(jù)庫。
7.如權(quán)利要求6所述的系統(tǒng),其中,所述不同語言數(shù)據(jù)庫中的第一個(gè)包括來自所述不同語言中的第一語言的信息;以及所述不同語言數(shù)據(jù)庫中的第二個(gè)包含來自所述不同語言中的第二語言的信息。
8.如權(quán)利要求7所述的系統(tǒng),其中,所述第一語言是英語,所述第二語言是德語。
9.如權(quán)利要求6所述的系統(tǒng),其中,所述不同語言數(shù)據(jù)庫中的第一個(gè)包含來自所述不同語言中的第一語言的信息;以及所述不同語言數(shù)據(jù)庫中的第二個(gè)包含來自所述不同語言中的第二語言和第三語言的信息。
10.如權(quán)利要求9所述的系統(tǒng),其中,所述第一語言是英語,所述第二語言是法語,以及所述第三語言是德語。
11.一種手持電子設(shè)備中的多語言文本輸入的方法,所述方法包括在所述手持電子設(shè)備中實(shí)現(xiàn)至少一個(gè)應(yīng)用程序,所述至少一個(gè)應(yīng)用程序包括要求對可由所述至少一個(gè)應(yīng)用程序使用的語言數(shù)據(jù)進(jìn)行訪問的所述文本輸入應(yīng)用程序;使用至少一個(gè)語言數(shù)據(jù)庫,所述至少一個(gè)語言數(shù)據(jù)庫包含來自多種不同語言的語言數(shù)據(jù),其中,所述多種不同的語言可由包括所述文本輸入應(yīng)用程序的所述至少一個(gè)應(yīng)用程序中的至少一個(gè)使用;以及將所述至少一個(gè)應(yīng)用程序與所述至少一個(gè)語言數(shù)據(jù)庫的所述不同語言的所述語言數(shù)據(jù)中的至少一些相接口,以便包括所述文本輸入應(yīng)用程序的所述至少一個(gè)應(yīng)用程序接收所述不同語言。
12.如權(quán)利要求11所述的方法,還包括將包括來自兩種或更多種不同語言的混合信息的單個(gè)語言數(shù)據(jù)庫用作所述至少一個(gè)語言數(shù)據(jù)庫。
13.如權(quán)利要求11或12所述的方法,還包括將所述文本輸入應(yīng)用程序和拼寫檢查應(yīng)用程序用作所述至少一個(gè)應(yīng)用程序;以及將由文本輸入應(yīng)用程序和拼寫檢查應(yīng)用程序使用的多個(gè)單詞、以及僅可由文本輸入應(yīng)用程序使用的單詞頻率數(shù)據(jù)包括在所述不同語言的所述語言數(shù)據(jù)中。
14.如權(quán)利要求11至13之一所述的方法,還包括輸入包括所述不同語言的所述語言數(shù)據(jù)中的所述至少一些的文本輸入;以及無縫地提供預(yù)測文本而不考慮不同語言的所述文本輸入。
15.如權(quán)利要求14所述的方法,還包括從縮減鍵盤輸入所述文本輸入。
16.如權(quán)利要求11至15之一所述的方法,還包括所述不同語言的所述語言數(shù)據(jù)中的所述至少一些包括使用相同的書寫字母或字母表的多種不同語言的混合。
17.如權(quán)利要求11至16之一所述的系統(tǒng),還包括將包括來自多種不同語言的信息的多個(gè)不同語言數(shù)據(jù)庫用作所述至少一個(gè)語言數(shù)據(jù)庫。
18.如權(quán)利要求17所述的方法,還包括所述不同語言數(shù)據(jù)庫中的第一個(gè)包括來自所述不同語言中的第一語言的信息;以及所述不同語言數(shù)據(jù)庫中的第二個(gè)包括來自所述不同語言中的第二語言的信息。
19.如權(quán)利要求17所述的方法,還包括所述不同語言數(shù)據(jù)庫中的第一個(gè)包括來自所述不同語言中的第一語言的信息;以及所述不同語言數(shù)據(jù)庫中的第二個(gè)包括來自所述不同語言中的第二語言和第三語言的信息。
20.如權(quán)利要求11至19之一所述的方法,還包括將所述文本輸入應(yīng)用程序和拼寫檢查應(yīng)用程序用作所述至少一個(gè)應(yīng)用程序。
全文摘要
一種系統(tǒng)提供了手持電子設(shè)備中的多語言文本輸入。該系統(tǒng)包括在手持電子設(shè)備中實(shí)現(xiàn)的一個(gè)或多個(gè)應(yīng)用程序,應(yīng)用程序包括要求對應(yīng)用程序可用的語言數(shù)據(jù)進(jìn)行訪問的文本輸入應(yīng)用程序。一個(gè)或多個(gè)語言數(shù)據(jù)庫包含來自多種不同語言的語言數(shù)據(jù),其中,該語言數(shù)據(jù)可由包括文本輸入應(yīng)用程序的至少一個(gè)應(yīng)用程序使用。接口向應(yīng)用程序提供了對一個(gè)或多個(gè)語言數(shù)據(jù)庫的不同語言的語言數(shù)據(jù)中的至少一些進(jìn)行訪問,以便包括文本輸入應(yīng)用程序的應(yīng)用程序接收不同的語言。
文檔編號G06F17/27GK101027628SQ200580032706
公開日2007年8月29日 申請日期2005年8月30日 優(yōu)先權(quán)日2004年8月31日
發(fā)明者瓦迪姆·富克斯, 麥克爾·G·葉利扎羅夫 申請人:捷訊研究有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
特克斯县| 广灵县| 磴口县| 新宁县| 应城市| 湖南省| 苏尼特右旗| 比如县| 丹东市| 合肥市| 钟祥市| 论坛| 讷河市| 河曲县| 永登县| 贵阳市| 临沂市| 海原县| 桂阳县| 台南县| 南召县| 慈利县| 德阳市| 阿克| 翼城县| 万安县| 社旗县| 峨边| 忻城县| 舞钢市| 南阳市| 旅游| 霍山县| 基隆市| 驻马店市| 霸州市| 合作市| 宣威市| 澄城县| 南川市| 汨罗市|