欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于亞洲語言的手寫輸入的制作方法

文檔序號:6407221閱讀:176來源:國知局
專利名稱:用于亞洲語言的手寫輸入的制作方法
技術(shù)領(lǐng)域
本發(fā)明的方面涉及硬件和軟件產(chǎn)品,尤其涉及向用戶提供以亞洲語言輸入信息的改進(jìn)過程。
(2)背景技術(shù)計(jì)算系統(tǒng)以多種語言存在。這些語言包括單詞的基于字符的表示和基于符號的表示。盡管在世界上廣泛使用西文104鍵盤,然而基于符號的語言的用戶需要一種使用鍵盤所提供的有限輸入來輸入符號的方法。一種輸入符號語言的方式是使用對一種語言專用的輸入法編輯器(微軟公司的IME)。
亞洲語文本輸入是當(dāng)今最具挑戰(zhàn)性的計(jì)算問題之一。它一直是亞洲語言計(jì)算的瓶頸。亞洲語言字符集隨Unicode(統(tǒng)一代碼)標(biāo)準(zhǔn)的每一次修訂而不斷增長。例如,Unicode 2.0中定義的CJK(中文、日文、韓文)字符為20,902字符。Unicode3.0中包括了27,484個(gè)字符。擴(kuò)展B進(jìn)一步添加了40,771個(gè)字符。
IME提供了一種將英文字母轉(zhuǎn)換成亞洲語字符的轉(zhuǎn)換引擎。一般而言,對亞洲語字符的編碼基于亞洲語字符的語音。這可能包括字母或字母和數(shù)字的組合。有時(shí)候,需要將英文發(fā)音轉(zhuǎn)換成亞洲語言的發(fā)音。而且,英文文本可能與亞洲文本相組合(和/或與符號、拼音字母/字符和亞洲語象形文字(中文字符)混合),因此需要能夠快速且容易地在編碼方法之間進(jìn)行切換。
有許多與前述方法相關(guān)的問題a.盡管手寫輸入比鍵盤輸入更自然,然而鍵盤輸入仍是亞洲語言的主要輸入機(jī)制。
b.盡管手寫輸入通常對中文字符來說速度較快,然而拼音的鍵盤打字速度較慢。
c.傳統(tǒng)的手寫識別輸入需要用戶書寫中文字符(東亞象形文字)。因?yàn)橹形淖址稍S多筆畫組成,因此書寫中文字符較復(fù)雜。同時(shí),當(dāng)前中文手寫體識別輸入法需要用戶以分離的筆畫(非草體的)書寫,來達(dá)到較高的識別率(精確度)。組合而言,復(fù)雜性、非草體性書寫以及低精確度(基于誤差糾正率)令手寫體識別輸入的速度變慢。
需要一種改進(jìn)的系統(tǒng)來使得用戶能夠快速且容易地以亞洲語言輸入文本。
(3)發(fā)明內(nèi)容本發(fā)明的各方面解決上述一個(gè)或多個(gè)問題,由此為以亞洲語言的文本輸入提供一種解決方案。本發(fā)明的各方面包括使用輸入筆輸入信息的能力。
參照附圖和相關(guān)描述說明這些和其它方面。
(4)


本發(fā)明的各個(gè)方面在附圖中說明。
圖1和2示出了支持本發(fā)明一個(gè)或多個(gè)方面的通用計(jì)算環(huán)境。
圖3和4示出了能夠使用本發(fā)明的各方面的各類硬件用戶接口設(shè)備。
圖5-8示出了依照本發(fā)明各方面的各類用戶接口。
圖9示出了依照本發(fā)明實(shí)施例用于輸入手寫信息的用戶接口。
圖10和11示出了手寫信息的示例。
圖12-13示出了依照本發(fā)明各方面的流程圖。
(5)具體實(shí)施方式
本發(fā)明的各方面涉及提供以亞洲語言輸入文本的能力。
下文被分成各個(gè)部分來幫助用戶理解。這些標(biāo)題包括墨水的特征;通用計(jì)算環(huán)境;硬件輸入;用戶接口;以及手寫用戶輸入接口。
墨水的特征使用墨水鋼筆的用戶知道,物理墨水(使用具有墨水囊的鋼筆時(shí)留在紙上的那一種)可能比一系列由直線段連接的坐標(biāo)傳達(dá)更多的信息。例如,物理墨水可以反映鋼筆壓力(由墨水的濃度來反映)、鋼筆角度(由直線或曲線段的形狀和離散點(diǎn)附近的墨水的形態(tài)來反映)以及鋼筆尖的速度(由直線性、線寬和隨直線或曲線的路線的線寬改變來反映)。因?yàn)檫@些額外的性質(zhì),要比使用點(diǎn)之間的統(tǒng)一線段寬度更能傳遞感情、個(gè)性、強(qiáng)調(diào)等等信息。
電子墨水(或墨水)涉及當(dāng)用戶使用基于輸入筆的輸入設(shè)備時(shí)所捕獲的電子信息的捕獲和顯示。電子墨水是指一列筆畫,其中每一筆畫包括一系列點(diǎn)。點(diǎn)能夠用多種已知技術(shù)來表示,包括笛卡爾(Cartesian)坐標(biāo)(X,Y)、極坐標(biāo)(r,Θ)以及本領(lǐng)域已知的其它技術(shù)。電子墨水可包括對真實(shí)墨水的性質(zhì),包括壓力、角度、速度、顏色、筆尺寸以及墨水的不透明性的表示。電子墨水還可包括其它特性,包括墨水沉積到頁面上的順序(對大多數(shù)西文語言來說是從左到右然后往下的線柵方式)、時(shí)間信息(指示墨水何時(shí)沉積)、對墨水的作者的指示以及起源設(shè)備(墨水在其上汲取的機(jī)器的標(biāo)識或用于沉積墨水的鋼筆的標(biāo)識的至少其中之一)。
術(shù)語墨水具有特性的筆畫序列或筆畫集。一個(gè)筆畫序列可包括按序排列的筆畫。該序列可能以捕獲時(shí)間為序或以筆畫出現(xiàn)在頁上位置為序或者在協(xié)作的情況下按墨水的作者排序。也可以使用其它順序。筆畫集可包括多個(gè)筆畫序列或未排序筆畫或其任意組合。一些性質(zhì)還可能對每一筆畫或筆畫中的點(diǎn)來說是特有的(例如,壓力、速度、角度等等)。這些性質(zhì)可儲存在筆畫級或點(diǎn)級,而非墨水級。
墨水對象儲存帶有性質(zhì)或不帶有性質(zhì)的墨水的數(shù)據(jù)結(jié)構(gòu)。
筆畫捕獲的點(diǎn)的序列或集合。例如,當(dāng)顯示時(shí),點(diǎn)的序列可用直線來連接。可選地,筆畫可以以點(diǎn)和在下一點(diǎn)的方向上的矢量來表示。簡而言之,筆畫包含與墨水相關(guān)的點(diǎn)或線段的任意表示,而不考慮點(diǎn)和/或連接點(diǎn)的東西背后隱含的表示是什么。
點(diǎn) 定義在空間中所處位置的信息。例如,點(diǎn)可以是相對于捕獲空間(例如,數(shù)字化儀上的點(diǎn))、虛擬墨水空間(向其中放置捕獲的墨水的空間中的坐標(biāo))和/或顯示空間(顯示設(shè)備的點(diǎn)或像素)來定義。
文檔具有可見的表示和內(nèi)容的電子文件。文檔可包括web頁、字處理文檔、記事頁或記事簿、電子表格、可視演示、數(shù)據(jù)庫記錄、圖像文件、以及它們的組合。
通用計(jì)算環(huán)境圖1和2說明了適于在其中實(shí)現(xiàn)本發(fā)明的操作環(huán)境100和201的示例。操作環(huán)境100和201僅為合適的計(jì)算環(huán)境的幾個(gè)示例,并非對本發(fā)明的使用或功能的范圍的限制。適于本發(fā)明使用的其它眾所周知的計(jì)算系統(tǒng)、環(huán)境和/或配置包括但不限于,個(gè)人計(jì)算機(jī)、服務(wù)器計(jì)算機(jī)、手持式或膝上設(shè)備、多處理器系統(tǒng)、基于微處理器的系統(tǒng)、可編程消費(fèi)者電子設(shè)備、網(wǎng)絡(luò)PC、小型機(jī)、大型機(jī)、包括任一上述系統(tǒng)或設(shè)備的分布式計(jì)算環(huán)境等等。
本發(fā)明的各個(gè)方面可以在計(jì)算機(jī)可執(zhí)行指令的一般語境下描述,計(jì)算機(jī)可執(zhí)行指令如由一個(gè)或多個(gè)計(jì)算機(jī)或其它設(shè)備執(zhí)行的程序模塊。一般而言,程序模塊包括例程、算法、程序、對象、組件、數(shù)據(jù)結(jié)構(gòu)等等,執(zhí)行特定的任務(wù)或?qū)崿F(xiàn)特定的抽象數(shù)據(jù)類型。通常而言,根據(jù)各種實(shí)施例所期望的,程序模塊的功能可以組合或分布。
計(jì)算設(shè)備系統(tǒng)100和201通常包括至少某些形式的計(jì)算機(jī)可讀媒質(zhì)。計(jì)算機(jī)可讀媒質(zhì)可以是任一服務(wù)器103或系統(tǒng)201可訪問的可用媒質(zhì)。作為示例而非限制,計(jì)算機(jī)可讀媒質(zhì)可包括計(jì)算機(jī)存儲媒質(zhì)和通信媒質(zhì)。計(jì)算機(jī)存儲媒質(zhì)包括易失和非易失、可移動和不可移動媒質(zhì),以任一方法或技術(shù)實(shí)現(xiàn)以儲存諸如計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其它數(shù)據(jù)的信息。計(jì)算機(jī)存儲媒質(zhì)包括但不限于,RAM、ROM、EEPROM、閃存或其它存儲器技術(shù)、CD-ROM、數(shù)字多功能盤(DVD)或其它光學(xué)存儲、盒式磁帶、磁帶、磁盤存儲或其它磁存儲設(shè)備或其它任一可用來儲存期望的信息并可由服務(wù)器103或系統(tǒng)201訪問的媒質(zhì)。通信媒質(zhì)通常包括以已調(diào)制數(shù)據(jù)信號如載波或其它傳輸機(jī)制形式的計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其它數(shù)據(jù),并包括任何信息傳遞媒質(zhì)。術(shù)語“已調(diào)制數(shù)據(jù)信號”指其一個(gè)或多個(gè)特征以對信號內(nèi)信息編碼的方式設(shè)定或改變的信號。作為示例而非局限,通信媒質(zhì)包括有線媒質(zhì)如有線網(wǎng)絡(luò)或直接連線連接、以及無線媒質(zhì)如聲學(xué)、RF、紅外和其它無線媒質(zhì)。上述任一組合也應(yīng)當(dāng)包括在計(jì)算機(jī)可讀媒質(zhì)的范圍之內(nèi)。
參考圖2,用于實(shí)現(xiàn)本發(fā)明的各方面的說明性系統(tǒng)包括計(jì)算裝置,如裝置201。在其最基本的配置中,裝置201通常包括處理單元204和存儲器203。根據(jù)計(jì)算裝置的確切配置和類型,存儲器203可以是易失(如RAM)、非易失(如ROM、閃存等等)或兩者的某一組合。此外,裝置201也可具有大容量存儲(可移動和/或不可移動)如磁或光盤或帶205-206。類似地,裝置201也可具有輸入設(shè)備如208(包括鼠標(biāo)、輸入筆、鍵盤、軌跡球等等)和/或輸出設(shè)備207如顯示器等等。裝置201的其它方面可包括采用有線或無線媒質(zhì)210的到其它裝置、計(jì)算機(jī)、網(wǎng)絡(luò)、服務(wù)器等等的網(wǎng)絡(luò)連接209。所有這些裝置在本領(lǐng)域是眾所周知的,并且無須在此詳細(xì)討論。
硬件輸入存在各類與本發(fā)明的各方面相關(guān)的用于將手寫信息輸入到系統(tǒng)的輸入。
圖3示出了接收手寫輸入并將輸入前向傳送到輸入識別器303的數(shù)字化儀301,輸入識別器303然后將識別的輸入前向傳送到操作系統(tǒng)和/或應(yīng)用304。系統(tǒng)也可包括接收被前向傳送到輸入識別器的用戶輸入的鍵盤302。這里,輸入識別器303可以是單獨(dú)的IME或者具有額外性能的IME。例如,輸入識別器303可包括識別手寫體的手寫體識別引擎。如果要識別的字符的數(shù)量有限制,則可以提高識別精確度。這里,例如,如果使用拼音,則僅需要識別408個(gè)字符/組合。這些可以是僅英文、英文和具有中文字符的簡體中文或具有中文字符的簡體中文。
圖4示出了圖3的一個(gè)修改。在圖4中,可以使用各類數(shù)字化儀(包括有源數(shù)字化儀301A和無源數(shù)字化儀301B)。本發(fā)明的各方面也可使用任一鍵數(shù)(N)的鍵盤302A。手寫輸入可以由手寫體輸入識別器401來識別。手寫體識別器的輸出然后由TME識別器402來識別。從鍵盤302A的輸出可以由IME識別器402識別。
系統(tǒng)可以帶硬件鍵盤使用或者不帶硬件鍵盤使用。例如,拼音手寫輸入時(shí)可以配鍵盤或不配。例如,可以使用輸入筆或其它指向設(shè)備來畫字符或?qū)憜卧~,這些字符或單詞可由手寫體識別器識別。例如,可以使用具有各種筆畫的電子墨水作為對識別器的輸入。手寫體識別器然后可以耦合至IME識別器來識別來自手寫體識別器的輸入。
手寫體識別器401可以與IME識別器402的一些方面脫離或緊密聯(lián)系。例如,手寫體識別器401可在其預(yù)定的識別信息的基礎(chǔ)上識別筆畫或其它輸入??蛇x地,手寫體識別器401可使用IME識別器402的核心變換引擎的一部分。
用戶接口各類用戶接口可用于特殊鍵和IME的組合。圖5-9示出了用于拼音IME的各類用戶接口。這些可用于多種鍵盤。
圖5示出了顯示信息來協(xié)助用戶撰寫字符的各種區(qū)域。撰寫窗顯示為區(qū)域1101。撰寫窗1101包括已撰寫的字符1102和正在撰寫的字符1103。圖5還包括候選者窗1104,顯示匹配1103中的字符的語音的候選者。用戶然后可以選擇合適的候選者,該候選者替換1103并添加到已撰寫字符1102中。最后,圖5示出了狀態(tài)條1105。
圖6示出了確定的串1201和狀態(tài)條1202。圖6示出了重變換之前的用戶接口。這里,1201中的字符已被確定。
圖7示出了撰寫窗1301、候選者列表1302和狀態(tài)條1303。在重變換之后,來自頁的文本串加載回撰寫窗1301,并顯示候選者列表1302。在圖6中,用戶可以輸入文本并讓系統(tǒng)選取合適的字符。在圖7中,用戶向系統(tǒng)要求額外的機(jī)會來將文本修改為用戶所需要的。
圖8示出了用戶自造詞工具。這里,用戶可輸入所喜歡的語音輸入字符。這里,這些可稱為用戶自造詞。例如,如果正在鍵入技術(shù)文檔并且一個(gè)詞組比其它詞組要更經(jīng)常地用到,可以向用戶提供指定語音文本應(yīng)當(dāng)與之相應(yīng)的字符的能力。這使得字符輸入更快。
手寫輸入用戶接口上述部分描述了要變換的信息的鍵盤輸入??梢允褂玫钠渌斎敕绞桨ㄊ謱戄斎牒驮捯糨斎搿O挛拿枋隽耸褂秒娮幽挠糜谧珜憗喼拚Z言的語音輸入。
在東亞語言中,使用CJK(中文、日文和韓文)字符來撰寫語言,然而語言的發(fā)音是用各種語音模式來表示的。語音模式包括有限的語音字母。例如,在中文中,語音模式稱為拼音。如上所述,語音字母與英文中的字母相同。無聲調(diào)的有效拼音是408個(gè)音節(jié)。在Unicode 2.0中的CJK字符為20,902個(gè),然而在東亞語言中使用的超過了80,000個(gè)。
傳統(tǒng)的方法使用手寫輸入的筆畫識別。然而,以草體書寫,尤其是類似記錄筆記的情形中,這些方法受到字符的復(fù)雜性和令人滿意的識別精確率的限制。
中文鍵盤IME使用本領(lǐng)域已熟知的統(tǒng)計(jì)學(xué)語言模型將拼音轉(zhuǎn)換為中文字符。這里描述的手寫體識別將CJK(字符)的手寫體墨水轉(zhuǎn)換成文本CJK字符(也稱為字符手寫體識別)。本發(fā)明的一些方面將手寫體識別與中文鍵盤IME相組合。這些方面將手寫體輸入和識別的自然特性與基于鍵盤的IME轉(zhuǎn)換引擎業(yè)已證實(shí)的效率相組合。與書寫復(fù)雜的中文字符相比較,以拼音書寫(使用英文單詞或字符的等效物)較快,這是由于減少了完成一個(gè)單詞或語音所需要的筆畫數(shù)。在其它方面,拼音輸入中的書寫方式可以是草體的,而提供了基于正在逐步撰寫的所期望的字符(或語音部分)以及有限的有效拼音詞匯(408)的更高的識別精確度。簡而言之,直接字符手寫體識別由于精確度、使用簡易性和效率等方面的問題而不如基于鍵盤的IME流行。
如本領(lǐng)域所已知的,東亞鍵盤IME因其以較好的精確度將語音(這里為中文中的拼音)轉(zhuǎn)換為CJK字符的語言模型和算法而成功。拼音的語音輸入包括有限的輸入26個(gè)英文字母的408種有效組合?;谶@一有限的詞匯,手寫體識別系統(tǒng)能夠識別輸入語音并生成可以利用的結(jié)果。
通過組合拼音的手寫輸入、手寫體輸入的識別以及拼音到中文字符的向下轉(zhuǎn)換,可以實(shí)現(xiàn)以下目的的一個(gè)或多個(gè)·拼音的手寫輸入對使用較小用戶接口(如在手持式計(jì)算設(shè)備和蜂窩電話上)的用戶來說更簡易;·人們可以直接忘記如何書寫完整、復(fù)雜的中文象形文字字符;·在一些實(shí)例中,書寫拼音(英文字母)比書寫中文字符更簡單;·給定其有限的詞匯,系統(tǒng)對拼音串比對復(fù)雜的中文字符具有更高的識別率;·草體手寫體識別技術(shù)通常對拉丁字母很成功,然而在東亞字符手寫體技術(shù)中卻不是很成功;以及·拼音到中文字符的轉(zhuǎn)換在基于鍵盤的IME中是成功的。
拼音手寫體識別引擎可包括一個(gè)或多個(gè)識別組件。首先,它包括識別草體英文輸入的標(biāo)準(zhǔn)英文手寫體識別引擎。這一識別引擎可局限于或不局限于有效拼音的詞匯集(例如,408個(gè)拼音)。這是與更大的英語單詞的詞匯相比較而言的。其次,它可包括與中文鍵盤IME引擎相關(guān)的拼音-中文字符轉(zhuǎn)換引擎(例如,微軟公司的MSPY IME)??蛇x地,可以使用另一語音-字符識別引擎來代替拼音IME(例如,將其它任意輸入轉(zhuǎn)換為日文、韓文和中文的引擎)。
此外,手寫體識別輸入(識別由筆畫組成的象形中文字符的能力)涉及傳統(tǒng)的撰寫手寫字符的方法。這里,拼音(語音)手寫體輸入提供了用于快速輸入文本(例如,在記錄筆記的情形)的輸入技術(shù),組合了手寫體識別技術(shù)和語音-中文字符轉(zhuǎn)換技術(shù)。
圖9示出了用于手寫輸入的用戶接口。區(qū)域1601顯示從拼音轉(zhuǎn)換的中文字符。區(qū)域1602顯示基于輸入手寫墨水的新候選者。這里,區(qū)域1602中的候選者是手寫體識別引擎的結(jié)果,其結(jié)果顯示在區(qū)域1603中(具有英文語音拼音串-這里為“hua”)并在區(qū)域1604中具有中文字符候選者列表。這里,區(qū)域1602由來自1604的第一候選者所填充。區(qū)域1605是用戶輸入新手寫信息之處。這里,用戶輸入“mao”的英文草體表示版本。隨后,“mao”的候選者出現(xiàn)在區(qū)域1603中,其中文等效物出現(xiàn)在區(qū)域1604中。
使用本系統(tǒng),區(qū)域1605中的輸入的識別可開始于在用戶從接觸區(qū)域抬起輸入筆時(shí)、在用戶定位到另一范圍時(shí)、輕拍發(fā)送按鈕時(shí)、改變焦點(diǎn)時(shí)或在區(qū)域1605中的墨水輸入之后出現(xiàn)延遲時(shí)。其它事件也可觸發(fā)區(qū)域1605中的墨水的識別。
區(qū)域1605中的輸入可以有多種形式。例如,它可以包括英文字母(如圖10所示的墨水單詞“mao”)或圖11中的具有四個(gè)筆畫的中文字符“中”(表示“zhong1”,意思為/之內(nèi)/之中/內(nèi)/中間/中央/當(dāng)(做某事)/期間/中國/中文/)。
參考圖12,以下是識別語音手寫體的說明性進(jìn)程。首先,用戶開始用筆輸入語音(拼音)。在步驟1801輸入被收集成墨水筆畫。也可以向用戶顯示將要在輸入筆(或手指或其它指向?qū)崿F(xiàn))接觸屏幕或光標(biāo)位置之處或附近出現(xiàn)的墨水的軌跡。
在步驟1802,收集的一個(gè)或多個(gè)筆畫可通過例如西文語言手寫體識別引擎識別為原始拼音點(diǎn)陣1803。可如以上所述來定義何時(shí)開始識別。
在步驟1804,原始拼音點(diǎn)陣發(fā)送至拼音剖析器1804,它嘗試生成有效拼音串1805。如果找到一個(gè)或多個(gè)音節(jié)或者結(jié)果等于或超過有效拼音長度限制,則如步驟1806所示繼續(xù)進(jìn)行IME引擎。如果未找到有效音節(jié),則返回至步驟1801。
圖13示出了使用語言模型解碼器和圖12的進(jìn)程的其它步驟的示例。從步驟1806繼續(xù),在步驟1901,進(jìn)程然后使用有效拼音串以在詞典的基礎(chǔ)上建立單詞點(diǎn)陣,得到單詞點(diǎn)陣1902。單詞點(diǎn)陣1902然后發(fā)送至語言模型解碼器。來自步驟1903的最佳結(jié)果然后轉(zhuǎn)換為中文字符1904。
以下步驟涉及候選者的顯示與選擇。它們是可任選的,因?yàn)樵趯?shí)踐本發(fā)明時(shí)可以全部一起使用、只用其中一部分或全部不使用。它們顯示在虛線框中,以突出其可選擇性。在步驟1905,向用戶顯示中文字符。這可以包括或不包括修改撰寫窗的尺寸來向用戶顯示其內(nèi)容。在步驟1906,也可以顯示最后轉(zhuǎn)換的單詞/字符的拼音替換。步驟1906也可以包括或不包括顯示最后轉(zhuǎn)換的單詞/字符的字符替換。在步驟1907,當(dāng)被指示發(fā)送字符或當(dāng)用戶偏離開來等等時(shí),撰寫串可根據(jù)選擇發(fā)送至應(yīng)用。
參考圖10和11,系統(tǒng)可以在兩種輸入類型中區(qū)別。如果使用圖10所示的草體輸入,則用戶不需要在畫下一筆畫或書寫下一字母之前提起鋼筆。相反,在圖11中,以亞洲象形文字書寫的用戶需要在開始并識別下一筆畫之前提起筆。
下文描述了上述其它進(jìn)程之中用于自動啟動輸入手寫體到中文字符的轉(zhuǎn)換的各種進(jìn)程·如果出現(xiàn)定時(shí)器事件或者·如果不處于墨水輸入狀態(tài)。
如果是這樣,則原始拼音點(diǎn)陣可由拼音剖析器轉(zhuǎn)換成有效拼音串。
下文描述了何時(shí)進(jìn)程試圖將拼音串轉(zhuǎn)換為中文字符·如果找到多個(gè)有效音節(jié)或者·如果等于或超過最大可能有效拼音長度。
如果是這樣,則轉(zhuǎn)換的中文字符可插入到撰寫內(nèi)容中,然后可調(diào)節(jié)內(nèi)嵌(in-line)撰寫窗和內(nèi)嵌墨水輸入窗來適應(yīng)新的內(nèi)容。
下文描述何時(shí)當(dāng)進(jìn)程將中文字符前向傳送到應(yīng)用·用戶按下特定控制按鈕/按鍵的其中之一,如“發(fā)送”按鈕等等。
·撰寫窗已滿,用戶無法輸入額外的墨水。
·遇到輸入了句結(jié)束符號(標(biāo)點(diǎn)符號),如“!”。
各種窗口(撰寫窗、墨水輸入窗以及候選者窗)可以在內(nèi)容改變之后刷新或不刷新。
識別進(jìn)程的結(jié)果可以以單色顯示或使用顏色來突出各種錯(cuò)誤糾正行為。如果使用顏色,可使用顏色來顯示拼音候選者中用于當(dāng)前選擇的單詞或字符的的拼音替換者(例如,以藍(lán)色顯示當(dāng)前單詞或字符-1602,而以黑色顯示剩余單詞/字符-1601)。用戶然后可以分辨區(qū)域1602中哪一單詞要糾正,或者在區(qū)域1603和1604中對哪一字符提供了替換選項(xiàng)。一旦用戶選擇了候選者或者將建議的候選者糾正為另一候選者,除固定字符外(見下段)的整個(gè)內(nèi)容可以再次轉(zhuǎn)換或可以不再次轉(zhuǎn)換。這是嘗試基于單詞的上下文對各種單詞進(jìn)行糾正。
用戶也可以選擇正確的替換者來替代當(dāng)前選擇的突出或未突出的單詞/字符。在至少一個(gè)方面中,可以將用戶對替換者的選擇標(biāo)記為“固定”或已選擇或指定。在將來的轉(zhuǎn)換中,固定的或先前選擇的或指定的單詞可以保持不變,而其它單詞/字符被修改來適應(yīng)新的上下文內(nèi)容。
本發(fā)明的各方面也可以應(yīng)用到日文、韓文和繁體中文。例如,取拼音IME而代之,開發(fā)者可以引入日文、韓文或繁體中文IME并如以上所述為按鍵添加功能。
盡管本發(fā)明的各方面使用微軟公司的IME,然而也可以使用其它IME。例如,僅舉幾個(gè)例子,國際商用機(jī)器公司(IBM)的Unicode IME和Sourceforge.net公司的VietIME(跨平臺越南語輸入法編輯器)。
本發(fā)明的各方面用其說明性實(shí)施例來描述。通過對本公開內(nèi)容的回顧,對本領(lǐng)域的普通技術(shù)人員而言,可以在不脫離所附權(quán)利要求的范圍和精神的情況下作出各種其它實(shí)施例、修改和變化。
權(quán)利要求
1.一種用于輸入字符的進(jìn)程,其特征在于,它包括以下步驟從用戶接收輸入,所述輸入包括墨水;以及將所述墨水識別為語音輸入;將所述語音輸入轉(zhuǎn)換為字符。
2.如權(quán)利要求1所述的進(jìn)程,其特征在于,所述識別步驟將所述語音輸入識別為拼音。
3.如權(quán)利要求1所述的進(jìn)程,其特征在于,它還包括步驟向所述用戶顯示至少一個(gè)替換識別結(jié)果。
4.如權(quán)利要求3所述的進(jìn)程,其特征在于,所述顯示步驟顯示由英文字母組成的單詞。
5.如權(quán)利要求3所述的進(jìn)程,其特征在于,所述顯示步驟顯示東亞字符。
6.如權(quán)利要求3所述的進(jìn)程,其特征在于,所述顯示步驟以與未選擇的字符不同的顏色顯示當(dāng)前的選擇。
7.如權(quán)利要求1所述的進(jìn)程,其特征在于所述識別步驟包括對西文語言手寫體識別引擎的使用。
8.如權(quán)利要求1所述的進(jìn)程,其特征在于所述識別步驟包括確定所識別的墨水是否包括至少一個(gè)有效串的步驟。
9.一種用于輸入字符的系統(tǒng),其特征在于,它包括用于從用戶接收輸入的裝置,所述輸入包括墨水;以及,用于將所述墨水識別為語音輸入的裝置;用于將所述語音輸入轉(zhuǎn)換為字符的裝置。
10.如權(quán)利要求9所述的系統(tǒng),其特征在于,所述用于識別的裝置將所述語音輸入識別為拼音。
11.如權(quán)利要求9所述的系統(tǒng),其特征在于,它還包括用于向所述用戶顯示至少一個(gè)替換識別結(jié)果的裝置。
12.如權(quán)利要求11所述的系統(tǒng),其特征在于,所述用于顯示的裝置顯示由英文字母組成的單詞。
13.如權(quán)利要求11所述的系統(tǒng),其特征在于,所述用于顯示的裝置顯示東亞字符。
14.如權(quán)利要求11所述的系統(tǒng),其特征在于,所述用于顯示的裝置以與未選字符不同的顏色顯示當(dāng)前的選擇。
15.如權(quán)利要求9所述的系統(tǒng),其特征在于,所述用于識別的裝置包括對西文語言手寫體識別引擎的使用。
16.如權(quán)利要求9所述的系統(tǒng),其特征在于,所述用于識別的裝置包括用于確定所識別的墨水是否包括至少一個(gè)有效串的裝置。
全文摘要
描述了一種用于協(xié)助用戶以亞洲語言輸入信息的系統(tǒng)和進(jìn)程。在一些方面中,參照手寫輸入描述了簡體中文和其它語言的輸入。
文檔編號G06K9/00GK1707509SQ20041004895
公開日2005年12月14日 申請日期2004年6月10日 優(yōu)先權(quán)日2004年6月10日
發(fā)明者李 東, 張東暉, 章勇 申請人:微軟公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
扎赉特旗| 西昌市| 商都县| 将乐县| 永春县| 延边| 台南市| 万山特区| 淮北市| 天水市| 桑植县| 元朗区| 类乌齐县| 垣曲县| 石景山区| 盐山县| 扎兰屯市| 肥东县| 安义县| 盘锦市| 吉首市| 东乡族自治县| 乌鲁木齐市| 大兴区| 闻喜县| 上栗县| 马龙县| 连江县| 博乐市| 教育| 田林县| 富宁县| 芜湖县| 保山市| 唐山市| 元朗区| 浑源县| 利川市| 越西县| 和龙市| 屏南县|