欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

語句輸入法的自然分詞和混合輸入的制作方法

文檔序號:6459070閱讀:234來源:國知局

專利名稱::語句輸入法的自然分詞和混合輸入的制作方法
技術領域
:本發(fā)明涉及一種漢字輸入方法,具體為通過使用者的語感停頓來自然分詞,通過選擇提示鍵來混合輸入英文字符的一種漢字輸入方法。使用漢語拼音作為編碼時,它符合漢語拼音正詞法規(guī)則,能自由輸入中英文字符,與其他輸入法相比,十分自然流暢。(二)
背景技術
:當前的中文輸入中的拼音輸入法無論是語句輸入法或詞輸入法,在輸入拼音碼時都沒有對詞進行分詞連寫,而是由程序來進行智能分詞,即編碼是連續(xù)無分割的或者是按字分割的,例如輸入"漢語拼音",編碼輸入成"han卿inyin"或被分害喊"hanyupinyin,',而不是"hanyupinyin"。雖然計算機的軟硬件技術不斷發(fā)展,自然語言方面的研究也在不斷進步,但是計算機智能分詞始終不能達到人們滿意的效果。詞是語言的基礎單位,詞與詞之間本身是分割的,只是在用漢字對漢語語言進行表示時使用了連續(xù)的形式,當用拼音表示是否一定還要用連續(xù)的方式進行就值得商榷。如果因為計算機自然語言處理為我們提供了自動分詞的技術,我們就必須采用連續(xù)的拼音形式進行漢字處理,那就變成了為技術而技術,是一條違反語言規(guī)律的道路。漢語拼音不是拼音文字,但它是一種擬文字.的形式,如果拼音采用連續(xù)的形式,就不符合文字的基本特征,漢字的每個字之間也是分開的,而不是一堆連續(xù)的筆劃。雖然采用連寫無分割的編碼的輸入法的可用性在不斷提高,但無法掩蓋以下幾個缺點(1)分詞的影響。對連續(xù)的編碼的進行漢字轉換,需要對結果進行分詞。雖然分詞技術和效率在不斷發(fā)展,但在有限的文本環(huán)境下,不可能做到100%的正確,一個不正確的分詞就可能導致整個語句的轉換錯誤。另外分詞需要龐大的知識庫支持,分詞的處理消耗很多的計算機處理器時間,對性能的影響很大。(2)錯誤的字詞不容易及時修改。由于分詞錯誤和重碼的存在,轉換錯誤不可避免。連續(xù)的編碼輸入對于錯誤如進行立即修改,該句的此次輸入就結束了,如不立即修改——就像提倡那樣,等到語句結束時再修改,就要出現查找定位錯誤,無論怎樣都會對使用者的思維過程造成干擾。(3)不能更有效的使用簡拼。使用簡拼可以很有效地提高輸入速度,又不影響思維的連續(xù),然而在連續(xù)的編碼中如果使用簡拼,將會加大錯誤出現的,甚至完全使輸入混亂。(4)不能方便的插入英文字符。在信息化時代,英文越來越多地出現的漢字文本中,連續(xù)編碼的輸入中是很難插入英文字符的,需要不停地按切換鍵才能輸入。(5)違反拼音正詞法規(guī)范,對漢語拼音的學習和發(fā)展是有害的。國家標準GB/T16159-1996《漢語拼音正詞法基本規(guī)則》規(guī)定漢語拼音以詞為拼寫單位,一個詞內部的音節(jié)要連寫,兩詞之間要留空格。連續(xù)編碼的輸入方式,將原本一個個詞的拼音掩蓋在一長串的字母中,人為的增加了處理資源的消耗和技術難度,也影響了漢語拼音的發(fā)展。從上面的分析中可以看出,采用符合漢語拼音正詞法的拼音輸入方式,人工以空格來自然分詞的方法,不僅可以增加輸入的準確性,提高處理效率,而且符合語言文字本身的規(guī)律。
發(fā)明內容本發(fā)明引入一種人工自然分詞方法,使用漢語拼音作為編碼時,它可以符合漢語拼音正詞法規(guī)則,同時本方法還包含一種混合輸入英文字符的方法,使在用語句的方式進行漢字輸入時,十分自然流暢。此方法的誕生有望提高語句輸入法的效率和可用性。發(fā)明的內容說明如下(1)自然分詞當輸入一段表示詞的編碼后,按下特定的鍵(在計算機的鍵盤上,此鍵專指空格鍵和數字選擇鍵,其中空格鍵作為分詞鍵)表示詞的結束,但并不表示語句的輸入結束,不將結果詞顯示在文本的光標位置,而是將結果詞顯示在輸入法的候選攔中,此時該詞的編碼加上一個空格(空白字符)顯示在輸入法加編碼編輯欄中。當輸入下一個詞時按照同樣的方式將編碼和詞分別追加顯示在編碼編輯欄和候選欄中。當沒有輸入編碼而僅輸入分詞鍵時,作為輸入結束處理,將整個轉換結果顯示在目標文本的光標位置。當輸入的詞的編碼超過一個而用戶沒有輸入分詞鍵時,輸入法程序根據內部的分詞算法的判定,自動在首個未分詞的詞之后插入分詞鍵。,在以分詞鍵結束輸入后,沒有輸入編碼而僅輸入標點",.?;"時,作為輸入結束處理,將整個轉換結果顯示在目標文本的光標位置。(2)混合輸入在計算機的鍵盤上,以分詞鍵結束一個字詞的輸入后,沒有輸入漢字編碼而僅輸入"09、~'!鵬$%'&*()-=\_+|"時,轉換結果是其本身,將編碼和轉換結果分別追加顯示在編碼編輯欄和候選欄中。在計算機的鍵盤上,以分詞鍵結束輸入后,開始輸入的第一個字符是大寫的英文字符時,作為一個英文單詞輸入的開始,轉換結果是其本身,將編碼和轉換結果分別追加顯示在編碼編輯欄和候選欄中,以輸入分詞鍵結束此次轉換。在計算機的鍵盤上,以分詞鍵結束一個詞的輸入后,將"/"鍵作為提示鍵,表示英文字符輸入的開始,即按下"/"鍵后,編碼編輯欄和候選欄不顯示內容,接著按下字符鍵,編碼編輯欄和候選欄顯示該字符本身,當按下空格并接著按下"/"鍵,作為英文輸入結束,編碼編輯欄和候選欄不顯示內容。具體實施例方式下面詳細說明在個人電腦上使用漢語拼音作為編碼時,本發(fā)明公開的語句輸入法的自然分詞和混合輸入實施的一般情形自然分詞和混合輸入流程圖見附圖1分詞示例自然分詞包括人工分詞和自動分詞兩部分。人工分詞以詞為單位輸入拼音編碼,編碼可以是全拼,也可以是簡拼。詞的分界要求是靈活的。當輸入完一個詞的編碼后,如果候選詞的第一個是所需的,按下分詞鍵(即空格鍵),否則使用數字鍵選擇,如果候選中的第一頁沒有此詞則需要翻頁zhuoshl.桌上2.著手3.著實4.灼傷5.灼燒接著輸入下一個詞,如zhuoshyoul.桌上有2.又3.由4.右5.油結果如下zhuoshyouzhixiaohuamaol.桌上有只小花貓2.華茂3.話4.花5.化此時按下標點則候選1的句了被選擇上屏,結束本句輸入。自動分詞當輸入的詞的編碼超過一個而用戶沒有輸入分詞鍵時,輸入法程序根據內部分詞算法的判定,自動在首個未分詞的詞或詞組之后插入分詞鍵(即空格鍵)。當輸入"renheyigeruanjian",程序內部白動在"renheyige"后加入空格進行分詞。女口renheyigenmnjianl.任何一個軟件2.軟鍵3.軟堅4.軟5.阮錯誤修改當發(fā)現前面輸入或選擇的詞冇錯時,使鼠標直接移動或用左右光標鍵移動到錯誤字詞的位置,對應的5字詞及其對應的編碼被深色選中,如<table>tableseeoriginaldocumentpage6</column></row><table>當需要修改所選中的編碼時,按下回車鍵使用左右方向鍵、刪除鍵進行某一個詞的編碼的編輯。混合輸入示例直接輸入數字<table>tableseeoriginaldocumentpage6</column></row><table>輸入英文字符<table>tableseeoriginaldocumentpage6</column></row><table>大寫的英文單詞無須輸入提示鍵"/",直接輸入,例如下例中的"Linux"在輸入"guoji"分詞后后直接輸入-<table>tableseeoriginaldocumentpage6</column></row><table>輸入標點符號書名號<table>tableseeoriginaldocumentpage6</column></row><table>雙引號<table>tableseeoriginaldocumentpage6</column></row><table>其他網址<table>tableseeoriginaldocumentpage6</column></row><table>郵箱地址wodyouxiangdizhishLioxm@hotmail.coml.我的郵箱地址是Lioxm@hotmai1.com日期和數字日期和數字輸入在分詞后直接輸入jintiansh2007_11_16l.今天是2007-11-16權利要求1、一種漢字的語句輸入方法,其特征是當輸入一段表示詞的編碼后,按下特定的鍵(在計算機的鍵盤上,此鍵專指空格鍵)作為分詞鍵,表示詞的結束,但并不表示輸入結束,不將結果詞顯示在文本的光標位置,而是將結果詞顯示在輸入法的候選攔中,此時該詞的編碼加上一個空格(空白字符)顯示在輸入法的編碼編輯欄中。當輸入下一個詞時按照同樣的方式將編碼和詞分別追加顯示在編碼編輯欄和候選欄中。當沒有輸入編碼而僅輸入分詞鍵時,作為輸入結束處理,將整個轉換結果顯示在目標文本的光標位置。2、根據權利要求一所述的漢字輸入方法,其特征是當輸入的詞的編碼超過一個而用戶沒有輸入分詞鍵時,輸入法程序根據內部分詞算法的判定,自動在首個未分詞的詞或詞組之后插入分詞鍵。3、根據權利12所述的漢字輸入方法,其特征是在以分詞鍵結束輸入后,沒有輸入編碼而僅輸入標點",.?;"時,作為輸入結束處理,將整個轉換結果顯示在目標文本的光標位置。'4、根據權利13所述的漢字輸入方法,其特征是在計算機的鍵盤上,以分詞鍵結束輸入后,沒有輸入編碼而僅輸入"0123456789~、!鵬$%^*()-=\—+|"時,轉換結果是其本身,將編碼和轉換結果分別追加顯示在編碼編輯欄和候選欄中,以輸入分詞鍵結束此次轉換。5、根據權利14所述的漢字輸入方法,其特征是在計算機的鍵盤上,以分詞鍵結束輸入后,開始輸入的第一個字符是大寫的英文字符時,作為一個英文單詞輸入的開始,轉換結果是其本身,將編碼和轉換結果分別追加顯示在編碼編輯欄和候選欄中,以輸入分詞鍵結束此次轉換。6、根據權利15所述的漢字輸入方法,其特征是在計算機的鍵盤上,以分詞鍵結束輸入后或在句子輸入開始時,將'7"鍵作為提示鍵,表示英文字符輸入的開始,即按下"/"鍵后,編碼編輯欄和候選欄不顯示內容,接著按下字符鍵,編碼編輯欄和候選欄顯示該字符本身,當按下空格并接著按下"/"鍵,作為英文輸入結束,編碼編輯欄和候選欄不顯示內容,接著按下的鍵按照權利廣4要求處理。7、根據權利16所述的漢字輸入方法,其特征是在手機、PDA和其他電子設備上使用本語句輸入法時,分詞方法的規(guī)則不變,但分詞鍵和英文輸入的提示鍵(即開始結束鍵)可以是其設備本身帶有的某一個鍵。8、根據權利17所述的漢字輸入方法,其特征是使用本自然分詞和混合輸入的漢字編碼可以是漢語拼音碼、漢語拼音簡拼碼、漢語拼音雙拼碼、各類形碼、數字編碼以及其他所有針對漢字(包括繁體漢字)的編碼。全文摘要語句輸入法的自然分詞和混合輸入是指在使用漢語拼音或其他編碼通過語句的方式進行漢字輸入時,通過使用者的語感停頓來自然分詞,通過選擇提示鍵來混合輸入英文字符的一種漢字輸入方法。當前的中文輸入中的拼音輸入法無論是語句輸入法或詞輸入法在輸入拼音碼時都沒有對詞進行人工自然分詞,而是由程序來進行智能分詞。雖然計算機的軟硬件技術不斷發(fā)展,自然語言方面的研究也在不斷進步,但是智能分詞始終不能達到人們滿意的效果。詞是語言的基礎單位,詞與詞之間本身是分割的,只是用漢字對漢語進行表示時選擇了連續(xù)的形式。如果因為計算機自然語言處理為我們提供了分詞的技術,我們就采用連續(xù)的拼音形式進行漢字處理,那就變成了為技術而技術,是一條違反語言文字規(guī)律的道路。漢語拼音不是拼音文字,但它是一種擬文字的形式,如果拼音采用連續(xù)的形式,就不符合文字的基本特征。本發(fā)明引入一種人工自然分詞方法,它符合漢語拼音正詞法規(guī)則,同時本方法還包含一種混合輸入英文字符的方法,使在用語句的方式進行漢字輸入時,十分自然流暢。此方法的使用有望提高語句輸入法的效率和可用性。文檔編號G06F3/023GK101493727SQ20081003285公開日2009年7月29日申請日期2008年1月22日優(yōu)先權日2008年1月22日發(fā)明者劉嘯旻申請人:劉嘯旻
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
天台县| 福海县| 甘谷县| 宜川县| 成安县| 定边县| 沭阳县| 富民县| 磐石市| 合作市| 宁陕县| 柯坪县| 葫芦岛市| 长寿区| 綦江县| 舒兰市| 云和县| 武冈市| 淮安市| 子长县| 永川市| 定陶县| 平罗县| 德钦县| 安阳县| 山阴县| 井研县| 寻甸| 阳曲县| 谷城县| 兴文县| 武功县| 安陆市| 盐山县| 娄烦县| 邹城市| 厦门市| 东兴市| 观塘区| 明光市| 奉贤区|