欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種維吾爾語拼寫檢查方法及裝置的制造方法

文檔序號:9217171閱讀:1001來源:國知局
一種維吾爾語拼寫檢查方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及維吾爾語計算機處理技術(shù)領(lǐng)域,尤其涉及一種維吾爾語拼寫檢查方法 及裝置。
【背景技術(shù)】
[0002] 在英文、中文等語言輸入法出現(xiàn)后不久開始陸續(xù)地出現(xiàn)語言拼寫檢查軟件,這些 軟件也給辦公帶來了很多方便。這些軟件對用戶輸入的單詞與事先制作好的詞庫進行比 較,當(dāng)用戶輸入的詞為錯誤的詞(不存在于詞庫中)的時候,該軟件會標記出該詞,并根據(jù) 語法、語義給出與輸入的拼寫或書寫錯誤的詞最接近的詞,用戶可以通過工具欄更正錯別 詞選項,根據(jù)軟件所提供的最接近詞來進行替換。在制作詞庫的時候,開發(fā)人員將一個個單 詞詞條系統(tǒng)的收集成庫,并以此為依據(jù)對用戶輸入的詞進行拼寫檢查。
[0003] 但維吾爾文有32個語義字母(或稱為名義字母),大部分的語義字母有四種寫法, 四種寫法分別對應(yīng)字母在句首、句中、句尾以及單獨出現(xiàn)時的書寫方式。由于維吾爾文的特 殊性,上述語言文字的拼寫檢查方法并不能適用于維吾爾文。

【發(fā)明內(nèi)容】

[0004] 有鑒于此,本發(fā)明提供一種維吾爾語拼寫檢查方法及裝置,以實現(xiàn)高效地對計算 設(shè)備中的維吾爾語字符串進行拼寫檢查及糾錯的目的。
[0005] 為實現(xiàn)上述發(fā)明目的,基于本發(fā)明實施例,提供一種維吾爾語拼寫檢查方法,所述 方法包括:
[0006] 獲取以基本區(qū)編碼組成的待檢查單詞;
[0007] 基于維吾爾語基本區(qū)編碼矩陣和擴展區(qū)編碼矩陣,調(diào)用選型算法對待檢查單詞進 行字形正確性的檢查,若檢查通過,則進一步基于維吾爾語詞庫,對待檢查單詞進行拼寫正 確性的檢查;
[0008] 若字形正確性的檢查或拼寫正確性的檢查未通過,則返回當(dāng)前待檢查單詞的拼寫 檢查未通過的錯誤信息。
[0009] 為實現(xiàn)上述發(fā)明目的,基于本發(fā)明實施例,提供一種維吾爾語拼寫檢查裝置,所述 裝置包括:
[0010] 獲取模塊,用于獲取以基本區(qū)編碼組成的待檢查單詞;
[0011] 字形正確性檢查模塊,用于基于維吾爾語基本區(qū)編碼矩陣和擴展區(qū)編碼矩陣,調(diào) 用選型算法對待檢查單詞進行字形正確性的檢查;
[0012] 拼寫正確性檢查模塊,用于基于維吾爾語詞庫,對待檢查單詞進行拼寫正確性的 檢查;
[0013] 反饋模塊,用于在字形正確性的檢查或拼寫正確性的檢查未通過時,返回當(dāng)前待 檢查單詞的拼寫檢查未通過的錯誤信息。
[0014] 本發(fā)明基于維吾爾語的基本區(qū)編碼矩陣及擴展區(qū)編碼矩陣,通過選型算法結(jié)合維 吾爾詞庫,實現(xiàn)對維吾爾語字符串的高效的拼寫檢查及糾錯,解決了維吾爾語在拼寫檢查 上的盲區(qū),有利于提高維吾爾語輸入的正確率、準確率。
【附圖說明】
[0015] 圖1為本發(fā)明實施例提供的一種維吾爾文拼寫檢查方法的步驟流程示意圖;
[0016] 圖2為本發(fā)明實施例提供的一種采用最小編輯距離算法從詞庫中提取與拼寫錯 誤的單詞編輯距離最小的一個或多個可替換單詞步驟流程示意圖;
[0017] 圖3為本發(fā)明實施例提供的一種維吾爾文拼寫檢查裝置的結(jié)構(gòu)示意圖。
【具體實施方式】
[0018] 為使本申請的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下參照附圖對本申請所述 方案作進一步地詳細說明。下面的描述涉及附圖時,除非另有表示,不同附圖中的相同數(shù)字 表示相同或相似的要素。以下示例性實施例中所描述的實施方式并不代表與本申請相一致 的所有實施方式。相反,它們僅是與如所附權(quán)利要求書中所詳述的、本申請的一些方面相一 致的裝置和方法的例子。
[0019] 維吾爾語作為一種自然語言,具有自然語言共有的一些規(guī)則,但維吾爾語有其不 同于其它語言的獨特的詞法特點,因此,在對維吾爾語詞句進行拼寫檢查時,不能使用現(xiàn)有 的中英文拼寫檢查方法。
[0020] 維吾爾語總共有32個字母,對于維吾爾語的大多數(shù)字母來說,一個字母在單詞中 的不同位置出現(xiàn),其書寫的形式是不同的,根據(jù)維吾爾語的字符集編碼規(guī)則,維吾爾語的字 符集分為基本區(qū)編碼矩陣和擴展區(qū)編碼矩陣,其中,基本區(qū)編碼對應(yīng)每個字母的語義字母, 擴展區(qū)編碼對應(yīng)每個字母在單詞中不同位置的顯示字母。
[0021] 維吾爾語文字在計算機中存儲及在網(wǎng)絡(luò)上傳輸時,都使用基本區(qū)編碼,而在輸出 顯示時,為了符合維吾爾文字的書寫習(xí)慣,需要根據(jù)維吾爾文的書寫習(xí)慣,對字母進行選型 處理,即根據(jù)語義字母在單詞中的位置從擴展區(qū)編碼矩陣中選擇對應(yīng)的正確的字母形態(tài)即 字形以組成輸出顯示的單詞。
[0022] 基本區(qū)編碼矩陣及擴展區(qū)編碼矩陣的示例如下表1所示:
[0023] 表 1
[0025]
[0026] 維吾爾語字符集中,基本區(qū)編碼矩陣為32行1列,由語義字母對應(yīng)的基本區(qū)編碼 依據(jù)編碼順序構(gòu)成。擴展區(qū)編碼矩陣為32行4列,由顯示字母對應(yīng)的擴展區(qū)編碼依據(jù)編碼 順序構(gòu)成,擴展區(qū)編碼矩陣的每一行分別與基本區(qū)編碼矩陣中的基本區(qū)編碼一一對應(yīng),每 一行的4列分別為對應(yīng)語義字母在詞首、詞中、詞尾及單獨出現(xiàn)時對應(yīng)的擴展區(qū)編碼。
[0027] 以表1的編碼矩陣為例,在基本區(qū)編碼矩陣中,有些編碼作為保留編碼未使用,因 此會出現(xiàn)編碼不連續(xù)的情況,在表中以省略符"…"來標識,這些不連續(xù)區(qū)域的編碼在具體 的程序?qū)崿F(xiàn)時可以將其值置為NULL或0,來表示沒有對應(yīng)的基本區(qū)編碼或該基本區(qū)編碼 未使用。在擴展區(qū)編碼矩陣中,如果對應(yīng)基本區(qū)編碼的值為NULL或0,則對應(yīng)的擴展區(qū)編 碼矩陣中的編碼值也為NULL或0 ;若對應(yīng)的基本區(qū)編碼的值不為NULL或0,則大部分的語 義字母都存在四種字形,四種字形分別對應(yīng)擴展區(qū)編碼矩陣中的四個編碼,例如基本區(qū)編 碼06D5對應(yīng)的四種字形的擴展區(qū)編碼分別為FBEC、FEE9、FBED、FEBA。根據(jù)維文的書寫習(xí) 慣和編碼規(guī)則,某些語義字母在顯示時,需要將兩個擴展區(qū)編碼對應(yīng)的字形組合在一起顯 示才能表達正確的含義或符合維文的書寫習(xí)慣,因此在本發(fā)明實施例給出的擴展區(qū)編碼矩 陣中,某些行會出現(xiàn)兩個擴展區(qū)編碼同時出現(xiàn)在一個矩陣單元中的情況,例如,基本區(qū)編碼 0649對應(yīng)的行下標與擴展區(qū)編碼矩陣中首部字形所在的列下標所對應(yīng)的矩陣單元中,存儲 了FBFB和FBE8兩個擴展區(qū)編碼,即表示當(dāng)基本區(qū)編碼0649對應(yīng)的語義字母出現(xiàn)在詞的首 部的時候,需要將FBFB和FBE8兩個擴展區(qū)編碼同時顯示才能表達正確的含義或符合維文 的正確的書寫習(xí)慣。
[0028] 此外,本發(fā)明提供的擴展區(qū)編碼矩陣,還用于對語義字母關(guān)聯(lián)合法性的檢測。在維 吾爾文里,根據(jù)維吾爾文的語法規(guī)則,有些語義字母是不能相互關(guān)聯(lián),例如某些語義字母沒 有對應(yīng)的擴展區(qū)編碼矩陣中的某個或某些字形,以語義字母"V'對應(yīng)的基本區(qū)編碼06C9為 例,其對應(yīng)的擴展區(qū)編碼中,沒有對應(yīng)的首部和中部字形(對應(yīng)字形位置的編碼為NULL或 0),只有獨立字形編碼FBDB"A,,和尾部字形編碼FBDF" 4*-,因此,當(dāng)檢測到該語義字母 的基本區(qū)編碼出現(xiàn)在一次詞的首部或中部時,說明是拼寫錯誤。
[0029] 基于維吾爾文特有的字符編碼規(guī)則,本發(fā)明提出一種維吾爾文拼寫檢查方法及裝 置,以下結(jié)合附圖示例對本發(fā)明做詳細描述。
[0030] 圖1為本發(fā)明實施例提供的一種維吾爾文拼寫檢查方法的步驟流程示意圖,該方 法包括如下步驟:
[0031] 步驟101、獲取以基本區(qū)編碼組成的待檢查單詞;
[0032] 本發(fā)明實施例可以對一整篇文章進行拼寫檢查,也可以實時對用戶輸入的單詞進 行拼寫檢查,
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
罗定市| 衡阳市| 邹平县| 新疆| 天镇县| 衡阳市| 辉南县| 石景山区| 翁源县| 麦盖提县| 隆尧县| 罗甸县| 青海省| 新乐市| 哈尔滨市| 牡丹江市| 政和县| 喀喇| 永春县| 荔波县| 韶山市| 榕江县| 象州县| 本溪市| 松溪县| 承德县| 英超| 平罗县| 米泉市| 福泉市| 连平县| 乌兰浩特市| 平塘县| 新平| 剑阁县| 册亨县| 吉木乃县| 宁城县| 富蕴县| 芜湖县| 博客|