文字處理方法和文字處理裝置的制造方法

文檔序號(hào)：9811077閱讀：569來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

文字處理方法和文字處理裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及圖像處理技術(shù)領(lǐng)域，具體而言，涉及一種文字處理方法和一種文字處理裝置。
【背景技術(shù)】
[0002] 目前，在互聯(lián)網(wǎng)中經(jīng)常需要對(duì)一些文字的字形進(jìn)行匹配，并對(duì)匹配結(jié)果的數(shù)據(jù)得分進(jìn)行排名，現(xiàn)有的數(shù)據(jù)得分排名方法為：在接收到一個(gè)新的數(shù)據(jù)得分時(shí)，將新的數(shù)據(jù)得分與現(xiàn)有的數(shù)據(jù)得分逐個(gè)進(jìn)行比較；根據(jù)比較結(jié)果得到新的數(shù)據(jù)得分在所有數(shù)據(jù)得分中所占的位置，即對(duì)所有數(shù)據(jù)得分進(jìn)行排序；計(jì)算所有小于新的數(shù)據(jù)得分的個(gè)數(shù)以計(jì)算新的數(shù)據(jù) 得分的排名，此種方法隨著用戶和數(shù)據(jù)得分的增加，數(shù)據(jù)量將會(huì)變得非常龐大，在統(tǒng)計(jì)整體排名的時(shí)候，就會(huì)造成效率下降、存儲(chǔ)空間增大的問(wèn)題，通常解決方法是增加高速緩存、更換高速數(shù)據(jù)庫(kù)、采用分布式集群處理，這樣雖然速度會(huì)提高，但是會(huì)大幅增加硬件成本。
[0003] 因此，如何降低排序的數(shù)據(jù)量，提高排名統(tǒng)計(jì)的效率成為目前亟待解決的技術(shù)問(wèn) 題。

【發(fā)明內(nèi)容】

[0004] 考慮到相關(guān)技術(shù)中出現(xiàn)的技術(shù)問(wèn)題，本發(fā)明提供了一種新的文字處理技術(shù)，能夠在不增加硬件成本的前提下，以匹配值區(qū)間的排序及分布數(shù)得到匹配值排名，有效的降低排序所需的數(shù)據(jù)量，提高排名的統(tǒng)計(jì)效率。
[0005] 根據(jù)本發(fā)明的一個(gè)方面，提供了一種文字處理方法，包括：將連續(xù)的多個(gè)匹配值分為多個(gè)匹配值區(qū)間；獲取用戶當(dāng)前輸入的文字，將所述文字與所述標(biāo)準(zhǔn)文字進(jìn)行匹配，得到當(dāng)前文字的匹配值；判斷所述當(dāng)前文字的匹配值所在的匹配值區(qū)間；增加對(duì)應(yīng)于所述匹配值區(qū)間的分布數(shù)；根據(jù)所述分布數(shù)計(jì)算所述當(dāng)前輸入的文字在所有用戶輸入的文字中取得的排名。
[0006] 在該技術(shù)方案中，通過(guò)將用戶當(dāng)前輸入的文字與標(biāo)準(zhǔn)文字進(jìn)行匹配，得到用戶當(dāng) 前輸入的文字的匹配值，并增加用戶當(dāng)前輸入的文字的匹配值所在的匹配值區(qū)間的分布數(shù)，從而根據(jù)每個(gè)匹配值區(qū)間的分布數(shù)計(jì)算用戶當(dāng)前輸入的文字的排名，與現(xiàn)有技術(shù)中數(shù) 據(jù)得分排名方法相比，不需要進(jìn)行所有匹配值之間的比較排序，僅需要對(duì)匹配值區(qū)間進(jìn)行排序，降低排序所需的數(shù)據(jù)量，提高排名統(tǒng)計(jì)的效率。
[0007] 其中，由于所有用戶中每個(gè)用戶輸入的文字不可能全部相同，因此將所有用戶輸入的文字與標(biāo)準(zhǔn)文字進(jìn)行匹配可以得到多個(gè)不同的匹配值，將所有匹配值中以最大的匹配值和最小的匹配值為區(qū)間端點(diǎn)，將該區(qū)間分為多個(gè)匹配值區(qū)間，匹配值區(qū)間按遞增或遞減順序排列，在新接收到匹配值時(shí)可以快遞查找出新匹配值所處的區(qū)間以及方便匹配值排名的計(jì)算。
[0008] 具體來(lái)說(shuō)，在得到每個(gè)匹配值區(qū)間的分布數(shù)之后，確定用戶當(dāng)前輸入的文字的匹配值排名的具體計(jì)算公式為：所有小于當(dāng)前匹配值區(qū)間的分布數(shù)之和/所有匹配值區(qū)間的分布數(shù)之和X 100% = XX%，即得到用戶當(dāng)前輸入的文字的匹配值的排名，可以顯示為"你擊敗了 XX%的用戶"。
[0009] 在上述技術(shù)方案中，優(yōu)選地，將所述文字與所述標(biāo)準(zhǔn)文字進(jìn)行匹配，得到當(dāng)前文字的匹配值，具體包括：接收用戶輸入的對(duì)文字的匹配指令；根據(jù)所述匹配指令讀取所述用戶當(dāng)前輸入的文字的圖形信息；根據(jù)所述圖形信息對(duì)所述文字進(jìn)行字形分析，獲取所述文字的書寫字形信息；根據(jù)所述書寫字形信息和所述標(biāo)準(zhǔn)文字的參考字形信息生成針對(duì)所述文字的匹配值。
[0010] 在該技術(shù)方案中，由于用戶當(dāng)前輸入的文字為用戶手寫的文字，因此在接收到用戶輸入的對(duì)文字的匹配指令時(shí)，獲取用戶當(dāng)前輸入的文字的圖形信息，即將用戶當(dāng)前輸入的文字制作成圖片的形式，以圖片的形式進(jìn)行獲取，然后從圖片中提取用戶當(dāng)前輸入的文字進(jìn)行字形分析，以得到該文字的書寫字形信息，并將改文字的書寫字形信息與標(biāo)準(zhǔn)文字的參考字形信息進(jìn)行匹配，得到用戶當(dāng)前輸入的文字的匹配值。
[0011] 在上述技術(shù)方案中，優(yōu)選地，所述書寫字形信息包括中心偏離度、角度扭轉(zhuǎn)度、大小偏離度、文字結(jié)構(gòu)、筆畫偏差。
[0012] 在該技術(shù)方案中，書寫字形信息包括：中心偏離度、角度扭轉(zhuǎn)度、大小偏離度、文字結(jié)構(gòu)、筆畫偏差，具體來(lái)說(shuō)，在將用戶當(dāng)前輸入的文字的書寫字形信息與標(biāo)準(zhǔn)文字的參考字形信息進(jìn)行匹配得到用戶當(dāng)前輸入的文字的匹配值時(shí)，可以通過(guò)不同的書寫字形信息分配不同權(quán)重的計(jì)算方式，例如：中心偏離度權(quán)重為30%，角度扭轉(zhuǎn)度權(quán)重為10%，大小偏離度權(quán)重為10%，文字結(jié)構(gòu)權(quán)重為30%,筆畫偏差權(quán)重為20%,則用戶當(dāng)前輸入的文字的匹配值為：中心偏離度X0. 3+角度扭轉(zhuǎn)度X0. 1+大小偏離度X0. 1+文字結(jié)構(gòu)X0. 3+筆畫偏差X0. 2。當(dāng)然，本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解的是，此處書寫字形信息中每個(gè)部分所占的權(quán)重并不用于具體限定。
[0013] 在上述技術(shù)方案中，優(yōu)選地，根據(jù)排名精度確定所述匹配值區(qū)間的區(qū)間間隔。
[0014] 在該技術(shù)方案中，由于每個(gè)匹配值區(qū)間中用戶當(dāng)前輸入的文字使用同一個(gè)排名，同一個(gè)匹配值區(qū)間中可能包含多個(gè)用戶當(dāng)前輸入的文字，則同一匹配值區(qū)間中的多個(gè)用戶當(dāng)前輸入的文字未進(jìn)行排名，因此區(qū)間間隔越大，同一個(gè)區(qū)間中包含的用戶當(dāng)前輸入的文字越多，也即用戶當(dāng)前輸入的文字未進(jìn)行排名的越多，排名的精度越低。根據(jù)排名精度確定匹配值區(qū)間的區(qū)間間隔，可以保證排名的精度，具體可以為：排名精度要求越高，則區(qū)間間隔設(shè)置越小，排名精度要求越低，則區(qū)間間隔設(shè)置越大。
[0015] 在上述技術(shù)方案中，優(yōu)選地，記錄屬于每一個(gè)匹配值區(qū)間的文字字形信息。
[0016] 在該技術(shù)方案中，通過(guò)記錄屬于每一個(gè)匹配值區(qū)間的文字字形信息，可以方便的查找并顯示每個(gè)匹配值區(qū)間的文字字形信息，作為一種較為具體的技術(shù)方案，還可以進(jìn)一步的建立文字字形信息與對(duì)應(yīng)用戶的映射關(guān)系，則根據(jù)所有用戶當(dāng)前輸入的文字的排名即可得到當(dāng)前所有用戶的排名。
[0017] 根據(jù)本發(fā)明的第二方面，提出了一種文字處理裝置，包括：存儲(chǔ)單元，將連續(xù)的多個(gè)匹配值分為多個(gè)匹配值區(qū)間；獲取單元，用于獲取用戶當(dāng)前輸入的文字，將所述文字與所述標(biāo)準(zhǔn)文字進(jìn)行匹配，得到當(dāng)前文字的匹配值；查找單元，用于判斷所述當(dāng)前文字的匹配值所在的匹配值區(qū)間；計(jì)數(shù)單元，用于增加對(duì)應(yīng)于所述匹配值區(qū)間的分布數(shù)；處理單元，根據(jù) 所述分布數(shù)計(jì)算所述當(dāng)前輸入的文字在所有用戶輸入的文字中取得的排名。
[0018] 在該技術(shù)方案中，通過(guò)將用戶當(dāng)前輸入的文字與標(biāo)準(zhǔn)文字進(jìn)行匹配，得到用戶當(dāng) 前輸入的文字的匹配值，并增加用戶當(dāng)前輸入的文字的匹配值所在的匹配值區(qū)間的分布數(shù)，從而根據(jù)每個(gè)匹配值區(qū)間的分布數(shù)計(jì)算用戶當(dāng)前輸入的文字的排名，與現(xiàn)有技術(shù)中數(shù) 據(jù)得分排名方法相比，不需要進(jìn)行所有匹配值之間的比較排序，僅需要對(duì)匹配值區(qū)間進(jìn)行排序，降低排序所需的數(shù)據(jù)量，提高排名統(tǒng)計(jì)的效率。
[0019] 其中，由于所有用戶中每個(gè)用戶輸入的文字不可能全部相同，因此將所有用戶輸入的文字與標(biāo)準(zhǔn)文字進(jìn)行匹配可以得到多個(gè)不同的匹配值，將所有匹配值中以最大的匹配值和最小的匹配值為區(qū)間端點(diǎn)，將該區(qū)間分為多個(gè)匹配值區(qū)間，匹配值區(qū)間按遞增或遞減順序排列，在新接收到匹配值時(shí)可以快遞查找出新匹配值所處的區(qū)間以及方便匹配值排名的計(jì)算。
[0020] 具體來(lái)說(shuō)，在得到每個(gè)匹配值區(qū)間的分布數(shù)之后，確定用戶當(dāng)前輸入的文字的匹配值排名的具體計(jì)算公式為：所有小于當(dāng)前匹配值區(qū)間的分布數(shù)之和/所有匹配值區(qū)間的分布數(shù)之和X 100% = XX%，即得到用戶當(dāng)前輸入的文字的匹配值的排名，可以顯示為"你擊敗了 XX%的用戶"。
[0021] 在上述技術(shù)方案中，優(yōu)選地，所述獲取單元包括：接收單元，用于接

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2 3 4

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：高玉軍;
技術(shù)所有人：北大方正集團(tuán)有限公司;北京北大方正電子有限公司;
我是此專利的發(fā)明人

上一篇：家具部件電子芯片植入技術(shù)的制作方法
上一篇：一種基于單目視覺(jué)的車輛測(cè)距與碰撞預(yù)警方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

生活污水處理裝置相關(guān)技術(shù)

汽車尾氣處理裝置相關(guān)技術(shù)

廢氣處理裝置相關(guān)技術(shù)

污水處理裝置相關(guān)技術(shù)

軟化水處理裝置相關(guān)技術(shù)

船用生活污水處理裝置相關(guān)技術(shù)

實(shí)驗(yàn)室廢水處理裝置相關(guān)技術(shù)

尾氣處理裝置相關(guān)技術(shù)

水處理加藥裝置相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

文字處理方法和文字處理裝置的制造方法