一種文本提取方法及裝置制造方法

一種文本提取方法及裝置制造方法技術資料下載

技術編號：6536355

提示：您尚未登錄，請點 登陸 后下載，如果您還沒有賬戶請點 注冊 ，登陸完成后，請刷新本頁查看技術詳細信息。

本發(fā)明涉及一種文本提取方法，所述方法包括步驟一、預處理給定的網(wǎng)頁的超文本傳輸協(xié)議html源碼，以獲取所述源碼中的文本的字符串序列，所述字符串序列包含N個文本行；步驟二、提取所述字符串序列中每個文本行的特征元素，所述特征元素包含M個屬性；步驟三、依據(jù)第一關聯(lián)規(guī)則，確定所述字符串序列中的潛在正文行組成的潛在正文塊，所示第一關聯(lián)規(guī)則由所述特征元素中的所述M個屬性確定。通過本發(fā)明實施例能夠提高網(wǎng)頁中文本塊提取的準確度，提高搜索引擎的搜索效率和準確度。專利說明一種文...
注意：該技術已申請專利，請尊重研發(fā)人員的辛勤研發(fā)付出，在未取得專利權人授權前，僅供技術研究參考不得用于商業(yè)用途。
該專利適合技術人員進行技術研發(fā)參考以及查看自身技術是否侵權，增加技術思路，做技術知識儲備，不適合論文引用。
請注意，此類技術沒有源代碼，用于學習研究技術思路。

詳細技術文檔下載地址↓↓

提示：您尚未登錄，請點 登陸 后下載，如果您還沒有賬戶請點 注冊 ，登陸完成后，請刷新本頁查看技術詳細信息。

該分類下的技術專家--如需求助專家，請聯(lián)系客服

李老師：1.計算力學 2.無損檢測
畢老師：機構動力學與控制
袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
王老師：1.計算機網(wǎng)絡安全 2.計算機仿真技術
王老師：1.網(wǎng)絡安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
孫老師：1.機機器人技術 2.機器視覺 3.網(wǎng)絡控制系統(tǒng)
葛老師：1.機器人技術 2.計算機輔助技術
張老師：1.內(nèi)燃機燃燒及能效管理技術 2.計算機數(shù)據(jù)采集與智能算法 3.助航設備開發(fā)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

詳細技術文檔下載地址↓↓