技術(shù)特征:
技術(shù)總結(jié)
本發(fā)明公開了一種基于互聯(lián)網(wǎng)的圖文搜索引擎,設(shè)置網(wǎng)頁抓取模塊頁面抓取,存儲至頁面庫,分別設(shè)置信息抓取模塊和圖像識別模塊對抓取頁面的圖文內(nèi)容進(jìn)行解析、提取,存儲到數(shù)據(jù)庫,設(shè)置索引服務(wù)模塊,調(diào)用Solr構(gòu)建索引文件,存儲至索引文件庫,設(shè)置搜索服務(wù)模塊對用戶客戶端輸入的檢索內(nèi)容進(jìn)行解析,并從索引文件庫獲取檢索結(jié)果信息,加以解析,展示給用戶;本發(fā)明基于Solr技術(shù),建立高效、獨(dú)立的企業(yè)級搜索引擎,根據(jù)互聯(lián)網(wǎng)網(wǎng)站的特點(diǎn),對網(wǎng)站頁面抓??;使用信息抓取模塊和圖像識別模塊完成圖文信息提取,調(diào)用Solr構(gòu)建索引文件,采用Solr工具實(shí)現(xiàn)整個信息檢索,整個搜索引擎操作簡捷,搭建效率高、成本低。
技術(shù)研發(fā)人員:葉飛;孫萍;曹增安;許兵
受保護(hù)的技術(shù)使用者:合肥創(chuàng)旗信息科技有限公司
技術(shù)研發(fā)日:2017.06.06
技術(shù)公布日:2017.10.13