技術(shù)編號(hào):12124408
提示:您尚未登錄,請(qǐng)點(diǎn) 登 陸 后下載,如果您還沒(méi)有賬戶請(qǐng)點(diǎn) 注 冊(cè) ,登陸完成后,請(qǐng)刷新本頁(yè)查看技術(shù)詳細(xì)信息。本發(fā)明屬于實(shí)體鏈接領(lǐng)域,涉及一種基于多知識(shí)庫(kù)的表格實(shí)體鏈接方法。背景技術(shù)當(dāng)前的萬(wàn)維網(wǎng)中存在大量的擁有高質(zhì)量關(guān)系型數(shù)據(jù)的HTML表格,這些表格被視為從萬(wàn)維網(wǎng)中進(jìn)行知識(shí)抽取的重要來(lái)源。為了實(shí)現(xiàn)語(yǔ)義萬(wàn)維網(wǎng)的愿景,許多工作嘗試挖掘表格中潛在的語(yǔ)義信息,將給定表格中的內(nèi)容表示成RDF三元組。對(duì)表格內(nèi)容進(jìn)行語(yǔ)義信息挖掘的首要步驟即為實(shí)體鏈接,實(shí)體鏈接是識(shí)別表格中每個(gè)單元格里的字符串的真正含義,并將這些字符串分別鏈接向給定知識(shí)庫(kù)中的實(shí)體。如果不能正確識(shí)別表格中潛在的實(shí)體,那么將很難從給定表格的內(nèi)容中挖掘出正確...
注意:該技術(shù)已申請(qǐng)專利,請(qǐng)尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進(jìn)行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識(shí)儲(chǔ)備,不適合論文引用。
請(qǐng)注意,此類技術(shù)沒(méi)有源代碼,用于學(xué)習(xí)研究技術(shù)思路。