網(wǎng)頁(yè)配圖選取方法、裝置及服務(wù)器的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種計(jì)算機(jī)領(lǐng)域,特別是涉及一種網(wǎng)頁(yè)配圖選取方法、裝置及服務(wù)器。
【背景技術(shù)】
[0002] 網(wǎng)頁(yè)相關(guān)圖片挖掘就是找出最能表達(dá)網(wǎng)頁(yè)內(nèi)容的圖片,可以應(yīng)用在搜索結(jié)果配圖 上,例如圖1所示的,搜索詞"蘋(píng)果"的搜索結(jié)果列表中第一項(xiàng)結(jié)果配有圖片。在搜索結(jié)果 列表中,一個(gè)好的配圖可以讓用戶(hù)一眼就能夠知道網(wǎng)頁(yè)所要表達(dá)的意思,很多時(shí)候,圖片表 達(dá)的含義遠(yuǎn)遠(yuǎn)超過(guò)大段的文字信息,展示圖文并茂的搜索結(jié)果更能夠吸引用戶(hù)的點(diǎn)擊。
[0003] 現(xiàn)有的技術(shù)方案是從給定網(wǎng)頁(yè)中抽取相關(guān)度最高的圖片作為該網(wǎng)頁(yè)的配圖。如圖 2所示,網(wǎng)頁(yè)A中包含圖片1、圖片2···圖片n,那么現(xiàn)有技術(shù)的方案就是從圖片1到η中找 出與網(wǎng)頁(yè)內(nèi)容最相關(guān)的圖片作為網(wǎng)頁(yè)A的相關(guān)圖片。
[0004] 現(xiàn)有技術(shù)的前提條件是網(wǎng)頁(yè)中必須有配圖,如果網(wǎng)頁(yè)中本身沒(méi)有配圖,那么就沒(méi) 辦法為網(wǎng)頁(yè)配圖了,致使現(xiàn)有搜索結(jié)果配圖的覆蓋率較低。如圖1所示的搜索結(jié)果中有些 網(wǎng)頁(yè)就沒(méi)有配圖。此外,如果網(wǎng)頁(yè)中有多幅圖片,而這些圖片(如廣告圖片)都與網(wǎng)頁(yè)不相 關(guān),采用現(xiàn)有技術(shù)提供的方法找出的圖片并不能表達(dá)網(wǎng)頁(yè)內(nèi)容,極易誤導(dǎo)用戶(hù),適得其反。 由此可知,如果網(wǎng)頁(yè)自身配圖不相關(guān)或者主體配圖不明確或者網(wǎng)頁(yè)本身沒(méi)有配圖,現(xiàn)有技 術(shù)所提供的方法將不再適用。
【發(fā)明內(nèi)容】
[0005] 鑒于上述問(wèn)題,提出了本發(fā)明以便提供一種克服上述問(wèn)題或者至少部分地解決上 述問(wèn)題的網(wǎng)頁(yè)配圖選取方法、裝置及服務(wù)器。
[0006] 依據(jù)本發(fā)明一個(gè)方面,提供了一種網(wǎng)頁(yè)配圖選取方法,包括:
[0007] 從第一網(wǎng)頁(yè)中提取鏈接圖片,所述鏈接圖片為被觸發(fā)后跳轉(zhuǎn)至第二鏈接地址的圖 片;
[0008] 確定所述鏈接圖片與所述第二鏈接地址對(duì)應(yīng)的第二網(wǎng)頁(yè)的內(nèi)容關(guān)聯(lián)度;
[0009] 當(dāng)所述內(nèi)容關(guān)聯(lián)度符合設(shè)定條件時(shí),將所述鏈接圖片作為所述第二鏈接地址在搜 索結(jié)果中展現(xiàn)的摘要配圖。
[0010] 依據(jù)本發(fā)明另一個(gè)方面,提供了一種網(wǎng)頁(yè)配圖選取裝置,包括:
[0011] 提取模塊,用于從第一網(wǎng)頁(yè)中提取鏈接圖片,所述鏈接圖片為被觸發(fā)后跳轉(zhuǎn)至第 二鏈接地址的圖片;
[0012] 確定模塊,用于確定所述鏈接圖片與所述第二鏈接地址對(duì)應(yīng)的第二網(wǎng)頁(yè)的內(nèi)容關(guān) 聯(lián)度;
[0013] 處理模塊,用于當(dāng)所述內(nèi)容關(guān)聯(lián)度符合設(shè)定條件時(shí),將所述鏈接圖片作為所述第 二鏈接地址在搜索結(jié)果中展現(xiàn)的摘要配圖。
[0014] 依據(jù)本發(fā)明另一個(gè)方面,提供了一種服務(wù)器,包括網(wǎng)頁(yè)配圖選取裝置;其中,
[0015] 所述網(wǎng)頁(yè)配圖選取裝置,用于:
[0016] 從第一網(wǎng)頁(yè)中提取鏈接圖片,所述鏈接圖片為被觸發(fā)后跳轉(zhuǎn)至第二鏈接地址的圖 片;
[0017] 確定所述鏈接圖片與所述第二鏈接地址對(duì)應(yīng)的第二網(wǎng)頁(yè)的內(nèi)容關(guān)聯(lián)度;
[0018] 當(dāng)所述內(nèi)容關(guān)聯(lián)度符合設(shè)定條件時(shí),將所述鏈接圖片作為所述第二鏈接地址在搜 索結(jié)果中展現(xiàn)的摘要配圖。
[0019] 借由上述技術(shù)方案,本發(fā)明實(shí)施例提供的技術(shù)方案至少具有下列優(yōu)點(diǎn):
[0020] 本發(fā)明實(shí)施例提供的技術(shù)方案通過(guò)提取網(wǎng)頁(yè)中的鏈接圖片,然后在確定出鏈接圖 片和與其鏈接的網(wǎng)頁(yè)的內(nèi)容關(guān)聯(lián)度符合設(shè)定條件時(shí),將鏈接圖片作為與其鏈接的網(wǎng)頁(yè)的配 圖,即本發(fā)明實(shí)施例是基于鏈接圖片和與其鏈接的網(wǎng)頁(yè)的內(nèi)容相關(guān)性概率較大的思想,將 鏈接圖片作為與其鏈接的網(wǎng)頁(yè)的配圖,可有效的提升網(wǎng)頁(yè)和圖片的相關(guān)性,解決類(lèi)似網(wǎng)頁(yè) 中沒(méi)有圖片或者圖片質(zhì)量不高的低召回問(wèn)題;此外,對(duì)于頁(yè)面中不包含圖片的網(wǎng)頁(yè),采用本 發(fā)明實(shí)施例提供的技術(shù)方案也能夠通過(guò)外鏈圖片找到它的相關(guān)圖片??傊?,本發(fā)明實(shí)施例 提供的技術(shù)方案能有效的提升搜索結(jié)果中配圖的準(zhǔn)確率及覆蓋率。
[0021] 上述說(shuō)明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段, 而可依照說(shuō)明書(shū)的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠 更明顯易懂,以下特舉本發(fā)明的【具體實(shí)施方式】。
【附圖說(shuō)明】
[0022] 通過(guò)閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通 技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明 的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:
[0023] 圖1示出了現(xiàn)有技術(shù)中搜索結(jié)果界面的示例圖;
[0024] 圖2示出了現(xiàn)有技術(shù)中網(wǎng)頁(yè)中包含多個(gè)圖片的原理性示例圖;
[0025] 圖3示出了本發(fā)明實(shí)施例一提供的網(wǎng)頁(yè)配圖選取方法的流程圖;
[0026] 圖4示出了本發(fā)明實(shí)施例二提供的網(wǎng)頁(yè)配圖選取方法的流程圖;
[0027] 圖5示出了本發(fā)明實(shí)施例三提供的網(wǎng)頁(yè)配圖選取裝置的組成框圖;
[0028] 圖6本實(shí)施例四提供的所述服務(wù)器的一種實(shí)現(xiàn)結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0029] 下面將參照附圖更詳細(xì)地描述本公開(kāi)的示例性實(shí)施例。雖然附圖中顯示了本公開(kāi) 的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開(kāi)而不應(yīng)被這里闡述的實(shí)施例 所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開(kāi),并且能夠?qū)⒈竟_(kāi)的范圍 完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
[0030] 本發(fā)明的基本思想:
[0031] 對(duì)于網(wǎng)頁(yè)中的圖片,通常一張帶有鏈接的圖片,點(diǎn)擊這張鏈接圖片會(huì)跳轉(zhuǎn)到另一 個(gè)網(wǎng)頁(yè),那么這張圖片就有很大可能性是和其跳轉(zhuǎn)到的另一個(gè)網(wǎng)頁(yè)是相關(guān)的?;谏鲜鏊?想,本發(fā)明提供了如下幾個(gè)實(shí)施例。
[0032] 如圖3所示,本發(fā)明實(shí)施例一提供的網(wǎng)頁(yè)配圖選取方法的流程圖。本實(shí)施例一提 供的網(wǎng)頁(yè)配圖選取方法,包括:
[0033] 步驟101、從第一網(wǎng)頁(yè)中提取鏈接圖片,所述鏈接圖片為被觸發(fā)后跳轉(zhuǎn)至第二鏈接 地址的圖片。
[0034] 其中,鏈接也稱(chēng)超級(jí)鏈接,是指從一個(gè)網(wǎng)頁(yè)指向一個(gè)目標(biāo)的連接關(guān)系,所指向的目 標(biāo)可以是另一個(gè)網(wǎng)頁(yè),也可以是相同網(wǎng)頁(yè)上的不同位置,還可以是圖片、電子郵件地址、文 件、甚至是應(yīng)用程序。在本實(shí)施例中所指的鏈接圖片,是指從一個(gè)圖片指向一個(gè)目標(biāo)的連接 關(guān)系,所述指向的目標(biāo)為一個(gè)網(wǎng)頁(yè)。
[0035] 步驟102、確定所述鏈接圖片與所述第二鏈接地址對(duì)應(yīng)的第二網(wǎng)頁(yè)的內(nèi)容關(guān)聯(lián)度。
[0036] 雖然基于本發(fā)明的思想,絕大多數(shù)鏈接圖片很大可能性是和其被觸發(fā)后跳轉(zhuǎn)到的 鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)是相關(guān)的。但還是存在少數(shù)鏈接圖片與其跳轉(zhuǎn)到的網(wǎng)頁(yè)的相關(guān)性較低 的情況,因此,本實(shí)施例為了進(jìn)一步的提高配圖的準(zhǔn)確率,在將所述鏈接圖片作為所述第二 網(wǎng)頁(yè)的鏈接地址在搜索結(jié)果中展現(xiàn)的摘要配圖之前,需確定鏈接圖片與第二網(wǎng)頁(yè)之間的內(nèi) 容關(guān)聯(lián)度。其中,確定所述鏈接圖片與所述第二網(wǎng)頁(yè)之間的內(nèi)容關(guān)聯(lián)度可采用多種策略實(shí) 現(xiàn)。本實(shí)施例提供了以下幾種實(shí)現(xiàn)策略,但本發(fā)明不僅限于此。在具體實(shí)施時(shí),還可基于網(wǎng) 頁(yè)分析等進(jìn)一步完善得到更多更好的改進(jìn)策略。
[0037] 策略一、
[0038] 本步驟102、確定所述鏈接圖片與所述第二鏈接地址對(duì)應(yīng)的第二網(wǎng)頁(yè)的內(nèi)容關(guān)聯(lián) 度,可采用如下方法實(shí)現(xiàn):
[0039] 首先,統(tǒng)計(jì)網(wǎng)頁(yè)庫(kù)中與所述鏈接圖片存在鏈接關(guān)系的網(wǎng)頁(yè)的數(shù)量。
[0040] 然后,根據(jù)所述與所述鏈接圖片存在鏈接關(guān)系的網(wǎng)頁(yè)的數(shù)量,確定所述鏈接圖片 與所述第二網(wǎng)頁(yè)的內(nèi)容關(guān)聯(lián)度。
[0041] 在具體實(shí)施時(shí),本實(shí)施例中鏈接圖片與第二網(wǎng)頁(yè)的內(nèi)容關(guān)聯(lián)度可采用內(nèi)容關(guān)聯(lián)度 值來(lái)表征。即本實(shí)施例中所述內(nèi)容關(guān)聯(lián)度表征為內(nèi)容關(guān)聯(lián)度值。相應(yīng)的,上述"根據(jù)所述與 所述鏈接圖片存在鏈接關(guān)系的網(wǎng)頁(yè)的數(shù)量,確定所述鏈接圖片與所述第二網(wǎng)頁(yè)的內(nèi)容關(guān)聯(lián) 度",可具體采用如下方法實(shí)現(xiàn):
[0042] 根據(jù)所述與所述鏈接圖片存在鏈接關(guān)系的網(wǎng)頁(yè)的數(shù)量,確定第一權(quán)重值;
[0043] 將預(yù)置內(nèi)容關(guān)聯(lián)度值更新為所述預(yù)置內(nèi)容關(guān)聯(lián)度值與所述第一權(quán)重值之差,將更 新后的所述預(yù)置內(nèi)容關(guān)聯(lián)度值作為所述鏈接圖片與所述第二網(wǎng)頁(yè)的內(nèi)容關(guān)聯(lián)度值。
[0044] 其中,預(yù)置內(nèi)容關(guān)聯(lián)度值為預(yù)先為每一個(gè)鏈接圖片與其被觸發(fā)后跳轉(zhuǎn)至鏈接地址 對(duì)應(yīng)的網(wǎng)頁(yè)設(shè)置的初始值。每一個(gè)鏈接圖片與其被觸發(fā)后跳轉(zhuǎn)至鏈接地址對(duì)應(yīng)的網(wǎng)頁(yè)的 預(yù)置內(nèi)容關(guān)聯(lián)度值可以相同,也可不同。此外,在實(shí)際應(yīng)用中,可對(duì)不同的與所述鏈接圖片 存在鏈接關(guān)系的網(wǎng)頁(yè)的數(shù)量賦予對(duì)應(yīng)的權(quán)重值,然后采用對(duì)應(yīng)關(guān)系列表的方式預(yù)先進(jìn)行存 儲(chǔ)。例如,數(shù)量為1,第一權(quán)重值為0 ;數(shù)量為2,第一權(quán)重值為3,......或者,可以是一個(gè)區(qū) 間,如數(shù)量為1~3,權(quán)重值為1 ;數(shù)量為4~8,權(quán)重值為5,......然后通過(guò)列表查詢(xún)的方式 根據(jù)網(wǎng)頁(yè)的數(shù)量確定出上述的第一權(quán)重值。即,根據(jù)預(yù)設(shè)的第一網(wǎng)頁(yè)數(shù)量與第一權(quán)重值的 對(duì)應(yīng)關(guān)系,獲取所述與所述鏈接圖片存在鏈接關(guān)系的網(wǎng)頁(yè)的數(shù)量對(duì)應(yīng)的第一權(quán)重值。當(dāng)然, 上述方案只是在實(shí)際應(yīng)用中可采用的一種實(shí)現(xiàn)方案,本實(shí)施例對(duì)于如何根據(jù)網(wǎng)頁(yè)的數(shù)量確 定第一權(quán)重值的實(shí)現(xiàn)方案不作具體限定。
[0045] 策略二、
[0046] 本步驟102、確定所述鏈接圖片與所述第二鏈接地址對(duì)應(yīng)的第二網(wǎng)頁(yè)的內(nèi)容關(guān)聯(lián) 度,可采用如下方法實(shí)現(xiàn):
[0047] 首先,統(tǒng)計(jì)網(wǎng)頁(yè)庫(kù)中包含有所述鏈接圖片,且所述鏈接圖片被觸發(fā)后跳轉(zhuǎn)至的鏈 接地址對(duì)應(yīng)的網(wǎng)頁(yè)為所述第二網(wǎng)頁(yè)的網(wǎng)頁(yè)的數(shù)量;
[0048] 然后,根據(jù)包含有所述鏈接圖片,且所述鏈接圖片被觸發(fā)后跳轉(zhuǎn)至的鏈接地址對(duì) 應(yīng)的網(wǎng)頁(yè)為所述第二網(wǎng)頁(yè)的網(wǎng)頁(yè)的數(shù)量,確定所述鏈接圖片與所述第二網(wǎng)頁(yè)的內(nèi)容關(guān)聯(lián) 度。
[0049] 同樣的,所述鏈接圖片與所述第二網(wǎng)頁(yè)的內(nèi)容關(guān)聯(lián)度可表征為內(nèi)容關(guān)聯(lián)度值。相 應(yīng)的,步驟"根據(jù)包含