推送包含新聞信息的網(wǎng)頁的方法和裝置制造方法
【專利摘要】本發(fā)明提供了一種推送包含新聞信息的網(wǎng)頁的方法和裝置,方法包括:將查詢?cè)~與預(yù)存的時(shí)效性關(guān)鍵詞進(jìn)行匹配;如查詢?cè)~與時(shí)效性關(guān)鍵詞匹配,則獲取查詢?cè)~的時(shí)效性;根據(jù)查詢?cè)~的時(shí)效性強(qiáng)弱,確定在結(jié)果頁中插入的與時(shí)效性關(guān)鍵詞對(duì)應(yīng)的包含新聞信息的網(wǎng)頁的URL的位置。根據(jù)本發(fā)明,在查詢?cè)~與預(yù)設(shè)時(shí)效性關(guān)鍵詞匹配時(shí),分析查詢?cè)~的時(shí)效性,查詢?cè)~的時(shí)效性高低反映了新聞信息對(duì)于用戶的新聞性高低程度,所以基于查詢?cè)~時(shí)效性高低對(duì)包含新聞信息的網(wǎng)頁URL進(jìn)行排序,可將對(duì)用戶來說新聞性較高的新聞信息所在網(wǎng)頁URL排序在前。
【專利說明】推送包含新聞信息的網(wǎng)頁的方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計(jì)算機(jī)【技術(shù)領(lǐng)域】,具體而言,涉及一種推送包含新聞信息的網(wǎng)頁的方法和裝置。
【背景技術(shù)】
[0002]根據(jù)目前搜索引擎技術(shù),用戶在其終端上輸入查詢?cè)~后,搜索引擎會(huì)獲取與查詢?cè)~對(duì)應(yīng)的多個(gè)網(wǎng)頁URL,該多個(gè)網(wǎng)頁URL返回到用戶終端后,會(huì)在用戶終端的結(jié)果頁上展現(xiàn)。
[0003]由于網(wǎng)頁URL的數(shù)量為多個(gè),則在結(jié)果頁上展現(xiàn)時(shí)必然存在排序問題。根據(jù)目前的搜索引擎技術(shù),一般排序在前的都是較舊的網(wǎng)頁URL。這種排序?qū)τ诎侣勑畔⒌木W(wǎng)頁URL來說存在較大缺陷:在用戶輸入查詢?cè)~來搜索新聞的場(chǎng)景下,所以目前的搜索引擎技術(shù)只能將舊新聞的網(wǎng)頁URL排序在前,而最新新聞的網(wǎng)頁URL排序在后,但由于新聞具有時(shí)效性的特點(diǎn),大部分新聞的新聞性都是隨著時(shí)間的推移而降低,則用戶最終查看到的很可能是新聞性較低的新聞,新聞性較高的新聞?dòng)捎谄渚W(wǎng)頁URL排序靠后,用戶難以發(fā)現(xiàn)并打開。
[0004]由此可見,現(xiàn)有的搜索引擎技術(shù)難以分析新聞信息對(duì)用戶的新聞性,難以恰當(dāng)?shù)貙?duì)包含新聞信息的網(wǎng)頁URL進(jìn)行排序,進(jìn)而無法完成對(duì)包含新聞信息的網(wǎng)頁的有效推送。
【發(fā)明內(nèi)容】
[0005]鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的推送包含新聞信息的網(wǎng)頁的方法和裝置。
[0006]依據(jù)本發(fā)明的一個(gè)方面,提供了一種推送包含新聞信息的網(wǎng)頁的方法,其包括:將查詢?cè)~與預(yù)存的時(shí)效性關(guān)鍵詞進(jìn)行匹配;如所述查詢?cè)~與所述時(shí)效性關(guān)鍵詞匹配,則獲取所述查詢?cè)~的時(shí)效性;根據(jù)所述查詢?cè)~的時(shí)效性強(qiáng)弱,確定在結(jié)果頁中插入的與所述時(shí)效性關(guān)鍵詞對(duì)應(yīng)的包含新聞信息的網(wǎng)頁的URL的位置。
[0007]可選地,所述獲取所述查詢?cè)~的時(shí)效性的步驟包括:獲取所述查詢?cè)~對(duì)應(yīng)的多個(gè)網(wǎng)頁的URL ;計(jì)算所述多個(gè)網(wǎng)頁與所述包含新聞信息的網(wǎng)頁之間的差別;根據(jù)所述多個(gè)網(wǎng)頁與所述包含新聞信息的網(wǎng)頁之間的差別,計(jì)算所述查詢?cè)~的時(shí)效性。
[0008]可選地,所述計(jì)算所述多個(gè)網(wǎng)頁與所述包含新聞信息的網(wǎng)頁之間的差別的步驟包括:計(jì)算所述多個(gè)網(wǎng)頁的第一時(shí)效屬性特征;將所述第一時(shí)效屬性特征與預(yù)存的所述包含新聞信息的網(wǎng)頁的第二時(shí)效屬性特征進(jìn)行比較,得到所述多個(gè)網(wǎng)頁與所述包含新聞信息的網(wǎng)頁之間的差別。
[0009]可選地,所述第一時(shí)效屬性特征包括所述多個(gè)網(wǎng)頁的分類、所述多個(gè)網(wǎng)頁的生成時(shí)間、所述查詢?cè)~在所述多個(gè)網(wǎng)頁中出現(xiàn)的頻度和/或所述查詢?cè)~在所述多個(gè)網(wǎng)頁中的出現(xiàn)次數(shù)與已知?dú)v史出現(xiàn)次數(shù)之間的對(duì)比數(shù)據(jù)。
[0010]可選地,所述根據(jù)所述查詢?cè)~的時(shí)效性強(qiáng)弱,確定在結(jié)果頁中插入的與所述時(shí)效性關(guān)鍵詞對(duì)應(yīng)的包含新聞信息的網(wǎng)頁的URL的位置的步驟包括:在所述結(jié)果頁上劃分多個(gè)區(qū)間,分別對(duì)應(yīng)不同強(qiáng)弱程度的時(shí)效性;選擇與所述查詢?cè)~的時(shí)效性強(qiáng)弱匹配的區(qū)間,并將所述包含新聞信息的網(wǎng)頁的URL置于所選區(qū)間中。
[0011]可選地,每個(gè)區(qū)間分為自上而下的三個(gè)部分,且每個(gè)區(qū)間具有對(duì)應(yīng)的置信度,所述將所述包含新聞信息的網(wǎng)頁的URL置于所選區(qū)間中的步驟還包括:如所述查詢?cè)~的時(shí)效性高于所選區(qū)間的置信度,則將所述包含新聞信息的網(wǎng)頁的URL置于所選區(qū)間中的最上部分,如所述查詢?cè)~的時(shí)效性與所選區(qū)間的置信度一致,則將所述包含新聞信息的網(wǎng)頁的URL置于所選區(qū)間中的中間部分,如所述查詢?cè)~的時(shí)效性低于所選區(qū)間的置信度,則將所述包含新聞信息的網(wǎng)頁的URL置于所選區(qū)間中的最下部分。
[0012]依據(jù)本發(fā)明的另一方面,還提供一種推送包含新聞信息的網(wǎng)頁的裝置,其包括:關(guān)鍵詞數(shù)據(jù)庫,用于預(yù)存時(shí)效性關(guān)鍵詞;關(guān)鍵詞匹配模塊,用于將查詢?cè)~與預(yù)存的時(shí)效性關(guān)鍵詞進(jìn)行匹配;查詢?cè)~時(shí)效性獲取模塊,用于如所述查詢?cè)~與所述時(shí)效性關(guān)鍵詞匹配,則獲取所述查詢?cè)~的時(shí)效性;新聞網(wǎng)頁展示模塊,用于根據(jù)所述查詢?cè)~的時(shí)效性強(qiáng)弱,確定在結(jié)果頁中插入的與所述時(shí)效性關(guān)鍵詞對(duì)應(yīng)的包含新聞信息的網(wǎng)頁的URL的位置。
[0013]可選地,還包括:網(wǎng)頁URL獲取模塊,用于獲取所述查詢?cè)~對(duì)應(yīng)的多個(gè)網(wǎng)頁的URL ;差別計(jì)算模塊,用于計(jì)算所述多個(gè)網(wǎng)頁與所述包含新聞信息的網(wǎng)頁之間的差別;所述查詢?cè)~時(shí)效性獲取模塊根據(jù)所述多個(gè)網(wǎng)頁與所述包含新聞信息的網(wǎng)頁之間的差別,計(jì)算所述查詢?cè)~的時(shí)效性。
[0014]可選地,還包括:特征計(jì)算器,用于計(jì)算所述多個(gè)網(wǎng)頁的第一時(shí)效屬性特征;所述差別計(jì)算模塊,用于將所述第一時(shí)效屬性特征與預(yù)存的所述包含新聞信息的網(wǎng)頁的第二時(shí)效屬性特征進(jìn)行比較,得到所述多個(gè)網(wǎng)頁與所述包含新聞信息的網(wǎng)頁之間的差別。
[0015]可選地,所述第一時(shí)效屬性特征包括所述多個(gè)網(wǎng)頁的分類、所述多個(gè)網(wǎng)頁的生成時(shí)間、所述查詢?cè)~在所述多個(gè)網(wǎng)頁中出現(xiàn)的頻度和/或所述查詢?cè)~在所述多個(gè)網(wǎng)頁中的出現(xiàn)次數(shù)與已知?dú)v史出現(xiàn)次數(shù)之間的對(duì)比數(shù)據(jù)。
[0016]可選地,所述新聞網(wǎng)頁展示模塊包括:區(qū)間劃分模塊,用于在所述結(jié)果頁上劃分多個(gè)區(qū)間,分別對(duì)應(yīng)不同強(qiáng)弱程度的時(shí)效性;區(qū)間選擇模塊,用于選擇與所述查詢?cè)~的時(shí)效性強(qiáng)弱匹配的區(qū)間,并將所述包含新聞信息的網(wǎng)頁的URL置于所選區(qū)間中。
[0017]可選地,每個(gè)區(qū)間分為自上而下的三個(gè)部分,且每個(gè)區(qū)間具有對(duì)應(yīng)的置信度,如所述查詢?cè)~的時(shí)效性高于所選區(qū)間的置信度,則所述區(qū)間選擇模塊將所述包含新聞信息的網(wǎng)頁的URL置于所選區(qū)間中的最上部分,如所述查詢?cè)~的時(shí)效性與所選區(qū)間的置信度一致,則所述區(qū)間選擇模塊將所述包含新聞信息的網(wǎng)頁的URL置于所選區(qū)間中的中間部分,如所述查詢?cè)~的時(shí)效性低于所選區(qū)間的置信度,則所述區(qū)間選擇模塊將所述包含新聞信息的網(wǎng)頁的URL置于所選區(qū)間中的最下部分。
[0018]根據(jù)本發(fā)明的推送包含新聞信息的網(wǎng)頁的方法和裝置,在查詢?cè)~與預(yù)設(shè)時(shí)效性關(guān)鍵詞匹配時(shí),說明時(shí)效性關(guān)鍵詞對(duì)應(yīng)的包含新聞信息的網(wǎng)頁也是查詢?cè)~對(duì)應(yīng)的搜索結(jié)果,此時(shí)分析查詢?cè)~的時(shí)效性,查詢?cè)~的時(shí)效性高低反映了新聞信息對(duì)于用戶的新聞性高低程度,所以基于查詢?cè)~時(shí)效性高低對(duì)包含新聞信息的網(wǎng)頁URL進(jìn)行排序,可將對(duì)用戶來說新聞性較高的新聞信息所在網(wǎng)頁URL排序在前,方便用戶及時(shí)查看到所需的新聞信息,從而實(shí)現(xiàn)包含新聞信息的網(wǎng)頁的有效推送。[0019]上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的【具體實(shí)施方式】。
【專利附圖】
【附圖說明】
[0020]通過閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:
[0021]圖1示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的推送包含新聞信息的網(wǎng)頁的方法的流程圖;
[0022]圖2示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的推送包含新聞信息的網(wǎng)頁的方法的部分流程圖;
[0023]圖3示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的推送包含新聞信息的網(wǎng)頁的方法的部分流程圖;
[0024]圖4示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的推送包含新聞信息的網(wǎng)頁的裝置的框圖;
[0025]圖5示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的推送包含新聞信息的網(wǎng)頁的裝置的框圖;
[0026]圖6示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例的推送包含新聞信息的網(wǎng)頁的裝置的單個(gè)模塊框圖。
【具體實(shí)施方式】
[0027]下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施例。雖然附圖中顯示了本公開的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
[0028]如圖1所示,本發(fā)明的一個(gè)實(shí)施例提供了一種推送包含新聞信息的網(wǎng)頁的方法,其包括:步驟110,將查詢?cè)~與預(yù)存的時(shí)效性關(guān)鍵詞進(jìn)行匹配。本實(shí)施例中的時(shí)效性關(guān)鍵詞可以是能夠反映新聞信息時(shí)效性的所有內(nèi)容,例如,可以是一些當(dāng)前熱點(diǎn)詞匯,具體可以表示人物、事件、地點(diǎn)等。
[0029]步驟120,如查詢?cè)~與時(shí)效性關(guān)鍵詞匹配,則獲取查詢?cè)~的時(shí)效性。本實(shí)施例中查詢?cè)~和時(shí)效性關(guān)鍵詞匹配的情況包括但不限于:查詢?cè)~與時(shí)效性關(guān)鍵詞全部或部分相同、查詢?cè)~與時(shí)效性關(guān)鍵詞為不同語言的同一釋義、查詢?cè)~與時(shí)效性關(guān)鍵詞為同義詞、查詢?cè)~為時(shí)效性關(guān)鍵詞的拼音。查詢?cè)~與時(shí)效性關(guān)鍵詞相匹配,說明包含新聞信息的網(wǎng)頁也是查詢?cè)~對(duì)應(yīng)的查詢結(jié)果。由于新聞信息具有時(shí)效性特點(diǎn),所以對(duì)包含新聞信息的網(wǎng)頁的URL排序需要按新聞信息的新聞性大小來排序,而本實(shí)施例中計(jì)算出的查詢?cè)~的時(shí)效性正是量化的新聞性。
[0030]步驟130,根據(jù)查詢?cè)~的時(shí)效性強(qiáng)弱,確定在結(jié)果頁中插入的與時(shí)效性關(guān)鍵詞對(duì)應(yīng)的包含新聞信息的網(wǎng)頁的URL的位置。在本實(shí)施例的技術(shù)方案中,實(shí)際上是對(duì)用戶來說新聞性較高的新聞信息所在網(wǎng)頁的URL排序在前,從而便于用戶進(jìn)行點(diǎn)擊打開,利于實(shí)現(xiàn)包含新聞信息的網(wǎng)頁的推送。[0031]如圖2所示,本發(fā)明的另一實(shí)施例提出一種推送包含新聞信息的網(wǎng)頁的方法。本實(shí)施例的推送包含新聞信息的網(wǎng)頁的方法,步驟120包括:步驟121,獲取查詢?cè)~對(duì)應(yīng)的多個(gè)網(wǎng)頁的URL;步驟122,計(jì)算多個(gè)網(wǎng)頁與包含新聞信息的網(wǎng)頁之間的差別,可以將網(wǎng)頁的所有內(nèi)容都用于進(jìn)行比較,也可以從網(wǎng)頁中提取具有代表性的關(guān)鍵內(nèi)容進(jìn)行比較;步驟123,根據(jù)多個(gè)網(wǎng)頁與包含新聞信息的網(wǎng)頁之間的差別,計(jì)算查詢?cè)~的時(shí)效性。
[0032]在本實(shí)施例的技術(shù)方案中,由于新聞信息往往是突發(fā)性事件,所以包含新聞信息的網(wǎng)頁與多個(gè)網(wǎng)頁之間的差別,往往能夠反映新聞信息的新聞性,也即查詢?cè)~的時(shí)效性。
[0033]本發(fā)明的另一實(shí)施例提出一種推送包含新聞信息的網(wǎng)頁的方法,本實(shí)施例的推送包含新聞信息的網(wǎng)頁的方法,步驟122包括:計(jì)算多個(gè)網(wǎng)頁的第一時(shí)效屬性特征,并將第一時(shí)效屬性特征與預(yù)存的包含新聞信息的網(wǎng)頁的第二時(shí)效屬性特征進(jìn)行比較,得到多個(gè)網(wǎng)頁與包含新聞信息的網(wǎng)頁之間的差別。
[0034]本實(shí)施例中不限制第一時(shí)效屬性特征的計(jì)算過程和結(jié)果形式,第一時(shí)效屬性特征包含但不限于具體的數(shù)值或向量。本實(shí)施例中不限制第二時(shí)效屬性特征的計(jì)算過程和結(jié)果形式,與第一時(shí)效屬性特征的計(jì)算過程和結(jié)果形式一致即可,以便于兩者進(jìn)行比較。
[0035]本發(fā)明的另一實(shí)施例提出一種推送包含新聞信息的網(wǎng)頁的方法,本實(shí)施例的推送包含新聞信息的網(wǎng)頁的方法,第一時(shí)效屬性特征包括多個(gè)網(wǎng)頁的分類、多個(gè)網(wǎng)頁的生成時(shí)間、查詢?cè)~在多個(gè)網(wǎng)頁中出現(xiàn)的頻度和/或查詢?cè)~在多個(gè)網(wǎng)頁中的出現(xiàn)次數(shù)與已知?dú)v史出現(xiàn)次數(shù)之間的對(duì)比數(shù)據(jù)。在本實(shí)施例的技術(shù)方案中,網(wǎng)頁的分類可以是多層。例如首先可分為bbs、blog、新聞三大類,進(jìn)而對(duì)新聞繼續(xù)分國內(nèi)、國際、軍事……等。需要注意的是,網(wǎng)頁的生成時(shí)間不同于被抓取時(shí)間,生成時(shí)間較近則說明新聞信息內(nèi)容較新,更可能是突發(fā)性新聞,所以其可作為時(shí)效 屬性特征。時(shí)效性關(guān)鍵詞出現(xiàn)頻率較高,或出現(xiàn)次數(shù)相對(duì)于歷史出現(xiàn)次數(shù)有顯著提高,都說明新聞信息可能是突發(fā)性或熱點(diǎn)新聞,所以其可作為時(shí)效屬性特征。
[0036]如圖3所示,本發(fā)明的另一實(shí)施例提出一種推送包含新聞信息的網(wǎng)頁的方法,本實(shí)施例的推送包含新聞信息的網(wǎng)頁的方法,步驟130包括:步驟131,在結(jié)果頁上劃分多個(gè)區(qū)間,分別對(duì)應(yīng)不同強(qiáng)弱程度的時(shí)效性;步驟132,選擇與查詢?cè)~的時(shí)效性強(qiáng)弱匹配的區(qū)間,并將包含新聞信息的網(wǎng)頁的URL置于所選區(qū)間中。在本實(shí)施例的技術(shù)方案中,提供了一種有效的排序方式,本實(shí)施例的一個(gè)具體實(shí)現(xiàn)方式如下:結(jié)果頁的首頁一般有10個(gè)位置可以展現(xiàn)搜索結(jié)果URL (從上到下命名為位置I到位置10)。本發(fā)明將結(jié)果頁首頁的搜索結(jié)果劃分為多個(gè)區(qū)間,比如位置I到位置3劃分為一個(gè)區(qū)間標(biāo)記為區(qū)間1,將位置4到位置6劃分為第二個(gè)區(qū)間標(biāo)記為區(qū)間2,將位置7到位置9劃分為第3個(gè)區(qū)間標(biāo)記為區(qū)間3,將位置10劃分為第4個(gè)區(qū)間標(biāo)記為區(qū)間4。另外,增加一個(gè)區(qū)間為標(biāo)記為區(qū)間5,區(qū)間5不顯示在首頁上。當(dāng)查詢?cè)~的時(shí)效性強(qiáng)弱與區(qū)間1、2、3或4對(duì)應(yīng)時(shí),則將包含新聞信息的網(wǎng)頁的URL顯示在結(jié)果頁首頁對(duì)應(yīng)的區(qū)間內(nèi),當(dāng)查詢?cè)~的時(shí)效性強(qiáng)弱對(duì)應(yīng)區(qū)間5的時(shí)候,認(rèn)為時(shí)效性的結(jié)果不適合出來在搜索結(jié)果中,最終不會(huì)在結(jié)果頁的首頁上展現(xiàn)出來。模型數(shù)據(jù)準(zhǔn)備:收集用戶在新聞?lì)l道的搜索詞,人工對(duì)這些搜索詞進(jìn)行標(biāo)注,根據(jù)搜索詞的時(shí)效性強(qiáng)弱,指定應(yīng)該劃分的區(qū)間。例如,如果查詢?cè)~為“360商業(yè)化”,經(jīng)過計(jì)算后這個(gè)查詢?cè)~與區(qū)間I的時(shí)效性強(qiáng)弱一致,則將包含新聞信息的網(wǎng)頁“360搜索首次披露商業(yè)化進(jìn)程”的URL置于區(qū)間I。[0037]本發(fā)明的另一實(shí)施例提出一種推送包含新聞信息的網(wǎng)頁的方法,本實(shí)施例的推送包含新聞信息的網(wǎng)頁的方法,每個(gè)區(qū)間分為自上而下的三個(gè)部分,且每個(gè)區(qū)間具有對(duì)應(yīng)的置信度,步驟132還包括:如查詢?cè)~的時(shí)效性高于所選區(qū)間的置信度,則將包含新聞信息的網(wǎng)頁的URL置于所選區(qū)間中的最上部分;如查詢?cè)~的時(shí)效性與所選區(qū)間的置信度一致,則將包含新聞信息的網(wǎng)頁的URL置于所選區(qū)間中的中間部分;如查詢?cè)~的時(shí)效性低于所選區(qū)間的置信度,則將包含新聞信息的網(wǎng)頁的URL置于所選區(qū)間中的最下部分。在本實(shí)施例的技術(shù)方案中,對(duì)每個(gè)區(qū)間又進(jìn)行了細(xì)分,更細(xì)致地布置了包含新聞信息的網(wǎng)頁的URL的位置。在本實(shí)施例的一個(gè)具體實(shí)現(xiàn)方式中,用戶輸入一個(gè)查詢?cè)~,經(jīng)過計(jì)算后查詢?cè)~的時(shí)效性對(duì)應(yīng)的區(qū)間,該區(qū)間對(duì)應(yīng)的時(shí)效性強(qiáng)弱為一個(gè)范圍值,即置信度,比如置信度區(qū)間指定為
0.7-0.9,假如判斷當(dāng)前查詢?cè)~的時(shí)效性大于置信度區(qū)間的上限值0.9,則將包含新聞信息的網(wǎng)頁的URL劃分到該區(qū)間的最上部分,假如查詢?cè)~的時(shí)效性強(qiáng)弱在置信度區(qū)間內(nèi)(即0.7和0.9)之間,則將包含新聞信息的網(wǎng)頁的URL劃分到本區(qū)間的中間部分,假如查詢?cè)~的時(shí)效性小于置信度區(qū)間的下限值0.7,則劃分到區(qū)間的最下部分。
[0038]如圖4所示,本發(fā)明的另一實(shí)施例還提供一種推送包含新聞信息的網(wǎng)頁的裝置,其包括:關(guān)鍵詞數(shù)據(jù)庫210,用于預(yù)存時(shí)效性關(guān)鍵詞。本實(shí)施例中的時(shí)效性關(guān)鍵詞可以是能夠反映新聞信息時(shí)效性的所有內(nèi)容,例如,可以是一些當(dāng)前熱點(diǎn)詞匯,具體可以表示人物、事件、地點(diǎn)等。關(guān)鍵詞匹配模塊220,用于將查詢?cè)~與預(yù)存的時(shí)效性關(guān)鍵詞進(jìn)行匹配。查詢?cè)~時(shí)效性獲取模塊230,用于如查詢?cè)~與時(shí)效性關(guān)鍵詞匹配,則獲取查詢?cè)~的時(shí)效性。本實(shí)施例中查詢?cè)~和時(shí)效性關(guān)鍵詞匹配的情況包括但不限于:查詢?cè)~與時(shí)效性關(guān)鍵詞全部或部分相同、查詢?cè)~與時(shí)效性關(guān)鍵詞為不同語言的同一釋義、查詢?cè)~與時(shí)效性關(guān)鍵詞為同義詞、查詢?cè)~為時(shí)效性關(guān)鍵詞的拼音。查詢?cè)~與時(shí)效性關(guān)鍵詞相匹配,說明包含新聞信息的網(wǎng)頁也是查詢?cè)~對(duì)應(yīng)的查詢結(jié)果。由于新聞信息具有時(shí)效性特點(diǎn),所以對(duì)包含新聞信息的網(wǎng)頁的URL排序需要按新聞信息的新聞性大小來排序,而本實(shí)施例中計(jì)算出的查詢?cè)~的時(shí)效性正是量化的新聞性。新聞網(wǎng)頁展示模塊240,用于根據(jù)查詢?cè)~的時(shí)效性強(qiáng)弱,確定在結(jié)果頁中插入的與時(shí)效性關(guān)鍵詞對(duì)應(yīng)的包含新聞信息的網(wǎng)頁的URL的位置。在本實(shí)施例的技術(shù)方案中,實(shí)際上是對(duì)用戶來說新聞性較高的新聞信息所在網(wǎng)頁的URL排序在前,從而便于用戶進(jìn)行點(diǎn)擊打開,利于實(shí)現(xiàn)包含新聞信息的網(wǎng)頁的推送。
[0039]如圖5所示,本發(fā)明的另一實(shí)施例提出一種推送包含新聞信息的網(wǎng)頁的裝置,本實(shí)施例的推送包含新聞信息的網(wǎng)頁的裝置,還包括:網(wǎng)頁URL獲取模塊250,用于獲取查詢?cè)~對(duì)應(yīng)的多個(gè)網(wǎng)頁的URL ;差別計(jì)算模塊260,用于計(jì)算多個(gè)網(wǎng)頁與包含新聞信息的網(wǎng)頁之間的差別,可以將網(wǎng)頁的所有內(nèi)容都用于進(jìn)行比較,也可以從網(wǎng)頁中提取具有代表性的關(guān)鍵內(nèi)容進(jìn)行比較;查詢?cè)~時(shí)效性獲取模塊240根據(jù)多個(gè)網(wǎng)頁與包含新聞信息的網(wǎng)頁之間的差別,計(jì)算查詢?cè)~的時(shí)效性。在本實(shí)施例的技術(shù)方案中,由于新聞信息往往是突發(fā)性事件,所以包含新聞信息的網(wǎng)頁與多個(gè)網(wǎng)頁之間的差別,往往能夠反映新聞信息的新聞性,也即查詢?cè)~的時(shí)效性。
[0040]如圖5所示,本發(fā)明的另一實(shí)施例提出一種推送包含新聞信息的網(wǎng)頁的裝置,本實(shí)施例的推送包含新聞信息的網(wǎng)頁的裝置,還包括:特征計(jì)算器270,用于計(jì)算多個(gè)網(wǎng)頁的第一時(shí)效屬性特征;差別計(jì)算模塊280,用于將第一時(shí)效屬性特征與預(yù)存的包含新聞信息的網(wǎng)頁的第二時(shí)效屬性特征進(jìn)行比較,得到多個(gè)網(wǎng)頁與包含新聞信息的網(wǎng)頁之間的差別。本實(shí)施例中不限制第一時(shí)效屬性特征的計(jì)算過程和結(jié)果形式,第一時(shí)效屬性特征包含但不限于具體的數(shù)值或向量。本實(shí)施例中不限制第二時(shí)效屬性特征的計(jì)算過程和結(jié)果形式,與第一時(shí)效屬性特征的計(jì)算過程和結(jié)果形式一致即可,以便于兩者進(jìn)行比較。
[0041]本發(fā)明的另一實(shí)施例提出一種推送包含新聞信息的網(wǎng)頁的裝置,本實(shí)施例的推送包含新聞信息的網(wǎng)頁的裝置,第一時(shí)效屬性特征包括多個(gè)網(wǎng)頁的分類、多個(gè)網(wǎng)頁的生成時(shí)間、查詢?cè)~在多個(gè)網(wǎng)頁中出現(xiàn)的頻度和/或查詢?cè)~在多個(gè)網(wǎng)頁中的出現(xiàn)次數(shù)與已知?dú)v史出現(xiàn)次數(shù)之間的對(duì)比數(shù)據(jù)。在本實(shí)施例的技術(shù)方案中,網(wǎng)頁的分類可以是多層,例如首先可分為bbs、blog、新聞三大類,進(jìn)而對(duì)新聞繼續(xù)分國內(nèi)、國際、軍事……等。需要注意的是,網(wǎng)頁的生成時(shí)間不同于被抓取時(shí)間,生成時(shí)間較近則說明新聞信息內(nèi)容較新,更可能是突發(fā)性新聞,所以其可作為時(shí)效屬性特征。時(shí)效性關(guān)鍵詞出現(xiàn)頻率較高,或出現(xiàn)次數(shù)相對(duì)于歷史出現(xiàn)次數(shù)有顯著提高,都說明新聞信息可能是突發(fā)性或熱點(diǎn)新聞,所以其可作為時(shí)效屬性特征。
[0042]如圖6所示,本發(fā)明的另一實(shí)施例提出一種推送包含新聞信息的網(wǎng)頁的裝置,本實(shí)施例的推送包含新聞信息的網(wǎng)頁的裝置,新聞網(wǎng)頁展示模塊240包括:區(qū)間劃分模塊241,用于在結(jié)果頁上劃分多個(gè)區(qū)間,分別對(duì)應(yīng)不同強(qiáng)弱程度的時(shí)效性;區(qū)間選擇模塊242,用于選擇與查詢?cè)~的時(shí)效性強(qiáng)弱匹配的區(qū)間,并將包含新聞信息的網(wǎng)頁的URL置于所選區(qū)間中。在本實(shí)施例的技術(shù)方案中,提供了一種有效的排序方式,本實(shí)施例的一個(gè)具體實(shí)現(xiàn)方式如下:結(jié)果頁的首頁一般有10個(gè)位置可以展現(xiàn)搜索結(jié)果URL (從上到下命名為位置I到位置10)。本發(fā)明將結(jié)果頁首頁的搜索結(jié)果劃分為多個(gè)區(qū)間,比如位置I到位置3劃分為一個(gè)區(qū)間標(biāo)記為區(qū)間1,將位置4到位置6劃分為第二個(gè)區(qū)間標(biāo)記為區(qū)間2,將位置7到位置9劃分為第3個(gè)區(qū)間標(biāo)記為區(qū)間3,將位置10劃分為第4個(gè)區(qū)間標(biāo)記為區(qū)間4。另外,增加一個(gè)區(qū)間為標(biāo)記為區(qū)間5,區(qū)間5不顯示在首頁上。當(dāng)查詢?cè)~的時(shí)效性強(qiáng)弱與區(qū)間1、2、3或4對(duì)應(yīng)時(shí),則將包含新聞信息的網(wǎng)頁的URL顯示在結(jié)果頁首頁對(duì)應(yīng)的區(qū)間內(nèi)。當(dāng)查詢?cè)~的時(shí)效性強(qiáng)弱對(duì)應(yīng)區(qū)間5的時(shí)候,認(rèn)為時(shí)效性的結(jié)果不適合出來在搜索結(jié)果中,最終不會(huì)在結(jié)果頁的首頁上展現(xiàn)出來。模型數(shù)據(jù)準(zhǔn)備:收集用戶在新聞?lì)l道的搜索詞,人工對(duì)這些搜索詞進(jìn)行標(biāo)注,根據(jù)搜索詞的時(shí)效性強(qiáng)弱,指定應(yīng)該劃分的區(qū)間。例如,如果查詢?cè)~為“360商業(yè)化”,經(jīng)過計(jì)算后這個(gè)查詢?cè)~與區(qū)間I的時(shí)效性強(qiáng)弱一致,則將包含新聞信息的網(wǎng)頁“360搜索首次披露商業(yè)化進(jìn)程”的URL置于區(qū)間I。
[0043] 本發(fā)明的另一實(shí)施例提出一種推送包含新聞信息的網(wǎng)頁的裝置,本實(shí)施例的推送包含新聞信息的網(wǎng)頁的裝置,每個(gè)區(qū)間分為自上而下的三個(gè)部分,且每個(gè)區(qū)間具有對(duì)應(yīng)的置信度。如查詢?cè)~的時(shí)效性高于所選區(qū)間的置信度,則區(qū)間選擇模塊242將包含新聞信息的網(wǎng)頁的URL置于所選區(qū)間中的最上部分。如查詢?cè)~的時(shí)效性與所選區(qū)間的置信度一致,則區(qū)間選擇模塊242將包含新聞信息的網(wǎng)頁的URL置于所選區(qū)間中的中間部分。如查詢?cè)~的時(shí)效性低于所選區(qū)間的置信度,則區(qū)間選擇模塊242將包含新聞信息的網(wǎng)頁的URL置于所選區(qū)間中的最下部分。在本實(shí)施例的技術(shù)方案中,對(duì)每個(gè)區(qū)間又進(jìn)行了細(xì)分,更細(xì)致地布置了包含新聞信息的網(wǎng)頁的URL的位置。在本實(shí)施例的一個(gè)具體實(shí)現(xiàn)方式中,用戶輸入一個(gè)查詢?cè)~,經(jīng)過計(jì)算后查詢?cè)~的時(shí)效性對(duì)應(yīng)的區(qū)間,該區(qū)間對(duì)應(yīng)的時(shí)效性強(qiáng)弱為一個(gè)范圍值,即置信度。比如置信度的區(qū)間指定為0.7-0.9,假如判斷當(dāng)前查詢?cè)~的時(shí)效性大于置信度區(qū)間的上限值0.9,則將包含新聞信息的網(wǎng)頁的URL劃分到該區(qū)間的最上部分;假如查詢?cè)~的時(shí)效性強(qiáng)弱在置信度區(qū)間內(nèi)(即0.7和0.9之間),則將包含新聞信息的網(wǎng)頁的URL劃分到本區(qū)間的中間部分;假如查詢?cè)~的時(shí)效性小于置信度區(qū)間的下限值0.7,則劃分到區(qū)間的最下部分。
[0044]在此提供的算法和顯示不與任何特定計(jì)算機(jī)、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對(duì)任何特定編程語言。應(yīng)當(dāng)明白,可以利用各種編程語言實(shí)現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對(duì)特定語言所做的描述是為了披露本發(fā)明的最佳實(shí)施方式。
[0045]在此處所提供的說明書中,說明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對(duì)本說明書的理解。
[0046]類似地,應(yīng)當(dāng)理解,為了精簡(jiǎn)本公開并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在上面對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個(gè)實(shí)施例的所有特征。因此,遵循【具體實(shí)施方式】的權(quán)利要求書由此明確地并入該【具體實(shí)施方式】,其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。
[0047]本領(lǐng)域那些技術(shù)人員可以理解,可以對(duì)實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們?cè)O(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)設(shè)備中??梢园褜?shí)施例中的模塊或單元或組件組合成一個(gè)模塊或單元或組件,以及此外可以把它們分成多個(gè)子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對(duì)本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過程或單元進(jìn)行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來代替。
[0048]此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在下面的權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來使用。
[0049]本發(fā)明的各個(gè)部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號(hào)處理器(DSP)來實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的推送包含新聞信息的網(wǎng)頁的方法和裝置中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè)信號(hào)的形式。這樣的信號(hào)可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號(hào)上提供,或者以任何其他形式提供。
[0050]應(yīng)該注意的是上述實(shí)施例對(duì)本發(fā)明進(jìn)行說明而不是對(duì)本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號(hào)之間的任何參考符號(hào)構(gòu)造成對(duì)權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個(gè)”不排除存在多個(gè)這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個(gè)可以是通過同一個(gè)硬件項(xiàng)來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
【權(quán)利要求】
1.一種推送包含新聞信息的網(wǎng)頁的方法,其包括: 將查詢?cè)~與預(yù)存的時(shí)效性關(guān)鍵詞進(jìn)行匹配; 如所述查詢?cè)~與所述時(shí)效性關(guān)鍵詞匹配,則獲取所述查詢?cè)~的時(shí)效性; 根據(jù)所述查詢?cè)~的時(shí)效性強(qiáng)弱,確定在結(jié)果頁中插入的與所述時(shí)效性關(guān)鍵詞對(duì)應(yīng)的包含新聞信息的網(wǎng)頁的URL的位置。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述獲取所述查詢?cè)~的時(shí)效性的步驟包括: 獲取所述查詢?cè)~對(duì)應(yīng)的多個(gè)網(wǎng)頁的URL ; 計(jì)算所述多個(gè)網(wǎng)頁與所述包含新聞信息的網(wǎng)頁之間的差別; 根據(jù)所述多個(gè)網(wǎng)頁與所述包含新聞信息的網(wǎng)頁之間的差別,計(jì)算所述查詢?cè)~的時(shí)效性。
3.根據(jù)權(quán)利要求1-2任一項(xiàng)所述的方法,其中,所述計(jì)算所述多個(gè)網(wǎng)頁與所述包含新聞信息的網(wǎng)頁之間的差別的步驟包括: 計(jì)算所述多個(gè)網(wǎng)頁的第一時(shí)效屬性特征; 將所述第一時(shí)效屬性特征與預(yù)存的所述包含新聞信息的網(wǎng)頁的第二時(shí)效屬性特征進(jìn)行比較,得到所述多個(gè)網(wǎng)頁與所述包含新聞信息的網(wǎng)頁之間的差別。
4.根據(jù)權(quán)利要 求1-3中任一項(xiàng)所述的方法,其中,所述第一時(shí)效屬性特征包括所述多個(gè)網(wǎng)頁的分類、所述多個(gè)網(wǎng)頁的生成時(shí)間、所述查詢?cè)~在所述多個(gè)網(wǎng)頁中出現(xiàn)的頻度和/或所述查詢?cè)~在所述多個(gè)網(wǎng)頁中的出現(xiàn)次數(shù)與已知?dú)v史出現(xiàn)次數(shù)之間的對(duì)比數(shù)據(jù)。
5.根據(jù)權(quán)利要求1至4中任一項(xiàng)所述的方法,其中,所述根據(jù)所述查詢?cè)~的時(shí)效性強(qiáng)弱,確定在結(jié)果頁中插入的與所述時(shí)效性關(guān)鍵詞對(duì)應(yīng)的包含新聞信息的網(wǎng)頁的URL的位置的步驟包括: 在所述結(jié)果頁上劃分多個(gè)區(qū)間,分別對(duì)應(yīng)不同強(qiáng)弱程度的時(shí)效性; 選擇與所述查詢?cè)~的時(shí)效性強(qiáng)弱匹配的區(qū)間,并將所述包含新聞信息的網(wǎng)頁的URL置于所選區(qū)間中。
6.根據(jù)權(quán)利要求1-5中任一項(xiàng)所述的方法,其中,每個(gè)區(qū)間分為自上而下的三個(gè)部分,且每個(gè)區(qū)間具有對(duì)應(yīng)的置信度,所述將所述包含新聞信息的網(wǎng)頁的URL置于所選區(qū)間中的步驟還包括: 如所述查詢?cè)~的時(shí)效性高于所選區(qū)間的置信度,則將所述包含新聞信息的網(wǎng)頁的URL置于所選區(qū)間中的最上部分,如所述查詢?cè)~的時(shí)效性與所選區(qū)間的置信度一致,則將所述包含新聞信息的網(wǎng)頁的URL置于所選區(qū)間中的中間部分,如所述查詢?cè)~的時(shí)效性低于所選區(qū)間的置信度,則將所述包含新聞信息的網(wǎng)頁的URL置于所選區(qū)間中的最下部分。
7.—種推送包含新聞信息的網(wǎng)頁的裝置,其包括: 關(guān)鍵詞數(shù)據(jù)庫,用于預(yù)存時(shí)效性關(guān)鍵詞; 關(guān)鍵詞匹配模塊,用于將查詢?cè)~與預(yù)存的時(shí)效性關(guān)鍵詞進(jìn)行匹配; 查詢?cè)~時(shí)效性獲取模塊,用于如所述查詢?cè)~與所述時(shí)效性關(guān)鍵詞匹配,則獲取所述查詢?cè)~的時(shí)效性; 新聞網(wǎng)頁展示模塊,用于根據(jù)所述查詢?cè)~的時(shí)效性強(qiáng)弱,確定在結(jié)果頁中插入的與所述時(shí)效性關(guān)鍵詞對(duì)應(yīng)的包含新聞信息的網(wǎng)頁的URL的位置。
8.根據(jù)權(quán)利要求7所述的裝置,其中,還包括:網(wǎng)頁URL獲取模塊,用于獲取所述查詢?cè)~對(duì)應(yīng)的多個(gè)網(wǎng)頁的URL ; 差別計(jì)算模塊,用于計(jì)算所述多個(gè)網(wǎng)頁與所述包含新聞信息的網(wǎng)頁之間的差別;所述查詢?cè)~時(shí)效性獲取模塊根據(jù)所述多個(gè)網(wǎng)頁與所述包含新聞信息的網(wǎng)頁之間的差別,計(jì)算所述查詢?cè)~的時(shí)效性。
9.根據(jù)權(quán)利要求7-8任一項(xiàng)所述的裝置,其中,還包括: 特征計(jì)算器,用于計(jì)算所述多個(gè)網(wǎng)頁的第一時(shí)效屬性特征; 所述差別計(jì)算模塊,用于將所述第一時(shí)效屬性特征與預(yù)存的所述包含新聞信息的網(wǎng)頁的第二時(shí)效屬性特征進(jìn)行比較,得到所述多個(gè)網(wǎng)頁與所述包含新聞信息的網(wǎng)頁之間的差別。
10.根據(jù)權(quán)利要求7-9任一項(xiàng)所述的裝置,其中,所述第一時(shí)效屬性特征包括所述多個(gè)網(wǎng)頁的分類、所述多個(gè)網(wǎng)頁的生成時(shí)間、所述查詢?cè)~在所述多個(gè)網(wǎng)頁中出現(xiàn)的頻度和/或所述查詢?cè)~在所述多 個(gè)網(wǎng)頁中的出現(xiàn)次數(shù)與已知?dú)v史出現(xiàn)次數(shù)之間的對(duì)比數(shù)據(jù)。
【文檔編號(hào)】G06F17/30GK103942264SQ201410116836
【公開日】2014年7月23日 申請(qǐng)日期:2014年3月26日 優(yōu)先權(quán)日:2014年3月26日
【發(fā)明者】常富洋, 秦吉?jiǎng)? 蘇文杰 申請(qǐng)人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司