欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

網(wǎng)頁(yè)識(shí)別方法及網(wǎng)頁(yè)識(shí)別裝置的制造方法_4

文檔序號(hào):9217196閱讀:來(lái)源:國(guó)知局
識(shí)別值,對(duì)網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)進(jìn)行預(yù)定網(wǎng)頁(yè)的識(shí)別;如網(wǎng)頁(yè)標(biāo)題的第一識(shí)別值大于等于預(yù)設(shè)的第一閾值45,則預(yù)定網(wǎng)頁(yè)確定模塊43確定該網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)為預(yù)定網(wǎng)頁(yè);如網(wǎng)頁(yè)標(biāo)題的第一識(shí)別值小于預(yù)設(shè)的第一閾值45,則預(yù)定網(wǎng)頁(yè)確定模塊43確定該網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)不是預(yù)定網(wǎng)頁(yè),隨后轉(zhuǎn)到步驟S504。
[0077]在步驟S504中,如預(yù)定網(wǎng)頁(yè)確定模塊43確定某個(gè)網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)為預(yù)定網(wǎng)頁(yè),則根據(jù)預(yù)定網(wǎng)頁(yè)計(jì)算模型48的第二閾值,修正模塊47對(duì)網(wǎng)頁(yè)標(biāo)題中的預(yù)定詞匯的加權(quán)值進(jìn)行修正,使修正后的預(yù)定網(wǎng)頁(yè)的第二識(shí)別值大于等于預(yù)定網(wǎng)頁(yè)計(jì)算模型48的第二閾值。如預(yù)定網(wǎng)頁(yè)確定模塊43確定某個(gè)網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)不是預(yù)定網(wǎng)頁(yè),則直接使用預(yù)定網(wǎng)頁(yè)計(jì)算模型48對(duì)網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)的網(wǎng)頁(yè)內(nèi)容進(jìn)行識(shí)別。這樣預(yù)定網(wǎng)頁(yè)計(jì)算模型48可根據(jù)網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題和網(wǎng)頁(yè)內(nèi)容,識(shí)別所有類(lèi)型的預(yù)定網(wǎng)頁(yè)。
[0078]這樣即完成了本優(yōu)選實(shí)施例的網(wǎng)頁(yè)識(shí)別方法的網(wǎng)頁(yè)識(shí)別過(guò)程。
[0079]本優(yōu)選實(shí)施例的網(wǎng)頁(yè)識(shí)別方法在第一優(yōu)選實(shí)施例的基礎(chǔ)上通過(guò)修正網(wǎng)頁(yè)標(biāo)題中的預(yù)定詞匯的加權(quán)值使得現(xiàn)有的預(yù)定網(wǎng)頁(yè)計(jì)算模型可以識(shí)別所有類(lèi)型的預(yù)定網(wǎng)頁(yè),實(shí)現(xiàn)了對(duì)所有預(yù)定網(wǎng)頁(yè)(包括“作弊”網(wǎng)頁(yè))的識(shí)別。
[0080]下面通過(guò)一具體實(shí)施例說(shuō)明本發(fā)明的網(wǎng)頁(yè)識(shí)別裝置及網(wǎng)頁(yè)識(shí)別方法的具體工作原理。
[0081]首先用戶(hù)通過(guò)特征選擇(Feature Select1n)方法挑選出吸引用戶(hù)點(diǎn)擊的預(yù)定詞匯(如色情詞匯等)存儲(chǔ)在預(yù)定詞匯數(shù)據(jù)庫(kù)中,并通過(guò)人工經(jīng)驗(yàn)分為三層,如色情度最高的預(yù)定詞匯為第一層,色情度較高的預(yù)定詞匯為第二層,色情度一般的預(yù)定詞匯為第三層,不同層的預(yù)定詞匯設(shè)定不同的加權(quán)值,并將預(yù)定詞匯的加權(quán)值也存儲(chǔ)在預(yù)定詞匯數(shù)據(jù)庫(kù)中。
[0082]隨后網(wǎng)頁(yè)識(shí)別裝置的詞匯獲取模塊讀取該預(yù)定詞匯數(shù)據(jù)庫(kù),并根據(jù)預(yù)定詞匯數(shù)據(jù)庫(kù)獲取網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題中的預(yù)定詞匯以及預(yù)定詞匯的加權(quán)值。網(wǎng)頁(yè)識(shí)別裝置的識(shí)別值生成模塊根據(jù)預(yù)定詞匯以及預(yù)定詞匯的加權(quán)值,生成網(wǎng)頁(yè)標(biāo)題的第一識(shí)別值,如網(wǎng)頁(yè)標(biāo)題的第一識(shí)別值為網(wǎng)頁(yè)標(biāo)題中所有預(yù)定詞匯的加權(quán)值之和。
[0083]然后網(wǎng)頁(yè)識(shí)別裝置的預(yù)定網(wǎng)頁(yè)確定模塊根據(jù)預(yù)設(shè)的第一閾值以及識(shí)別值生成模塊獲取的網(wǎng)頁(yè)標(biāo)題的第一識(shí)別值,對(duì)網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)進(jìn)行預(yù)定網(wǎng)頁(yè)的識(shí)別。如網(wǎng)頁(yè)標(biāo)題的第一識(shí)別值大于等于預(yù)設(shè)的第一閾值,則預(yù)定網(wǎng)頁(yè)確定模塊確定該網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)為預(yù)定網(wǎng)頁(yè);如網(wǎng)頁(yè)標(biāo)題的第一識(shí)別值小于預(yù)設(shè)的第一閾值,則預(yù)定網(wǎng)頁(yè)確定模塊確定該網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)不是預(yù)定網(wǎng)頁(yè)。
[0084]如第一層預(yù)定詞匯的加權(quán)值為8,第二層預(yù)定詞匯的加權(quán)值為4,第三層預(yù)定詞匯的加權(quán)值為3,預(yù)設(shè)的第一閾值為10 ;則網(wǎng)頁(yè)標(biāo)題中包括至少一個(gè)第一層預(yù)定詞匯和至少一個(gè)其他層預(yù)定詞匯,或包括至少一個(gè)第二層預(yù)定詞匯和至少兩個(gè)第三層預(yù)定詞匯,或包括至少四個(gè)第三層預(yù)定詞匯,則判斷該網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)為預(yù)定網(wǎng)頁(yè),否則判斷該網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)不是預(yù)定網(wǎng)頁(yè)。
[0085]最后,在預(yù)定網(wǎng)頁(yè)確定模塊確定該網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)為預(yù)定網(wǎng)頁(yè)時(shí),為了不影響現(xiàn)有的預(yù)定網(wǎng)頁(yè)計(jì)算模型,網(wǎng)頁(yè)識(shí)別裝置的修正模塊會(huì)對(duì)預(yù)定網(wǎng)頁(yè)計(jì)算模型中相應(yīng)的預(yù)定詞匯進(jìn)行修正,使修正后的預(yù)定網(wǎng)頁(yè)的第二識(shí)別值大于等于預(yù)定網(wǎng)頁(yè)計(jì)算模型的第二閾值。如預(yù)定網(wǎng)頁(yè)確定模塊確定該網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)不是預(yù)定網(wǎng)頁(yè),則直接使用預(yù)定網(wǎng)頁(yè)計(jì)算模型對(duì)網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)的網(wǎng)頁(yè)內(nèi)容進(jìn)行識(shí)別。這樣預(yù)定網(wǎng)頁(yè)計(jì)算模型可根據(jù)網(wǎng)頁(yè)的網(wǎng)頁(yè)標(biāo)題和網(wǎng)頁(yè)內(nèi)容,識(shí)別所有類(lèi)型的預(yù)定網(wǎng)頁(yè)。
[0086]本發(fā)明的網(wǎng)頁(yè)識(shí)別方法和網(wǎng)頁(yè)識(shí)別裝置通過(guò)對(duì)網(wǎng)頁(yè)標(biāo)題中的預(yù)定詞匯進(jìn)行識(shí)別,實(shí)現(xiàn)了對(duì)“作弊”網(wǎng)頁(yè)的識(shí)別,使得現(xiàn)有的預(yù)定網(wǎng)頁(yè)計(jì)算模型可識(shí)別出95%以上的“作弊”網(wǎng)頁(yè)。本發(fā)明的網(wǎng)頁(yè)識(shí)別方法和網(wǎng)頁(yè)識(shí)別裝置可有效識(shí)別出“作弊”網(wǎng)頁(yè),并將這類(lèi)低質(zhì)量網(wǎng)頁(yè)進(jìn)行過(guò)濾,節(jié)省了網(wǎng)頁(yè)存儲(chǔ)資源;解決了現(xiàn)有的網(wǎng)頁(yè)識(shí)別方法及網(wǎng)頁(yè)識(shí)別裝置不能對(duì)上述“作弊”網(wǎng)頁(yè)進(jìn)行過(guò)濾的技術(shù)問(wèn)題。
[0087]本發(fā)明實(shí)施例中的各功能單元可以集成在一個(gè)處理模塊中,也可以是各個(gè)單元單獨(dú)物理存在,也可以?xún)蓚€(gè)或兩個(gè)以上單元集成在一個(gè)模塊中。上述集成的模塊既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的形式實(shí)現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷(xiāo)售或使用時(shí),也可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤(pán)或光盤(pán)等。上述的各裝置或系統(tǒng),可以執(zhí)行相應(yīng)方法實(shí)施例中的方法。
[0088]綜上所述,雖然本發(fā)明已以?xún)?yōu)選實(shí)施例揭露如上,但上述優(yōu)選實(shí)施例并非用以限制本發(fā)明,本領(lǐng)域的普通技術(shù)人員,在不脫離本發(fā)明的精神和范圍內(nèi),均可作各種更動(dòng)與潤(rùn)飾,因此本發(fā)明的保護(hù)范圍以權(quán)利要求界定的范圍為準(zhǔn)。
【主權(quán)項(xiàng)】
1.一種網(wǎng)頁(yè)識(shí)別方法,其特征在于,包括: 根據(jù)預(yù)定詞匯數(shù)據(jù)庫(kù),獲取網(wǎng)頁(yè)標(biāo)題中的預(yù)定詞匯,所述預(yù)定詞匯數(shù)據(jù)庫(kù)包括所述預(yù)定詞匯以及與所述預(yù)定詞匯對(duì)應(yīng)的加權(quán)值; 根據(jù)所述預(yù)定詞匯數(shù)據(jù)庫(kù)中的預(yù)定詞匯的加權(quán)值,生成所述網(wǎng)頁(yè)標(biāo)題的第一識(shí)別值;以及 根據(jù)預(yù)設(shè)的第一閾值和所述網(wǎng)頁(yè)標(biāo)題的第一識(shí)別值,對(duì)所述網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)進(jìn)行預(yù)定網(wǎng)頁(yè)的識(shí)別。2.根據(jù)權(quán)利要求1所述的網(wǎng)頁(yè)識(shí)別方法,其特征在于,所述網(wǎng)頁(yè)識(shí)別方法還包括: 如所述網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)為所述預(yù)定網(wǎng)頁(yè),則根據(jù)預(yù)定網(wǎng)頁(yè)計(jì)算模型的第二閾值,對(duì)所述網(wǎng)頁(yè)標(biāo)題中的預(yù)定詞匯的加權(quán)值進(jìn)行修正,使修正后的所述預(yù)定網(wǎng)頁(yè)的第二識(shí)別值大于等于所述預(yù)定網(wǎng)頁(yè)計(jì)算模型的第二閾值。3.根據(jù)權(quán)利要求2所述的網(wǎng)頁(yè)識(shí)別方法,其特征在于,如所述網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)不是所述預(yù)定網(wǎng)頁(yè),則使用所述預(yù)定網(wǎng)頁(yè)計(jì)算模型對(duì)所述網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)的網(wǎng)頁(yè)內(nèi)容進(jìn)行識(shí)別。4.根據(jù)權(quán)利要求1所述的網(wǎng)頁(yè)識(shí)別方法,其特征在于,所述生成所述網(wǎng)頁(yè)標(biāo)題的第一識(shí)別值的步驟包括: 通過(guò)所述網(wǎng)頁(yè)標(biāo)題中所有預(yù)定詞匯的加權(quán)值之和,生成所述網(wǎng)頁(yè)標(biāo)題的第一識(shí)別值。5.根據(jù)權(quán)利要求1所述的網(wǎng)頁(yè)識(shí)別方法,其特征在于,所述對(duì)所述網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)進(jìn)行預(yù)定網(wǎng)頁(yè)的識(shí)別的步驟包括: 如所述網(wǎng)頁(yè)標(biāo)題的第一識(shí)別值大于等于所述預(yù)設(shè)的第一閾值,則確定所述網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)是預(yù)定網(wǎng)頁(yè);以及 如所述網(wǎng)頁(yè)標(biāo)題的第一識(shí)別值小于所述預(yù)設(shè)的第一閾值,則確定所述網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)不是預(yù)定網(wǎng)頁(yè)。6.一種網(wǎng)頁(yè)識(shí)別裝置,其特征在于,包括: 詞匯獲取模塊,用于根據(jù)預(yù)定詞匯數(shù)據(jù)庫(kù),獲取網(wǎng)頁(yè)標(biāo)題中的預(yù)定詞匯,所述預(yù)定詞匯數(shù)據(jù)庫(kù)包括預(yù)定詞匯以及與所述預(yù)定詞匯對(duì)應(yīng)的加權(quán)值; 識(shí)別值生成模塊,用于根據(jù)所述預(yù)定詞匯數(shù)據(jù)庫(kù)中的預(yù)定詞匯的加權(quán)值,生成所述網(wǎng)頁(yè)標(biāo)題的第一識(shí)別值;以及 預(yù)定網(wǎng)頁(yè)確定模塊,用于根據(jù)預(yù)設(shè)的第一閾值和所述網(wǎng)頁(yè)標(biāo)題的第一識(shí)別值,對(duì)所述網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)進(jìn)行預(yù)定網(wǎng)頁(yè)的識(shí)別。7.根據(jù)權(quán)利要求6所述的網(wǎng)頁(yè)識(shí)別裝置,其特征在于,所述網(wǎng)頁(yè)識(shí)別裝置還包括: 修正模塊,用于如所述網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)為所述預(yù)定網(wǎng)頁(yè),則根據(jù)預(yù)定網(wǎng)頁(yè)計(jì)算模型的第二閾值,對(duì)所述網(wǎng)頁(yè)標(biāo)題中的預(yù)定詞匯的加權(quán)值進(jìn)行修正,使修正后的所述預(yù)定網(wǎng)頁(yè)的第二識(shí)別值大于等于所述預(yù)定網(wǎng)頁(yè)計(jì)算模型的第二閾值。8.根據(jù)權(quán)利要求7所述的網(wǎng)頁(yè)識(shí)別裝置,其特征在于, 所述修正模塊還用于,如所述網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)不是所述預(yù)定網(wǎng)頁(yè),則使用所述預(yù)定網(wǎng)頁(yè)計(jì)算模型對(duì)所述網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)的網(wǎng)頁(yè)內(nèi)容進(jìn)行識(shí)別。9.根據(jù)權(quán)利要求6所述的網(wǎng)頁(yè)識(shí)別裝置,其特征在于,所述識(shí)別值生成模塊通過(guò)所述網(wǎng)頁(yè)標(biāo)題中所有預(yù)定詞匯的加權(quán)值之和,生成所述網(wǎng)頁(yè)標(biāo)題的第一識(shí)別值。10.根據(jù)權(quán)利要求6所述的網(wǎng)頁(yè)識(shí)別裝置,其特征在于, 如所述網(wǎng)頁(yè)標(biāo)題的第一識(shí)別值大于等于所述預(yù)設(shè)的第一閾值,則所述預(yù)定網(wǎng)頁(yè)確定模塊確定所述網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)是預(yù)定網(wǎng)頁(yè);以及 如所述網(wǎng)頁(yè)標(biāo)題的第一識(shí)別值小于所述預(yù)設(shè)的第一閾值,則所述預(yù)定網(wǎng)頁(yè)確定模塊確定所述網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)不是預(yù)定網(wǎng)頁(yè)。
【專(zhuān)利摘要】本發(fā)明提供一種網(wǎng)頁(yè)識(shí)別方法及網(wǎng)頁(yè)識(shí)別裝置,該網(wǎng)頁(yè)識(shí)別方法包括根據(jù)預(yù)定詞匯數(shù)據(jù)庫(kù),獲取網(wǎng)頁(yè)標(biāo)題中的預(yù)定詞匯;根據(jù)預(yù)定詞匯數(shù)據(jù)庫(kù)中的預(yù)定詞匯的加權(quán)值,生成網(wǎng)頁(yè)標(biāo)題的第一識(shí)別值;以及根據(jù)預(yù)設(shè)的第一閾值和網(wǎng)頁(yè)標(biāo)題的第一識(shí)別值,對(duì)網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)進(jìn)行預(yù)定網(wǎng)頁(yè)的識(shí)別。本發(fā)明還提供一種網(wǎng)頁(yè)識(shí)別裝置。本發(fā)明的網(wǎng)頁(yè)識(shí)別方法及網(wǎng)頁(yè)識(shí)別裝置通過(guò)對(duì)網(wǎng)頁(yè)標(biāo)題中的預(yù)定詞匯進(jìn)行識(shí)別,實(shí)現(xiàn)了對(duì)“作弊”網(wǎng)頁(yè)的識(shí)別。
【IPC分類(lèi)】G06F17/30
【公開(kāi)號(hào)】CN104933055
【申請(qǐng)?zhí)枴緾N201410100694
【發(fā)明人】蔡兵
【申請(qǐng)人】騰訊科技(深圳)有限公司
【公開(kāi)日】2015年9月23日
【申請(qǐng)日】2014年3月18日
當(dāng)前第4頁(yè)1 2 3 4 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
泾源县| 出国| 乌什县| 左贡县| 高邑县| 清远市| 玉田县| 鱼台县| 陵水| 滁州市| 石渠县| 沙湾县| 宿州市| 陕西省| 六盘水市| 栾川县| 枣强县| 九江县| 东山县| 龙口市| 岳普湖县| 临清市| 马关县| 奉贤区| 咸丰县| 武鸣县| 水富县| 都兰县| 天水市| 寿光市| 盈江县| 社旗县| 贵南县| 山东省| 哈尔滨市| 陇西县| 华坪县| 金阳县| 阿瓦提县| 中宁县| 淮北市|