欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

網(wǎng)頁(yè)識(shí)別方法及網(wǎng)頁(yè)識(shí)別裝置的制造方法

文檔序號(hào):9217196閱讀:441來(lái)源:國(guó)知局
網(wǎng)頁(yè)識(shí)別方法及網(wǎng)頁(yè)識(shí)別裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)領(lǐng)域,特別是涉及一種網(wǎng)頁(yè)識(shí)別方法及網(wǎng)頁(yè)識(shí)別裝置。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)的爆炸式增長(zhǎng),各種小型網(wǎng)站層出不窮。這其中也包括大量具有“作弊網(wǎng)頁(yè)”的垃圾網(wǎng)站,這些“作弊網(wǎng)頁(yè)”沒(méi)有實(shí)際的內(nèi)容,僅僅通過(guò)吸引用戶眼球的標(biāo)題(如色情標(biāo)題等不良內(nèi)容標(biāo)題),騙取用戶的點(diǎn)擊流量,以達(dá)到商業(yè)目的。
[0003]目前已有的預(yù)定網(wǎng)頁(yè)(不良網(wǎng)頁(yè))計(jì)算模型可有效的識(shí)別出具有不良內(nèi)容(如色情內(nèi)容或欺騙內(nèi)容等)的垃圾網(wǎng)站,其通過(guò)統(tǒng)計(jì)機(jī)器學(xué)習(xí)的文本分類算法,利用頁(yè)面主題內(nèi)容來(lái)估計(jì)網(wǎng)頁(yè)中的不良內(nèi)容。
[0004]然而,部分垃圾網(wǎng)站的“作弊網(wǎng)頁(yè)”僅僅通過(guò)具有不良內(nèi)容的標(biāo)題來(lái)騙取用戶點(diǎn)擊,網(wǎng)頁(yè)中并無(wú)實(shí)際的不良內(nèi)容,因?yàn)闃?biāo)題的長(zhǎng)度遠(yuǎn)遠(yuǎn)小于網(wǎng)頁(yè)內(nèi)容的實(shí)際長(zhǎng)度,現(xiàn)有的預(yù)定網(wǎng)頁(yè)計(jì)算模型無(wú)法對(duì)該“作弊網(wǎng)頁(yè)”進(jìn)行識(shí)別,從而無(wú)法對(duì)該垃圾網(wǎng)站的“作弊網(wǎng)頁(yè)”進(jìn)行過(guò)濾。

【發(fā)明內(nèi)容】

[0005]本發(fā)明實(shí)施例提供一種可對(duì)僅僅吸引用戶眼球而沒(méi)有實(shí)際內(nèi)容的“作弊”網(wǎng)頁(yè)進(jìn)行識(shí)別的網(wǎng)頁(yè)識(shí)別方法;以解決現(xiàn)有的網(wǎng)頁(yè)識(shí)別方法不能對(duì)上述“作弊”網(wǎng)頁(yè)進(jìn)行過(guò)濾的技術(shù)問(wèn)題。
[0006]本發(fā)明實(shí)施例提供一種可對(duì)僅僅吸引用戶眼球而沒(méi)有實(shí)際內(nèi)容的“作弊”網(wǎng)頁(yè)進(jìn)行識(shí)別的網(wǎng)頁(yè)識(shí)別裝置;以解決現(xiàn)有的網(wǎng)頁(yè)識(shí)別裝置不能對(duì)上述“作弊”網(wǎng)頁(yè)進(jìn)行過(guò)濾的技術(shù)問(wèn)題。
[0007]為解決上述問(wèn)題,本發(fā)明提供的技術(shù)方案如下:
[0008]本發(fā)明實(shí)施例提供一種網(wǎng)頁(yè)識(shí)別方法,其包括:
[0009]根據(jù)預(yù)定詞匯數(shù)據(jù)庫(kù),獲取網(wǎng)頁(yè)標(biāo)題中的預(yù)定詞匯,所述預(yù)定詞匯數(shù)據(jù)庫(kù)包括所述預(yù)定詞匯以及與所述預(yù)定詞匯對(duì)應(yīng)的加權(quán)值;
[0010]根據(jù)所述預(yù)定詞匯數(shù)據(jù)庫(kù)中的預(yù)定詞匯的加權(quán)值,生成所述網(wǎng)頁(yè)標(biāo)題的第一識(shí)別值;以及
[0011]根據(jù)預(yù)設(shè)的第一閾值和所述網(wǎng)頁(yè)標(biāo)題的第一識(shí)別值,對(duì)所述網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)進(jìn)行預(yù)定網(wǎng)頁(yè)的識(shí)別。
[0012]本發(fā)明實(shí)施例還提供一種網(wǎng)頁(yè)識(shí)別裝置,其包括:
[0013]詞匯獲取模塊,用于根據(jù)預(yù)定詞匯數(shù)據(jù)庫(kù),獲取網(wǎng)頁(yè)標(biāo)題中的預(yù)定詞匯,所述預(yù)定詞匯數(shù)據(jù)庫(kù)包括預(yù)定詞匯以及與所述預(yù)定詞匯對(duì)應(yīng)的加權(quán)值;
[0014]識(shí)別值生成模塊,用于根據(jù)所述預(yù)定詞匯數(shù)據(jù)庫(kù)中的預(yù)定詞匯的加權(quán)值,生成所述網(wǎng)頁(yè)標(biāo)題的第一識(shí)別值;以及
[0015]預(yù)定網(wǎng)頁(yè)確定模塊,用于根據(jù)預(yù)設(shè)的第一閾值和所述網(wǎng)頁(yè)標(biāo)題的第一識(shí)別值,對(duì)所述網(wǎng)頁(yè)標(biāo)題的所屬網(wǎng)頁(yè)進(jìn)行預(yù)定網(wǎng)頁(yè)的識(shí)別。
[0016]相較于現(xiàn)有技術(shù)的網(wǎng)頁(yè)識(shí)別方法及網(wǎng)頁(yè)識(shí)別裝置,本發(fā)明的網(wǎng)頁(yè)識(shí)別方法和網(wǎng)頁(yè)識(shí)別裝置通過(guò)對(duì)網(wǎng)頁(yè)標(biāo)題中的預(yù)定詞匯進(jìn)行識(shí)別,實(shí)現(xiàn)了對(duì)“作弊”網(wǎng)頁(yè)的識(shí)別,解決了現(xiàn)有的網(wǎng)頁(yè)識(shí)別方法及網(wǎng)頁(yè)識(shí)別裝置不能對(duì)上述“作弊”網(wǎng)頁(yè)進(jìn)行過(guò)濾的技術(shù)問(wèn)題。
【附圖說(shuō)明】
[0017]圖1為本發(fā)明的網(wǎng)頁(yè)識(shí)別方法及網(wǎng)頁(yè)識(shí)別裝置所在的電子設(shè)備的工作環(huán)境結(jié)構(gòu)示意圖;
[0018]圖2為本發(fā)明的網(wǎng)頁(yè)識(shí)別裝置的第一優(yōu)選實(shí)施例的結(jié)構(gòu)示意圖;
[0019]圖3為本發(fā)明的網(wǎng)頁(yè)識(shí)別方法的第一優(yōu)選實(shí)施例的流程圖;
[0020]圖4為本發(fā)明的網(wǎng)頁(yè)識(shí)別裝置的第二優(yōu)選實(shí)施例的結(jié)構(gòu)示意圖;
[0021]圖5為本發(fā)明的網(wǎng)頁(yè)識(shí)別方法的第二優(yōu)選實(shí)施例的流程圖。
【具體實(shí)施方式】
[0022]請(qǐng)參照?qǐng)D式,其中相同的組件符號(hào)代表相同的組件,本發(fā)明的原理是以實(shí)施在一適當(dāng)?shù)倪\(yùn)算環(huán)境中來(lái)舉例說(shuō)明。以下的說(shuō)明是基于所例示的本發(fā)明具體實(shí)施例,其不應(yīng)被視為限制本發(fā)明未在此詳述的其它具體實(shí)施例。
[0023]在以下的說(shuō)明中,本發(fā)明的具體實(shí)施例將參考由一部或多部計(jì)算機(jī)所執(zhí)行之作業(yè)的步驟及符號(hào)來(lái)說(shuō)明,除非另有述明。因此,其將可了解到這些步驟及操作,其中有數(shù)次提到為由計(jì)算機(jī)執(zhí)行,包括了由代表了以一結(jié)構(gòu)化型式中的數(shù)據(jù)之電子信號(hào)的計(jì)算機(jī)處理單元所操縱。此操縱轉(zhuǎn)換該數(shù)據(jù)或?qū)⑵渚S持在該計(jì)算機(jī)之內(nèi)存系統(tǒng)中的位置處,其可重新配置或另外以本領(lǐng)域技術(shù)人員所熟知的方式來(lái)改變?cè)撚?jì)算機(jī)之運(yùn)作。該數(shù)據(jù)所維持的數(shù)據(jù)結(jié)構(gòu)為該內(nèi)存之實(shí)體位置,其具有由該數(shù)據(jù)格式所定義的特定特性。但是,本發(fā)明原理以上述文字來(lái)說(shuō)明,其并不代表為一種限制,本領(lǐng)域技術(shù)人員將可了解到以下所述的多種步驟及操作亦可實(shí)施在硬件當(dāng)中。
[0024]如本申請(qǐng)所使用的術(shù)語(yǔ)“組件”、“模塊”、“系統(tǒng)”、“接口 ”、“進(jìn)程”等等一般地旨在指計(jì)算機(jī)相關(guān)實(shí)體:硬件、硬件和軟件的組合、軟件或執(zhí)行中的軟件。例如,組件可以是但不限于是運(yùn)行在處理器上的進(jìn)程、處理器、對(duì)象、可執(zhí)行應(yīng)用、執(zhí)行的線程、程序和/或計(jì)算機(jī)。通過(guò)圖示,運(yùn)行在控制器上的應(yīng)用和該控制器二者都可以是組件。一個(gè)或多個(gè)組件可以有在于執(zhí)行的進(jìn)程和/或線程內(nèi),并且組件可以位于一個(gè)計(jì)算機(jī)上和/或分布在兩個(gè)或更多計(jì)算機(jī)之間。
[0025]而且,要求保護(hù)的主題可以被實(shí)現(xiàn)為使用標(biāo)準(zhǔn)編程和/或工程技術(shù)產(chǎn)生軟件、固件、硬件或其任意組合以控制計(jì)算機(jī)實(shí)現(xiàn)所公開(kāi)的主題的方法、裝置或制造品。本文所使用的術(shù)語(yǔ)“制造品”旨在包含可從任意計(jì)算機(jī)可讀設(shè)備、載體或介質(zhì)訪問(wèn)的計(jì)算機(jī)程序。當(dāng)然,本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到可以對(duì)該配置進(jìn)行許多修改,而不脫離要求保護(hù)的主題的范圍或精神。
[0026]圖1和隨后的討論提供了對(duì)實(shí)現(xiàn)本發(fā)明所述的網(wǎng)頁(yè)識(shí)別裝置所在的電子設(shè)備的工作環(huán)境的簡(jiǎn)短、概括的描述。圖1的工作環(huán)境僅僅是適當(dāng)?shù)墓ぷ鳝h(huán)境的一個(gè)實(shí)例并且不旨在建議關(guān)于工作環(huán)境的用途或功能的范圍的任何限制。實(shí)例電子設(shè)備112包括但不限于個(gè)人計(jì)算機(jī)、服務(wù)器計(jì)算機(jī)、手持式或膝上型設(shè)備、移動(dòng)設(shè)備(比如移動(dòng)電話、個(gè)人數(shù)字助理(PDA)、媒體播放器等等)、多處理器系統(tǒng)、消費(fèi)型電子設(shè)備、小型計(jì)算機(jī)、大型計(jì)算機(jī)、包括上述任意系統(tǒng)或設(shè)備的分布式計(jì)算環(huán)境,等等。
[0027]盡管沒(méi)有要求,但是在“計(jì)算機(jī)可讀指令”被一個(gè)或多個(gè)電子設(shè)備執(zhí)行的通用背景下描述實(shí)施例。計(jì)算機(jī)可讀指令可以經(jīng)由計(jì)算機(jī)可讀介質(zhì)來(lái)分布(下文討論)。計(jì)算機(jī)可讀指令可以實(shí)現(xiàn)為程序模塊,比如執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的功能、對(duì)象、應(yīng)用編程接口(API)、數(shù)據(jù)結(jié)構(gòu)等等。典型地,該計(jì)算機(jī)可讀指令的功能可以在各種環(huán)境中隨意組合或分布。
[0028]圖1圖示了包括本發(fā)明的網(wǎng)頁(yè)識(shí)別裝置的一個(gè)或多個(gè)實(shí)施例的電子設(shè)備112的實(shí)例。在一種配置中,電子設(shè)備112包括至少一個(gè)處理單元116和存儲(chǔ)器118。根據(jù)電子設(shè)備的確切配置和類型,存儲(chǔ)器118可以是易失性的(比如RAM)、非易失性的(比如ROM、閃存等)或二者的某種組合。該配置在圖1中由虛線114圖示。
[0029]在其他實(shí)施例中,電子設(shè)備112可以包括附加特征和/或功能。例如,設(shè)備112還可以包括附加的存儲(chǔ)裝置(例如可移除和/或不可移除的),其包括但不限于磁存儲(chǔ)裝置、光存儲(chǔ)裝置等等。這種附加存儲(chǔ)裝置在圖1中由存儲(chǔ)裝置120圖示。在一個(gè)實(shí)施例中,用于實(shí)現(xiàn)本文所提供的一個(gè)或多個(gè)實(shí)施例的計(jì)算機(jī)可讀指令可以在存儲(chǔ)裝置120中。存儲(chǔ)裝置120還可以存儲(chǔ)用于實(shí)現(xiàn)操作系統(tǒng)、應(yīng)用程序等的其他計(jì)算機(jī)可讀指令。計(jì)算機(jī)可讀指令可以載入存儲(chǔ)器118中由例如處理單元116執(zhí)行。
[0030]本文所使用的術(shù)語(yǔ)“計(jì)算機(jī)可讀介質(zhì)”包括計(jì)算機(jī)存儲(chǔ)介質(zhì)。計(jì)算機(jī)存儲(chǔ)介質(zhì)包括以用于存儲(chǔ)諸如計(jì)算機(jī)可讀指令或其他數(shù)據(jù)之類的信息的任何方法或技術(shù)實(shí)現(xiàn)的易失性和非易失性、可移除和不可移除介質(zhì)。存儲(chǔ)器118和存儲(chǔ)裝置120是計(jì)算機(jī)存儲(chǔ)介質(zhì)的實(shí)例。計(jì)算機(jī)存儲(chǔ)介質(zhì)包括但不限于RAM、ROM、EEPR0M、閃存或其他存儲(chǔ)器技術(shù)、CD-ROM、數(shù)字通用盤(DVD)或其他光存儲(chǔ)裝置、盒式磁帶、磁帶、磁盤存儲(chǔ)裝置或其他磁存儲(chǔ)設(shè)備、或可以用于存儲(chǔ)期望信息并可以被電子設(shè)備112訪問(wèn)的任何其他介質(zhì)。任意這樣的計(jì)算機(jī)存儲(chǔ)介質(zhì)可以是電子設(shè)備112的一部分。
[0031 ] 電子設(shè)備112還可以包括允許電子設(shè)備112與其他設(shè)備通信的通信連接126。通信連接126可以包括但不限于調(diào)制解調(diào)器、網(wǎng)絡(luò)接口卡(NIC)、集成網(wǎng)絡(luò)接口、射頻發(fā)射器/接收器、紅外端口、USB連接或用于將電子設(shè)備112連接到其他電子設(shè)備的其他接口。通信連接126可以包括有線連接或無(wú)線連接。通信連接126可以發(fā)射和/或接收通信媒體。
[0032]術(shù)語(yǔ)“計(jì)算機(jī)可讀介質(zhì)”可以包括通信介質(zhì)。通信介質(zhì)典型地包含計(jì)算機(jī)可讀指令或諸如載波或其他傳輸機(jī)構(gòu)之類的“己調(diào)制數(shù)據(jù)信號(hào)”中的其他數(shù)據(jù),并且包括任何信息遞送介質(zhì)。術(shù)語(yǔ)“己調(diào)制數(shù)據(jù)信號(hào)”可以包括這樣的信號(hào):該信號(hào)特性中的一個(gè)或多個(gè)按
當(dāng)前第1頁(yè)1 2 3 4 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
石景山区| 麟游县| 洞头县| 玛多县| 建平县| 清河县| 钟祥市| 建湖县| 册亨县| 岫岩| 公主岭市| 龙岩市| 长白| 蓬溪县| 满洲里市| 山丹县| 乌审旗| 阜南县| 天峻县| 新泰市| 晋城| 洪泽县| 玛曲县| 肇东市| 滨海县| 霍州市| 健康| 泗水县| 英吉沙县| 商洛市| 龙山县| 上饶县| 山东| 蒙阴县| 东至县| 桐城市| 平潭县| 麻栗坡县| 鄂伦春自治旗| 甘泉县| 乌鲁木齐县|