本發(fā)明涉及語義網(wǎng)絡(luò)技術(shù)領(lǐng)域,具體涉及一種基于領(lǐng)域離散度算法實(shí)現(xiàn)搜索引擎關(guān)鍵詞優(yōu)化。
背景技術(shù):
搜索引擎已成為廣大網(wǎng)民獲取信息的一個重要工具。搜索引擎優(yōu)化(Search Engine Optimization,簡稱SEO)是指采用相關(guān)技術(shù)對網(wǎng)站進(jìn)行一系列優(yōu)化,從而提高相應(yīng)關(guān)鍵詞在搜索引擎上的排名,最終達(dá)到網(wǎng)站營銷的目的。SEO歸根結(jié)底是關(guān)鍵詞的優(yōu)化。關(guān)鍵詞優(yōu)化策略一般包括關(guān)鍵詞的選擇、關(guān)鍵詞的分布及密度控制等等,關(guān)鍵詞是用戶在搜索相關(guān)頁面時使用的單詞或短語,也是搜索引擎在建立索引表要使用的單詞。利用關(guān)鍵詞有助于獲得較高的搜索引擎查詢排名,要注意關(guān)鍵詞研究旨在找出最有價值的關(guān)鍵詞。這些是搜索引擎優(yōu)化的基本概念,有助于提高搜索引擎排名。在研究網(wǎng)絡(luò)搜索關(guān)鍵詞搜索量數(shù)據(jù)與相關(guān)問題的關(guān)系時,選擇哪些關(guān)鍵詞是首先要解決的關(guān)鍵問題,閱讀文獻(xiàn),筆者發(fā)現(xiàn),對于關(guān)鍵詞的選取大多憑借經(jīng)驗(yàn)和主觀因素,也沒有一個完善的機(jī)制來管理關(guān)鍵詞優(yōu)化策略和進(jìn)度。為使關(guān)鍵詞的選取更具科學(xué)性和客觀性,基于上述需求,本發(fā)明提供了基于領(lǐng)域離散度算法實(shí)現(xiàn)搜索引擎關(guān)鍵詞優(yōu)。
技術(shù)實(shí)現(xiàn)要素:
針對于關(guān)鍵詞優(yōu)化實(shí)現(xiàn)搜索引擎優(yōu)化的技術(shù)問題,本發(fā)明提供了一種基于領(lǐng)域離散度算法實(shí)現(xiàn)搜索引擎關(guān)鍵詞優(yōu)化。
為了解決上述問題,本發(fā)明是通過以下技術(shù)方案實(shí)現(xiàn)的:
步驟1:根據(jù)企業(yè)業(yè)務(wù)確定核心關(guān)鍵詞,利用搜索引擎搜集相關(guān)關(guān)鍵字,這些關(guān)鍵字在搜索引擎中有相應(yīng)數(shù)據(jù)項,如本國每月搜索量、競爭程度和估算每次點(diǎn)擊費(fèi)用(CPC)等
步驟2:結(jié)合企業(yè)產(chǎn)品和市場分析,篩選降維上述搜索到的相關(guān)關(guān)鍵字集合;
步驟3:針對篩選降維后的關(guān)鍵詞集合,通過搜索引擎搜索關(guān)鍵詞對應(yīng)的頁面,這里記錄首頁網(wǎng)頁數(shù)和總搜索頁面數(shù),即每個關(guān)鍵詞由五維向量再降維為四維的。
步驟4:利用基于領(lǐng)域離散度算法,對上述關(guān)鍵詞進(jìn)行聚類處理,其具體子步驟如下:
步驟4.1:利用基于ε領(lǐng)域的k-means算法初始化簇。
步驟4.2:初始化每一個領(lǐng)域離散度函數(shù)L(S2)start,從數(shù)據(jù)對象集合D中按下述判定條件選擇k個初始簇中心。
步驟4.3:對每類關(guān)鍵詞i(i∈(1,2,…,m))進(jìn)行重新分配,按概率函數(shù)p(i)選擇聚類中心j;
步驟4.4:根據(jù)判定函數(shù)Δ(S2)的結(jié)果,重新計算各簇中心;
步驟4.5:如果簇中心發(fā)生變化,則轉(zhuǎn)到步驟(2),否則迭代結(jié)束,輸出聚類結(jié)果。
步驟5:根據(jù)企業(yè)具體情況,綜合關(guān)鍵詞效能優(yōu)化和價值率優(yōu)化,選擇合適的關(guān)鍵詞優(yōu)化策略達(dá)到網(wǎng)站優(yōu)化目標(biāo)。
本發(fā)明有益效果是:
1,此算法可以精簡關(guān)鍵詞分析流程,進(jìn)而減少整個網(wǎng)站優(yōu)化工作量。
2,此算法的運(yùn)行時間復(fù)雜度低,處理速度更快。
3、此算法具有更大的利用價值。
4、能幫助網(wǎng)站在短時間內(nèi)快速提升其關(guān)鍵詞的排名。
5、為企業(yè)網(wǎng)站帶來一定的流量和詢盤,從而達(dá)到理想的網(wǎng)站優(yōu)化目標(biāo)。
6、此算法分類結(jié)果的準(zhǔn)確度更符合經(jīng)驗(yàn)值;
7、此算法更簡便有效。
附圖說明
圖1基于領(lǐng)域離散度算法實(shí)現(xiàn)搜索引擎關(guān)鍵詞優(yōu)化結(jié)構(gòu)流程圖
圖2基于領(lǐng)域離散度算法在聚類分析中的應(yīng)用流程圖
具體實(shí)施方式
為了解決關(guān)鍵詞優(yōu)化實(shí)現(xiàn)搜索引擎優(yōu)化的技術(shù)問題,結(jié)合圖1-圖2對本發(fā)明進(jìn)行了詳細(xì)說明,其具體實(shí)施步驟如下:
步驟1:根據(jù)企業(yè)業(yè)務(wù)確定核心關(guān)鍵詞,利用搜索引擎搜集相關(guān)關(guān)鍵字,這些關(guān)鍵字在搜索引擎中有相應(yīng)數(shù)據(jù)項,如本國每月搜索量、競爭程度和估算每次點(diǎn)擊費(fèi)用(CPC)等。
步驟2:結(jié)合企業(yè)產(chǎn)品和市場分析,篩選降維上述搜索到的相關(guān)關(guān)鍵字集合;
步驟3:針對篩選降維后的關(guān)鍵詞集合,通過搜索引擎搜索關(guān)鍵詞對應(yīng)的頁面,這里記錄首頁網(wǎng)頁數(shù)和總搜索頁面數(shù),即每個關(guān)鍵詞由五維向量再降維為四維的,其具體計算過程如下:
這里相關(guān)關(guān)鍵詞個數(shù)為m,既有下列m×5矩陣:
Ni、Ldi、CPCi、Nis、NiY依次為第i個關(guān)鍵詞對應(yīng)的本國每月搜索量、競爭程度、估算每次點(diǎn)擊費(fèi)用(CPC)、首頁網(wǎng)頁數(shù)、總搜索頁面數(shù)。
再降維為四維,即
Xi∈(1,2,…,m)為搜索效能,Zi∈(1,2,…,m)為價值率,即為下式:
步驟4:利用基于領(lǐng)域離散度算法,對上述關(guān)鍵詞進(jìn)行聚類處理,其具體子步驟如下:
步驟4.1:利用基于ε領(lǐng)域的k-means算法初始化簇。
步驟4.2:初始化每一個領(lǐng)域離散度函數(shù)L(S2)start,從數(shù)據(jù)對象集合D中按下述判定條件選擇k個初始簇中心,其具體計算過程如下:
上式Nε為ε領(lǐng)域內(nèi)數(shù)據(jù)對象的個數(shù),xih為ε領(lǐng)域內(nèi)數(shù)據(jù)對象所對應(yīng)的向量,yih為ε領(lǐng)域內(nèi)對應(yīng)的簇中心數(shù)據(jù)對象向量。
利用判定條件,如下:
L(S2)start>ω
ω為設(shè)定好的閾值,只有滿足這個閾值,初始化的k個簇準(zhǔn)確度更高。
步驟4.3:對每類關(guān)鍵詞i(i∈(1,2,…,m))進(jìn)行重新分配,按概率函數(shù)p(i)選擇聚類中心j,其具體計算過程如下:
yjh為第j類簇中心數(shù)據(jù)對象向量,α為平滑系數(shù),使概率函數(shù)p(i)值越大,就選擇對應(yīng)的簇中心j,即有下式:
令則
步驟4.4:根據(jù)判定函數(shù)Δ(S2)的結(jié)果,重新計算各簇中心,其具體計算過程如下:
判定函數(shù)Δ(S2):
Δ(S2)=L(S2)new-L(S2)old>0
上式L(S2)new為新的領(lǐng)域離散度函數(shù),L(S2)old為上一次迭代得出的領(lǐng)域離散度函數(shù)。只有滿足上式判定條件,即簇中心發(fā)生變化。
步驟4.5:如果簇中心發(fā)生變化,則轉(zhuǎn)到步驟(2),否則迭代結(jié)束,輸出聚類結(jié)果。
基于領(lǐng)域離散度算法的具體結(jié)構(gòu)流程如圖2。
步驟5:根據(jù)企業(yè)具體情況,綜合關(guān)鍵詞效能優(yōu)化和價值率優(yōu)化,選擇合適的關(guān)鍵詞優(yōu)化策略達(dá)到網(wǎng)站優(yōu)化目標(biāo)。
基于領(lǐng)域離散度算法實(shí)現(xiàn)搜索引擎關(guān)鍵詞優(yōu)化,其偽代碼過程
輸入:網(wǎng)站提取的核心關(guān)鍵詞,基于ε領(lǐng)域初始化簇,初始化領(lǐng)域離散度函數(shù)L(S2)start
輸出:一系列優(yōu)化后的高質(zhì)量關(guān)鍵詞。