欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于使用鏈接和頁(yè)面的布局分析來(lái)識(shí)別圖像相關(guān)度的方法和系統(tǒng)的制作方法

文檔序號(hào):6624993閱讀:179來(lái)源:國(guó)知局
專利名稱:用于使用鏈接和頁(yè)面的布局分析來(lái)識(shí)別圖像相關(guān)度的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域
所描述的技術(shù)總體上涉及分析網(wǎng)頁(yè),具體的說(shuō),涉及網(wǎng)頁(yè)圖像的相關(guān)度。
背景技術(shù)
諸如Google和Overture的許多搜索引擎服務(wù)提供搜索經(jīng)由因特網(wǎng)可訪問(wèn)的信息。這些搜索引擎服務(wù)允許用戶搜索用戶可能感興趣的顯示頁(yè)面,例如網(wǎng)頁(yè)。在用戶提交包括搜索項(xiàng)的搜索請(qǐng)求之后,搜索引擎服務(wù)識(shí)別可能與那些搜索項(xiàng)相關(guān)的網(wǎng)頁(yè)。為了快速識(shí)別相關(guān)網(wǎng)頁(yè),搜索引擎服務(wù)會(huì)保持關(guān)鍵字到網(wǎng)頁(yè)的映射。通過(guò)“爬行和索引”該網(wǎng)絡(luò)(即,萬(wàn)維網(wǎng))可以產(chǎn)生該映射,以識(shí)別每個(gè)網(wǎng)頁(yè)的關(guān)鍵字。為了爬行網(wǎng)絡(luò),搜索引擎服務(wù)會(huì)使用根網(wǎng)頁(yè)列表以識(shí)別可通過(guò)那些根網(wǎng)頁(yè)訪問(wèn)的所有網(wǎng)頁(yè)??梢允褂酶鞣N已知的信息檢索技術(shù)識(shí)別所有特定網(wǎng)頁(yè)的關(guān)鍵字,諸如識(shí)別標(biāo)題字、網(wǎng)頁(yè)元數(shù)據(jù)中提供的字、高亮的字、等等。然后,搜索引擎服務(wù)根據(jù)每個(gè)匹配的緊密度,網(wǎng)頁(yè)的普及性(例如,Google的頁(yè)面排列)等排列搜索結(jié)果的網(wǎng)頁(yè)。搜索引擎服務(wù)也會(huì)產(chǎn)生相關(guān)分?jǐn)?shù)以表明網(wǎng)頁(yè)信息與搜索請(qǐng)求的相關(guān)程度。然后,搜索引擎服務(wù)以基于其排列的順序向用戶顯示指向那些網(wǎng)頁(yè)的鏈接。
雖然許多網(wǎng)頁(yè)是面向圖像的,因?yàn)樗鼈儠?huì)包含許多圖像,但是常規(guī)搜索引擎服務(wù)一般只根據(jù)網(wǎng)頁(yè)的文本內(nèi)容搜索。然而,已進(jìn)行許多嘗試以支持基于圖像的網(wǎng)頁(yè)搜索。例如,正瀏覽網(wǎng)頁(yè)的用戶可能希望識(shí)別包含與該網(wǎng)頁(yè)上圖像相關(guān)圖像的其它網(wǎng)頁(yè)。基于圖像的搜索技術(shù)一般是基于內(nèi)容或基于鏈接的,并另外使用圍繞文本以幫助分析圖像?;趦?nèi)容的技術(shù)使用低層視覺(jué)信息以便圖像索引。因?yàn)榛趦?nèi)容的搜索技術(shù)是非常昂貴的,所以它們不適用于網(wǎng)絡(luò)上的圖像搜索?;阪溄拥乃阉骷夹g(shù)一般假設(shè)在相同網(wǎng)頁(yè)的圖像可能是相關(guān)的,并且在網(wǎng)頁(yè)上的、由相同網(wǎng)頁(yè)彼此鏈接的圖像是相關(guān)的。不幸的是,這些假設(shè)在許多情況下是不正確的,主要因?yàn)閱蝹€(gè)網(wǎng)頁(yè)會(huì)包含涉及許多不同主題的內(nèi)容。例如,新聞網(wǎng)站的網(wǎng)頁(yè)會(huì)包含涉及國(guó)際政治事件的內(nèi)容以及涉及國(guó)家體育事件的內(nèi)容。在這種情況下,涉及國(guó)家體育事件的體育團(tuán)體的圖片不可能與由涉及國(guó)際政治事件的內(nèi)容鏈接的網(wǎng)頁(yè)相關(guān)。
因此,我們希望有一種不象常規(guī)的基于內(nèi)容的搜索技術(shù)那樣昂貴的基于圖像的搜索技術(shù),不同于常規(guī)的基于鏈接的搜索技術(shù),它能解釋在單個(gè)網(wǎng)頁(yè)上出現(xiàn)的不同主題。
概述提供一種系統(tǒng),用于根據(jù)鏈接和網(wǎng)頁(yè)布局分析確定頁(yè)面圖像的相關(guān)度。鏈接分析系統(tǒng)通過(guò)首先識(shí)別頁(yè)面內(nèi)的塊,并然后分析塊對(duì)頁(yè)面、頁(yè)面對(duì)塊、和圖像對(duì)塊的重要性,來(lái)確定圖像之間的相關(guān)度。根據(jù)該分析,鏈接分析系統(tǒng)確定每幅圖像與所有其他圖像的相關(guān)程度。因?yàn)橐环鶊D像與另一幅圖像的相關(guān)度是基于塊級(jí)重要性,而不是頁(yè)面級(jí)重要性,塊是比頁(yè)面更小的單元,該相關(guān)度是比常規(guī)基于鏈接的搜索技術(shù)更正確的相關(guān)度表示。
附圖的簡(jiǎn)要說(shuō)明附

圖1是表示網(wǎng)頁(yè)的樣本集合中塊、圖像、和鏈接的框圖。
附圖2是表示在一個(gè)實(shí)施例中,鏈接分析系統(tǒng)的組件的框圖。
附圖3是表示在一個(gè)實(shí)施例中,產(chǎn)生圖像對(duì)圖像矩陣組件的處理流程圖。
附圖4是表示在一個(gè)實(shí)施例中,產(chǎn)生塊對(duì)頁(yè)面矩陣組件的處理流程圖。
附圖5是表示在一個(gè)實(shí)施例中,產(chǎn)生頁(yè)面對(duì)塊的矩陣組件的處理流程圖。
附圖6是表示在一個(gè)實(shí)施例中,產(chǎn)生塊對(duì)圖像的矩陣組件的處理流程圖。
詳細(xì)描述提供一種用于根據(jù)鏈接和頁(yè)面布局分析確定網(wǎng)頁(yè)圖像的相關(guān)度的系統(tǒng)和方法。在一個(gè)實(shí)施例中,鏈接分析系統(tǒng)通過(guò)首先識(shí)別網(wǎng)頁(yè)內(nèi)的塊,并然后分析塊對(duì)網(wǎng)頁(yè)、網(wǎng)頁(yè)到塊、和圖像對(duì)塊的重要性來(lái)確定圖像之間的相關(guān)度。根據(jù)該分析,鏈接分析系統(tǒng)確定每幅圖像對(duì)其他每幅圖像的相關(guān)程度。網(wǎng)頁(yè)的塊表示看起來(lái)涉及相似主題的網(wǎng)頁(yè)區(qū)域。例如,涉及國(guó)際政治事件的新聞文章會(huì)表示一個(gè)塊,以及涉及國(guó)家體育事件的新聞文章會(huì)表示另一個(gè)塊。塊對(duì)頁(yè)面的重要性會(huì)表明用戶在瀏覽網(wǎng)頁(yè)時(shí)注意該塊的概率。頁(yè)面對(duì)塊的重要性會(huì)表明用戶從塊選擇指向該頁(yè)面的鏈接的概率。圖像對(duì)塊的重要性會(huì)表明用戶在瀏覽塊時(shí)注意該圖像的概率。在計(jì)算這些成對(duì)的頁(yè)面和塊以及成對(duì)的圖像和塊的重要性的數(shù)字指標(biāo)之后,鏈接分析系統(tǒng)通過(guò)結(jié)合計(jì)算的塊對(duì)頁(yè)面的重要性、計(jì)算的頁(yè)面對(duì)塊的重要性、以及計(jì)算的圖像對(duì)塊的重要性來(lái)產(chǎn)生每幅圖像與每幅其他圖像的相關(guān)度的指標(biāo)。因?yàn)橐环鶊D像與另一幅圖像的相關(guān)度是基于塊級(jí)別的重要性而不是頁(yè)面級(jí)別的重要性,因而該相關(guān)度是比常規(guī)的基于鏈接的搜索引擎更準(zhǔn)確的相關(guān)度表示。
鏈接分析系統(tǒng)也會(huì)使用圖像的相關(guān)度以產(chǎn)生圖像的排列。排列可以是基于開(kāi)始瀏覽任意圖像的用戶在圖像之間任意次地轉(zhuǎn)變之后將轉(zhuǎn)變到另一幅圖像的概率。鏈接分析系統(tǒng)也會(huì)根據(jù)圖像的相關(guān)度產(chǎn)生圖像的矢量表示,并將群群集算法應(yīng)用于矢量表示以識(shí)別相關(guān)圖像群。
附圖1表示在網(wǎng)頁(yè)的樣本集合中塊、圖像和鏈接的框圖。該網(wǎng)頁(yè)集合包括網(wǎng)頁(yè)1-4。網(wǎng)頁(yè)中的塊用矩形表示,塊內(nèi)的圖像用圓表示,以及塊內(nèi)的鏈接用從塊指向鏈接到的網(wǎng)頁(yè)的箭頭來(lái)表示。網(wǎng)頁(yè)1包含塊1,塊1包含圖像1和2以及鏈接1和2。網(wǎng)頁(yè)2包含塊2和塊3,塊2包含圖像3和鏈接3,塊3包含圖像4和鏈接4。網(wǎng)頁(yè)3包含塊4和塊5,塊4包含圖像5以及鏈接5和6,塊5包含圖像6和鏈接7。網(wǎng)頁(yè)4包含塊5,塊5包含圖像7、8、9和10以及鏈接8。因?yàn)殒溄臃治鱿到y(tǒng)是基于塊上的而不是整個(gè)網(wǎng)頁(yè)的圖像相關(guān)度,因而一幅圖像到其他圖像的相關(guān)度有可能是基于更準(zhǔn)確的圖像主題的表示。例如,網(wǎng)頁(yè)2包含塊2和塊3,它們會(huì)分別指向不同的主題,諸如國(guó)際政治事件和國(guó)內(nèi)體育事件。鏈接分析系統(tǒng)可以識(shí)別到,由于包括圖像4的塊3具有到網(wǎng)頁(yè)4的鏈接4,因而圖像4與網(wǎng)頁(yè)4的圖像比起網(wǎng)頁(yè)3的圖像聯(lián)系更為緊密。例如,網(wǎng)頁(yè)4比網(wǎng)頁(yè)3更有可能是涉及體育的,因?yàn)閴K3包含到網(wǎng)頁(yè)4的鏈接,而不是到網(wǎng)頁(yè)3的。同樣,圖像4比對(duì)網(wǎng)頁(yè)3的圖像5和6更有可能涉及圖像7、8、9和10。不是基于塊級(jí)別的分析的技術(shù)會(huì)識(shí)別圖像4是同等地涉及網(wǎng)頁(yè)3和網(wǎng)頁(yè)4的,因?yàn)檫@些技術(shù)并不區(qū)分網(wǎng)頁(yè)2上的塊3和塊2。
在一個(gè)實(shí)施例中,鏈接分析系統(tǒng)為每個(gè)塊和頁(yè)面的結(jié)合計(jì)算頁(yè)面對(duì)塊的重要性,作為選擇該塊鏈接的用戶將選擇到該頁(yè)面鏈接的概率。如果塊沒(méi)有到頁(yè)面的鏈接,那么概率為0。如果塊有到頁(yè)面的鏈接,那么鏈接分析系統(tǒng)會(huì)假設(shè)用戶以相等的概率選擇該塊的每一個(gè)鏈接。塊到頁(yè)面的概率矩陣由以下公式定義
其中Zij表示選擇塊i鏈接的用戶將選擇到頁(yè)面j的鏈接的概率,si是塊i內(nèi)的鏈接數(shù)。附圖1的網(wǎng)頁(yè)的塊到頁(yè)面矩陣Z如表1所示。表1的行表示塊,以及列表示頁(yè)面。在該示例中,選擇塊4鏈接的用戶將選擇到網(wǎng)頁(yè)2的鏈接的概率為.5。
表1

在一個(gè)實(shí)施例中,鏈接分析系統(tǒng)為每個(gè)頁(yè)面和塊的結(jié)合計(jì)算塊對(duì)頁(yè)面的重要性,作為該塊成為頁(yè)面中最重要塊的概率。沒(méi)有包含在頁(yè)面中的塊成為該頁(yè)面中最重要塊的概率為0。鏈接分析系統(tǒng)會(huì)假設(shè)包含在頁(yè)面上的每個(gè)塊成為最重要的塊是具有同等概率的。由以下公式定義頁(yè)面到塊概率矩陣

其中,Xij表示塊j是頁(yè)面i最重要塊的概率,以及si是頁(yè)面i上的塊數(shù)。
在一個(gè)實(shí)施例中,鏈接分析系統(tǒng)根據(jù)塊的位置、大小、字體、顏色和其他物理屬性計(jì)算塊是頁(yè)面中最重要塊的概率。例如,位于頁(yè)面中間的大塊會(huì)比位于頁(yè)面左下角的小塊更重要。于2004年4月29日申請(qǐng)的美國(guó)專利申請(qǐng)?zhí)枮開(kāi)____,名為“Method and System for Calculating Importace of Block Within aDisplay Page”描述了用于計(jì)算塊的重要性和塊的相干相關(guān)程度的技術(shù),在這里并入其全文以供參考。頁(yè)面到塊的矩陣X更普遍的表示為

其中,fpi是表示塊j是頁(yè)面i最重要塊的概率的函數(shù)。在一個(gè)實(shí)施例中,函數(shù)fpi定義為當(dāng)顯示頁(yè)面i時(shí)由從屏幕中心到塊中心的距離劃分的塊j的大小。函數(shù)f定義如下

其中α是確保塊的函數(shù)值之和為1的標(biāo)準(zhǔn)化因子。函數(shù)f可以認(rèn)為是用戶瀏覽頁(yè)面i時(shí)關(guān)注于塊j的概率。附圖1的網(wǎng)頁(yè)的頁(yè)面到塊矩陣X如表2所示。表2的行表示頁(yè)面,而列表示塊。在該示例中,塊4是網(wǎng)頁(yè)3的最重要塊的概率是.8。
表2

在一個(gè)示例中,鏈接分析系統(tǒng)為每個(gè)塊和網(wǎng)頁(yè)組合計(jì)算圖像對(duì)塊的重要性作為圖像成為塊的最重要圖像的概率。如果塊不包含某一圖像,那么該圖像成為塊的最重要圖像的概率為0。鏈接分析系統(tǒng)會(huì)假設(shè)塊的每幅圖像是最重要的概率相同。鏈接分析系統(tǒng)能使用其他圖像對(duì)塊重要性方法,例如根據(jù)圖像的相對(duì)大小,圖像在塊內(nèi)的位置等。塊到圖像的概率矩陣由下列等式定義

其中Yij表示圖像j是塊i的最重要圖像的概率,而si是塊i中圖像數(shù)目。附圖1的網(wǎng)頁(yè)的塊到矩陣Y如表3所示。表3的行表示塊,而列表示圖像。在該示例中,圖像2是塊1的最重要圖像的概率是.5。
表3

在一個(gè)實(shí)施例中,鏈接分析系統(tǒng)為每對(duì)排列的頁(yè)面計(jì)算一個(gè)頁(yè)面對(duì)另一個(gè)頁(yè)面的重要性,作為正瀏覽該對(duì)的第一頁(yè)面的用戶將選擇指向該對(duì)的第二頁(yè)面的概率。鏈接分析系統(tǒng),通過(guò)將第一頁(yè)面的每個(gè)塊,都用該塊成為第一頁(yè)面最重要塊的概率乘以第二頁(yè)面是對(duì)該塊最重要網(wǎng)頁(yè)并將乘積求和,以此來(lái)計(jì)算每一對(duì)的概率。因此,一個(gè)頁(yè)面對(duì)另一個(gè)頁(yè)面的重要性在于用戶會(huì)愿意選擇頁(yè)面最重要塊內(nèi)的鏈接。這些頁(yè)面到頁(yè)面的概率矩陣由以下表示W(wǎng)P=XZ (6)其中WP表示網(wǎng)頁(yè)到網(wǎng)頁(yè)矩陣。W的概率可以另外表示為Prob(β|α)=∑b∈aProb(β|b)Prob(b|α) (7)其中α表示該對(duì)的第一頁(yè)面,而β表示該對(duì)的第二頁(yè)面。附圖1的網(wǎng)頁(yè)的頁(yè)面到頁(yè)面矩陣WP如表4所示。在該示例中,正瀏覽頁(yè)面3的用戶將轉(zhuǎn)換到網(wǎng)頁(yè)2的概率為.4。
表4

鏈接分析系統(tǒng)為每對(duì)排序的塊計(jì)算一個(gè)塊對(duì)另一個(gè)塊的重要性作為正在瀏覽該對(duì)的第一塊的用戶將選擇指向包含該對(duì)第二塊的網(wǎng)頁(yè)的鏈接并發(fā)現(xiàn)第二塊是該頁(yè)面最重要的概率。鏈接分析系統(tǒng)通過(guò)用選擇第一塊的鏈接的用戶將選擇用于包含第二塊的頁(yè)面的鏈接的概率乘以第二塊成為該頁(yè)面最重要的塊的概率并將乘積求和,來(lái)為每一對(duì)計(jì)算其概率。因此,一個(gè)塊對(duì)另一塊的重要性表示正瀏覽第一塊的用戶將選擇指向包含第二塊的頁(yè)面的鏈接并關(guān)注于第二塊。這些塊到塊的概率矩陣由以下表示W(wǎng)B=ZX(8)其中WB表示塊到塊矩陣。W的概率可以另外表示為WB(a,b)=prob(b|a)=∑γ∈PProb(γ|α)Prob(b|γ)=Prob(β|α)Prob(b|β) (9)
=Z(α,β)X(β,b),a,b∈B對(duì)于附圖1的網(wǎng)頁(yè)的塊到塊矩陣WB如表5所示。在該示例中,正瀏覽塊4的用戶跳到網(wǎng)頁(yè)2并將注意力關(guān)注于塊3的概率是.25。
表5

在一個(gè)實(shí)施例中,在塊到塊矩陣的鏈接分析系統(tǒng)因子概率表示相同網(wǎng)頁(yè)上的兩個(gè)塊是相關(guān)的。修正的塊到塊矩陣如下所示W(wǎng)B=(1-t)ZX+tDU (10)其中D是對(duì)角矩陣Dij=∑jUij,U是相干相干矩陣,以及t是權(quán)因子。矩陣U的定義如下

其中DOC是包含塊i和塊j的最小塊的相干度。權(quán)因子t一般會(huì)設(shè)置為小值(例如,小于.1),因?yàn)樵诖蠖鄶?shù)情況下,在同一網(wǎng)頁(yè)上的不同塊涉及不同的主題。
鏈接分析系統(tǒng)為每對(duì)圖像計(jì)算該對(duì)的第一幅圖像與該對(duì)的第二幅圖像相關(guān)的概率。鏈接分析系統(tǒng)通過(guò)對(duì)于結(jié)合包含第一幅圖像的每個(gè)塊對(duì)包含第二幅圖像的每個(gè)塊的概率的塊到塊概率進(jìn)行求和來(lái)計(jì)算概率。這些概率的圖像到圖像矩陣如下所示W(wǎng)I=Y(jié)TWBY (12)其中WI表示圖像到圖像矩陣。附圖1的網(wǎng)頁(yè)的圖像到圖像矩陣WI如表6所示。在該示例中,正瀏覽塊10的用戶將接著瀏覽網(wǎng)頁(yè)3并關(guān)注于塊5的概率是.05。
表6

在一個(gè)實(shí)施例中,鏈接分析系統(tǒng)將圖像到圖像矩陣因子乘以同一頁(yè)面上的兩個(gè)塊是相關(guān)的概率。修正的圖像到圖像矩陣如下所示W(wǎng)I=tDYTY+(1-t)YTWBY (13)其中t是權(quán)因子,而D是表示如下的對(duì)角矩陣Dii=Ej(YTY)ij(14)權(quán)因子t會(huì)設(shè)置為大值(例如,.7-.9),因?yàn)橥粔K中的兩幅圖像可能是相關(guān)的。
在一個(gè)實(shí)施例中,鏈接分析系統(tǒng)產(chǎn)生來(lái)自圖像到圖像矩陣的、表示每幅圖像的矢量。鏈接分析系統(tǒng)使用最小平方方法產(chǎn)生矢量,其中由圖像到圖像矩陣表明一對(duì)圖像之間的相似性的因子。鏈接分析系統(tǒng)最初將圖像到圖像矩陣轉(zhuǎn)換為相似矩陣,如下所示S=(WI+WIT)/2---(15)]]>其中S表示相似矩陣。如果yi是表示圖像i的矢量,那么圖像矢量的最佳集合是使用下列目標(biāo)函數(shù)獲得的y=(y1,…ym)miny∑i,j(yi-yj)2Si,j---(16)]]>如果D是對(duì)角矩陣,Dii是相似矩陣S的第i行的值之和,那么最小化問(wèn)題化簡(jiǎn)為如下
minyTy=1yTLy---(17)]]>其中L等于D-S。由最小特征值方法給出解決一般特征值問(wèn)題的解Ly=λy (18)如果(y0,λ0),(y1,λ0),……,(ym-1,λm-1)是等式16的解,并且λ0<λ1<……<λm-1,那么λ0=0并且y0=(1,1,……,1)。鏈接分析系統(tǒng)選擇特征向量I到K表示k維歐幾里得空間的圖像。一幅圖像的矢量如下所示imagej←(yI(j),…yk(j)) (19)其中yi(j)表示yi的第j個(gè)單元。
鏈接分析系統(tǒng)通過(guò)用向量表示每幅圖像來(lái)識(shí)別相關(guān)圖像群,以使圖像矢量之間的距離表示它們的語(yǔ)義相似性。可以將不同的群集算法應(yīng)用于圖像矢量以識(shí)別語(yǔ)義相關(guān)的圖像群。這些群集算法會(huì)包括光譜圖表理論的Fiedler矢量,k-手段群集,等等。
圖像群集可以用于支持瀏覽。例如,當(dāng)瀏覽網(wǎng)頁(yè)時(shí),用戶可以選擇一幅圖像并請(qǐng)求看相關(guān)圖像。然后,可以顯示包含與所選擇的圖像群集在一起的圖像的網(wǎng)頁(yè)作為請(qǐng)求結(jié)果。在一個(gè)實(shí)施例中,可以以基于在每幅圖像的圖像矢量和所選擇圖像的圖像矢量之間的距離的順序來(lái)表示網(wǎng)頁(yè)。
圖像群集也可以用于提供語(yǔ)義相關(guān)的圖像的多維顯示??梢詾榫W(wǎng)頁(yè)集的圖像產(chǎn)生圖像矢量。一旦識(shí)別群,系統(tǒng)能根據(jù)不同的特征向量在表示群的二維網(wǎng)格上的每個(gè)群的指示。
鏈接分析系統(tǒng)能根據(jù)圖像到圖像矩陣來(lái)排列圖像。圖像到圖像矩陣表示從圖像轉(zhuǎn)換到圖像的概率。用戶將可能隨機(jī)轉(zhuǎn)換到一幅圖像。為解釋這個(gè),鏈接分析系統(tǒng)產(chǎn)生概率轉(zhuǎn)換矩陣,該矩陣將該隨機(jī)性乘入到圖像到圖像矩陣如下P=εW+(1-ε)U (20)其中P是概率轉(zhuǎn)換矩陣,ε是權(quán)因子(例如,0.1~0.2),以及U是統(tǒng)一轉(zhuǎn)換概率的轉(zhuǎn)換矩陣(對(duì)于所有的i,j,Uij=1/m)。由于U的引入,因而連接圖表并存在圖表的隨機(jī)移動(dòng)的靜態(tài)分布。圖表排列如下所示PTπ=π (21)其中,π是表示圖像排列的特征值為1的PT的特征向量,其中特征值表示圖像排列。π=(π1,π1,…,πm)表示靜態(tài)概率分布,而πi表示圖像i的排列。
附圖2是描述在一個(gè)實(shí)施例中鏈接分析系統(tǒng)的組件的框圖。鏈接分析系統(tǒng)200包括網(wǎng)頁(yè)存儲(chǔ)裝置201、計(jì)算圖像排列組件202、識(shí)別圖像群組件203、以及產(chǎn)生圖像到圖像矩陣組件211。產(chǎn)生圖像到圖像矩陣組件211使用識(shí)別塊組件212、產(chǎn)生塊到頁(yè)面矩陣組件213、產(chǎn)生頁(yè)面到塊矩陣組件214、以及產(chǎn)生塊到圖像矩陣組件215,以產(chǎn)生表明圖像到圖像相關(guān)度的矩陣。網(wǎng)頁(yè)存儲(chǔ)器包含網(wǎng)頁(yè)的集合。計(jì)算圖像排列組件使用產(chǎn)生圖像到圖像組件以計(jì)算圖像的相關(guān)度然后使用那些相關(guān)度的計(jì)算來(lái)排列圖像。識(shí)別圖像群組件使用產(chǎn)生圖像到圖像矩陣組件以計(jì)算圖像的相關(guān)度,根據(jù)矩陣產(chǎn)生圖像的矢量表示,并使用產(chǎn)生的矢量來(lái)識(shí)別圖像群。雖然在附圖2中未示出,鏈接分析系統(tǒng)也可以包括用于計(jì)算網(wǎng)頁(yè)而不是圖像的排列單元的組件。例如,鏈接分析系統(tǒng)會(huì)將等式20和21的排列應(yīng)用到塊到塊矩陣以排列塊,并應(yīng)用到頁(yè)面到頁(yè)面矩陣以排列頁(yè)面自身。
鏈接分析系統(tǒng)在其上實(shí)施的計(jì)算設(shè)備包括中央處理單元、存儲(chǔ)器、輸入設(shè)備(例如,鍵盤或指示設(shè)備)、輸出設(shè)備(例如,顯示設(shè)備),以及存儲(chǔ)設(shè)備(例如,硬盤驅(qū)動(dòng)器)。存儲(chǔ)器和存儲(chǔ)設(shè)備是可以包含實(shí)施鏈接分析系統(tǒng)的指令的計(jì)算機(jī)可讀介質(zhì)。此外,數(shù)據(jù)結(jié)構(gòu)和信息結(jié)構(gòu)可以經(jīng)由數(shù)據(jù)傳輸介質(zhì)存儲(chǔ)或傳輸,諸如在通信鏈接上的信號(hào)。能使用各種通信鏈接,例如,因特網(wǎng)、局域網(wǎng)、廣域網(wǎng)或點(diǎn)對(duì)點(diǎn)撥號(hào)連接。
附圖2描述其中可以實(shí)施鏈接分析系統(tǒng)的合適操作環(huán)境的示例。操作環(huán)境僅是合適操作環(huán)境的一個(gè)示例,而不是用于限制鏈接分析系統(tǒng)的用途或功能的范圍。其它適合使用的、已知計(jì)算機(jī)系統(tǒng)、環(huán)境和配置包括個(gè)人計(jì)算機(jī),服務(wù)器計(jì)算機(jī),手持或臺(tái)式計(jì)算機(jī)設(shè)備,多處理器系統(tǒng),基于微處理器的系統(tǒng),可編程用戶電子設(shè)備,網(wǎng)絡(luò)PC,微計(jì)算機(jī),大型計(jì)算機(jī),包括任何上述系統(tǒng)或設(shè)備的分布式計(jì)算環(huán)境,等等。
可以在計(jì)算機(jī)可執(zhí)行指令的一般環(huán)境下描述鏈接分析系統(tǒng),所述指令諸如由一個(gè)或多個(gè)計(jì)算機(jī)或其它設(shè)備執(zhí)行的程序模塊。一般而言,程序模塊包括執(zhí)行特定任務(wù)或?qū)嵤┨囟ǔ橄髷?shù)據(jù)類型的例行程序、程序、對(duì)象、組件、數(shù)據(jù)結(jié)構(gòu)等。通常,可以根據(jù)各種實(shí)施例的需要來(lái)結(jié)合或分配程序模塊的功能。
附圖3是描述在一個(gè)實(shí)施例中產(chǎn)生圖像到圖像的矩陣組件處理的流程圖。在塊301,組件識(shí)別存儲(chǔ)在網(wǎng)頁(yè)存儲(chǔ)裝置中的網(wǎng)頁(yè)內(nèi)的塊。在塊302,組件調(diào)用產(chǎn)生塊到頁(yè)面矩陣組件。在塊303,組件調(diào)用產(chǎn)生頁(yè)面到塊矩陣組件。在塊304,組件調(diào)用產(chǎn)生塊到圖像矩陣組件。在塊305,組件產(chǎn)生塊到塊矩陣。在塊306,組件產(chǎn)生圖像到圖像矩陣然后結(jié)束。
附圖4是描述在一個(gè)實(shí)施例中產(chǎn)生塊到頁(yè)面的矩陣組件處理的流程圖。在塊401-408,組件循環(huán)選擇每個(gè)網(wǎng)頁(yè),每個(gè)網(wǎng)頁(yè)內(nèi)的每個(gè)塊,以及每個(gè)塊內(nèi)的每個(gè)鏈接,并設(shè)置由該鏈接鏈接到塊的頁(yè)面的重要性。在塊401,組件選擇下一個(gè)頁(yè)面。在決定塊402,如果所有頁(yè)面都已經(jīng)選擇過(guò)了,那么組件返回到塊到頁(yè)面矩陣,否則組件繼續(xù)塊403。在塊403,組件選擇選中頁(yè)面的下一個(gè)塊。在決定塊404,如果選定頁(yè)面的所有塊都已選擇過(guò)了,那么組件循環(huán)到塊401以選擇下一個(gè)頁(yè)面,否則組件繼續(xù)塊405。在塊405,組件計(jì)算選中塊內(nèi)的鏈接數(shù)。在塊406,組件選擇選中塊的下一個(gè)鏈接的鏈接到頁(yè)面。在決定塊407,如果選定塊的所有鏈接到頁(yè)面都已經(jīng)選擇過(guò)了,那么組件循環(huán)到塊403以選擇下一個(gè)塊,否則組件繼續(xù)塊408。在塊408,組件設(shè)置鏈接到頁(yè)面到塊的重要性然后循環(huán)到塊406以選擇選中塊的下一個(gè)鏈接的鏈接到頁(yè)面。
附圖5是描述在一個(gè)實(shí)施例中產(chǎn)生頁(yè)面到塊矩陣組件處理的流程圖。在塊501-506,組件循環(huán)選擇每個(gè)頁(yè)面和每個(gè)頁(yè)面內(nèi)的每個(gè)塊并設(shè)置塊到所選擇頁(yè)面的重要性。在塊501,組件選擇網(wǎng)頁(yè)存儲(chǔ)裝置的下一個(gè)頁(yè)面。在決定塊502,如果所有頁(yè)面都已選擇過(guò)了,那么組件返回到頁(yè)面到塊的矩陣,否則組件繼續(xù)塊503。在塊503,組件選擇所選定頁(yè)面的下一個(gè)塊。在決定塊504,如果選中頁(yè)面的所有塊都已經(jīng)選擇過(guò)了,那么組件循環(huán)到塊501以選擇下一個(gè)頁(yè)面,否則組件繼續(xù)塊505。在塊505,組件計(jì)算選中塊到選中頁(yè)面的重要性。在塊506,組件設(shè)置選中塊到選中頁(yè)面的重要性并然后循環(huán)到塊503以選擇選中頁(yè)面的下一個(gè)塊。
附圖6是描述在一個(gè)實(shí)施例中,產(chǎn)生塊到圖像矩陣組件處理的流程圖。在塊601-607中,組件循環(huán)選擇每個(gè)頁(yè)面,每個(gè)頁(yè)面內(nèi)的每個(gè)塊,以及每個(gè)塊內(nèi)的每幅圖像,并設(shè)置圖像到選定塊的重要性。在塊601,組件選擇網(wǎng)頁(yè)存儲(chǔ)裝置的下一個(gè)頁(yè)面。在決定塊602,如果所有頁(yè)面都已選擇過(guò)了,那么組件返回塊到圖像矩陣,否則組件繼續(xù)塊603。在塊603,組件選擇選中頁(yè)面的下一個(gè)塊。在決定塊604,如果選定頁(yè)面的所有的塊都已經(jīng)選擇過(guò)了,那么組件循環(huán)到塊601以選擇下一個(gè)頁(yè)面,否則組件繼續(xù)到塊605。在塊605,組件計(jì)算選中塊的圖像數(shù)。在塊606,組件選擇選中塊的下一個(gè)圖像。在決定塊607,如果選定塊的所有的圖像都已經(jīng)選擇過(guò)了,那么組件循環(huán)到塊603已選擇下一個(gè)塊,否則組件繼續(xù)塊608。在塊608,組件設(shè)置選中圖像到選中塊的重要性然后循環(huán)到塊606以選擇選中塊的下一個(gè)圖像。
熟知本領(lǐng)域的人士將理解,雖然這里為了便于解釋已描述鏈接分析系統(tǒng)的具體實(shí)施例,但是可在不背離本發(fā)明精神和范圍的情況下作出各種改變。因此,除了所附權(quán)利要求之外不能用于限制本發(fā)明。
權(quán)利要求
1.一種用于在計(jì)算機(jī)系統(tǒng)中確定頁(yè)面的塊內(nèi)圖像之間相關(guān)度的方法,該方法包括計(jì)算塊對(duì)頁(yè)面的重要性指標(biāo);計(jì)算頁(yè)面對(duì)塊的重要性指標(biāo);計(jì)算圖像對(duì)塊的重要性指標(biāo);以及通過(guò)結(jié)合塊對(duì)頁(yè)面的重要性指標(biāo)、頁(yè)面對(duì)塊的重要性指標(biāo),以及圖像對(duì)塊的重要性指標(biāo),來(lái)計(jì)算一幅圖像對(duì)另一幅圖像的圖像對(duì)圖像的相關(guān)度指標(biāo)。
2.如權(quán)利要求1所述的方法,其中頁(yè)面對(duì)塊的重要性指標(biāo)是用戶將從每個(gè)塊選擇指向每個(gè)其它頁(yè)面的鏈接的概率。
3.如權(quán)利要求1所述的方法,其中塊對(duì)頁(yè)面的重要性指標(biāo)是用戶將關(guān)注于頁(yè)面的每個(gè)塊的概率。
4.如權(quán)利要求1所述的方法,其中圖像對(duì)塊的重要性指標(biāo)是用戶將關(guān)注于每個(gè)塊的每幅圖像的概率。
5.如權(quán)利要求1所述的方法,其中頁(yè)面對(duì)塊的重要性指標(biāo)是用戶將從每個(gè)塊選擇指向每個(gè)其它頁(yè)面的鏈接的概率,塊對(duì)頁(yè)面的重要性指標(biāo)是用戶將關(guān)注于頁(yè)面的每個(gè)塊的概率,以及圖像對(duì)塊的重要性指標(biāo)是用戶將關(guān)注于每個(gè)塊的每幅圖像的概率。
6.如權(quán)利要求1所述的方法,包括根據(jù)圖像對(duì)圖像的指標(biāo)計(jì)算圖像的排列。
7.如權(quán)利要求6所述的方法,其中所計(jì)算的排列是基于開(kāi)始于任意圖像的用戶在圖像間進(jìn)行任意多數(shù)量的轉(zhuǎn)移之后轉(zhuǎn)移到另一幅圖像的概率。
8.如權(quán)利要求1所述的方法,其中如下計(jì)算圖像對(duì)圖像指標(biāo)WI=Y(jié)TWBY其中,WI是圖像對(duì)圖像的指標(biāo)的矩陣,Y是圖像對(duì)塊的指標(biāo)的矩陣,以及WB=ZX其中,WB是塊對(duì)塊的指標(biāo)的矩陣,Z是頁(yè)面對(duì)塊的重要性指標(biāo)的矩陣,以及X是塊對(duì)頁(yè)面的重要性指標(biāo)的矩陣。
9.如權(quán)利要求1所述的方法,包括根據(jù)圖像對(duì)圖像的指標(biāo)產(chǎn)生每幅圖像的矢量表示;以及根據(jù)它們的矢量表示來(lái)識(shí)別圖像群,其中群中圖像是相關(guān)的。
10.一種用于在計(jì)算機(jī)系統(tǒng)中確定頁(yè)面中塊之間的相關(guān)度的方法,該方法包括計(jì)算頁(yè)面對(duì)塊的重要性指標(biāo);計(jì)算塊對(duì)頁(yè)面的重要性指標(biāo);以及通過(guò)結(jié)合塊對(duì)頁(yè)面的重要性指標(biāo)和頁(yè)面對(duì)塊的重要性指標(biāo),來(lái)計(jì)算一個(gè)塊到另一個(gè)塊的塊到塊的相關(guān)度指標(biāo)。
11.如權(quán)利要求10所述的方法,其中頁(yè)面對(duì)塊的重要性指標(biāo)是用戶將從每個(gè)塊選擇指向每個(gè)其它網(wǎng)頁(yè)的鏈接的概率。
12.如權(quán)利要求10所述的方法,其中塊對(duì)頁(yè)面的重要性指標(biāo)是用戶將關(guān)注于頁(yè)面內(nèi)每個(gè)塊的概率。
13.如權(quán)利要求10所述的方法,其中頁(yè)面對(duì)塊的重要性指標(biāo)是用戶將從每個(gè)塊選擇將指向每個(gè)其它網(wǎng)頁(yè)的鏈接的概率,以及塊對(duì)頁(yè)面的重要性指標(biāo)是用戶將關(guān)注于頁(yè)面每個(gè)塊的概率。
14.如權(quán)利要求10所述的方法,包括根據(jù)塊到塊指標(biāo)計(jì)算塊的排列。
15.如權(quán)利要求14所述的方法,其中所計(jì)算的排列是基于開(kāi)始于任意塊的用戶在圖像間進(jìn)行任意多數(shù)量的轉(zhuǎn)移之后轉(zhuǎn)移到另一幅圖像的概率。
16.如權(quán)利要求10所述的方法,其中如下計(jì)算塊到塊的指標(biāo)WB=ZX其中X是塊對(duì)頁(yè)面的重要性指標(biāo)的矩陣,以及Z是頁(yè)面對(duì)塊的重要性指標(biāo)的矩陣。
17.一種用于在計(jì)算機(jī)系統(tǒng)中確定具有塊的頁(yè)面之間相關(guān)度的方法,該方法包括計(jì)算頁(yè)面對(duì)塊的重要性指標(biāo);計(jì)算塊對(duì)頁(yè)面的重要性指標(biāo);以及通過(guò)結(jié)合塊對(duì)頁(yè)面的指標(biāo)和頁(yè)面對(duì)塊的指標(biāo),來(lái)計(jì)算一個(gè)頁(yè)面對(duì)另一個(gè)頁(yè)面的頁(yè)面到頁(yè)面的相關(guān)度指標(biāo)。
18.如權(quán)利要求17所述的方法,其中頁(yè)面對(duì)塊的重要性指標(biāo)是用戶將從每個(gè)塊選擇指向每個(gè)其它網(wǎng)頁(yè)的鏈接的概率。
19.如權(quán)利要求17所述的方法,其中塊對(duì)頁(yè)面的重要性指標(biāo)是用戶將關(guān)注于頁(yè)面每個(gè)塊的概率。
20.如權(quán)利要求17所述的方法,其中塊對(duì)頁(yè)面的重要性指標(biāo)是用戶將關(guān)注于頁(yè)面每個(gè)塊的概率,以及頁(yè)面對(duì)塊的重要性指標(biāo)是用戶將從每個(gè)塊選擇指向每個(gè)其它網(wǎng)頁(yè)的鏈接的概率。
21.如權(quán)利要求17所述的方法,包括根據(jù)頁(yè)面到頁(yè)面指標(biāo)計(jì)算頁(yè)面的排列。
22.如權(quán)利要求21所述的方法,其中所計(jì)算的排列是基于開(kāi)始于任意頁(yè)面的用戶在圖像間進(jìn)行任意多數(shù)量的轉(zhuǎn)移之后轉(zhuǎn)移到另一幅圖像的概率。
23.如權(quán)利要求17所述的方法,其中如下計(jì)算頁(yè)面到頁(yè)面的指標(biāo)WP=WZ其中,WP是頁(yè)面到頁(yè)面的指標(biāo)的矩陣,X是塊對(duì)頁(yè)面的重要性指標(biāo)的矩陣,以及Z是頁(yè)面對(duì)塊的重要性指標(biāo)的矩陣。
24.一種用于在計(jì)算機(jī)系統(tǒng)中識(shí)別在具有鏈接的頁(yè)面上的相關(guān)圖像的方法,每個(gè)鏈接從包含圖像的頁(yè)面上的塊指向具有包含另一幅圖像的另一個(gè)塊的頁(yè)面,該方法包括對(duì)于每幅圖像,對(duì)每一其他圖像計(jì)算如果用戶正在瀏覽該圖像那么用戶將選擇從包含該圖像的頁(yè)面上的塊指向具有包含該其他圖像的塊的另一頁(yè)面的鏈接的概率;對(duì)于每幅圖像,根據(jù)計(jì)算的概率,產(chǎn)生該圖像的矢量表示;以及根據(jù)圖像的矢量表示來(lái)識(shí)別圖像群,其中群中的圖像是相關(guān)的。
25.如權(quán)利要求24所述的方法,其中產(chǎn)生矢量表示包括選擇最小化目標(biāo)函數(shù)的矢量表示。
26.如權(quán)利要求26所述的方法,其中目標(biāo)函數(shù)是每對(duì)圖像的矢量表示之間距離的平方和乘以來(lái)自所計(jì)算的概率的該圖像對(duì)的相似性。
27.如權(quán)利要求24所述的方法,其中計(jì)算概率包括計(jì)算表明用戶將從每個(gè)塊選擇指向每個(gè)其它頁(yè)面的鏈接的概率的概率,表明用戶將關(guān)注于該頁(yè)面的每個(gè)塊的概率的概率,以及表明用戶將關(guān)注于每個(gè)塊的每個(gè)圖像的概率的概率。
28.一種計(jì)算機(jī)可讀介質(zhì),包含用于控制計(jì)算機(jī)系統(tǒng)確定頁(yè)面單元之間的相關(guān)度的指令,該方法包括計(jì)算第一單元對(duì)第二單元的重要性指標(biāo);計(jì)算第二單元對(duì)第一單元的重要性指標(biāo);以及通過(guò)結(jié)合第一單元對(duì)第二單元的重要性指標(biāo)以及第二單元對(duì)第一單元的重要性指標(biāo),來(lái)計(jì)算第一單元對(duì)另一個(gè)第一單元的相關(guān)度指標(biāo)。
29.如權(quán)利要求28的計(jì)算機(jī)可讀介質(zhì),其中第一單元是頁(yè)面而第二單元是頁(yè)面的塊。
30.如權(quán)利要求28的計(jì)算機(jī)可讀介質(zhì),其中第一單元是頁(yè)面的塊而第二單元是頁(yè)面。
31.如權(quán)利要求28的計(jì)算機(jī)可讀介質(zhì),其中第一單元是頁(yè)面的塊的圖像而第二單元是塊。
32.如權(quán)利要求28的計(jì)算機(jī)可讀介質(zhì),其中重要性指標(biāo)是概率。
33.一種用于確定頁(yè)面的塊內(nèi)圖像之間相關(guān)度的計(jì)算機(jī)系統(tǒng),包括頁(yè)面對(duì)塊的重要性指標(biāo);塊對(duì)頁(yè)面的重要性指標(biāo);圖像對(duì)塊的重要性指標(biāo);以及用于通過(guò)結(jié)合塊對(duì)頁(yè)面的重要性指標(biāo)、頁(yè)面對(duì)塊的重要性指標(biāo)、以及圖像對(duì)塊的指標(biāo),來(lái)計(jì)算一幅圖像到另一幅圖像的圖像對(duì)圖像的相關(guān)度指標(biāo)的裝置。
34.如權(quán)利要求33的計(jì)算機(jī)系統(tǒng)包括用于將頁(yè)面對(duì)塊的重要性指標(biāo)計(jì)算為用戶將從每個(gè)塊選擇指向每個(gè)其它頁(yè)面的概率的裝置。
35.如權(quán)利要求33的計(jì)算機(jī)系統(tǒng)包括用于將塊對(duì)頁(yè)面的重要性指標(biāo)計(jì)算為用戶將關(guān)注于頁(yè)面的每個(gè)塊的概率的裝置。
36.如權(quán)利要求33的計(jì)算機(jī)系統(tǒng)包括用于將圖像對(duì)塊的重要性指標(biāo)計(jì)算為用戶將關(guān)注于每個(gè)塊的每個(gè)圖像的裝置。
37.如權(quán)利要求33的計(jì)算機(jī)系統(tǒng)包括用于根據(jù)圖像對(duì)圖像的指標(biāo)來(lái)計(jì)算圖像排列的裝置。
38.如權(quán)利要求37的計(jì)算機(jī)系統(tǒng),其中所計(jì)算的排列是基于開(kāi)始于任意圖像的用戶在圖像間進(jìn)行任意多數(shù)量的轉(zhuǎn)移之后轉(zhuǎn)移到另一幅圖像的概率。
39.如權(quán)利要求33的計(jì)算機(jī)系統(tǒng)包括用于根據(jù)圖像對(duì)圖像的指標(biāo)來(lái)產(chǎn)生每幅圖像的矢量表示的裝置;以及用于根據(jù)圖像的矢量表示來(lái)識(shí)別圖像群的裝置,其中群中的圖像是相關(guān)的。
全文摘要
一種用于根據(jù)鏈接和頁(yè)面布局分析來(lái)確定頁(yè)面圖像相關(guān)度的方法和系統(tǒng)。鏈接分析系統(tǒng)通過(guò)首先識(shí)別網(wǎng)頁(yè)內(nèi)的塊,然后分析塊對(duì)網(wǎng)頁(yè)、網(wǎng)頁(yè)對(duì)塊、以及圖像對(duì)塊的重要性,來(lái)確定圖像之間的相關(guān)度。根據(jù)該分析,鏈接分析系統(tǒng)確定每幅圖像與其它各幅圖像的相關(guān)度。鏈接分析系統(tǒng)也可以使用圖像的相關(guān)度產(chǎn)生圖像的排列。鏈接分析系統(tǒng)也可以根據(jù)圖像的相關(guān)度產(chǎn)生圖像的矢量表示,并將群集算法應(yīng)用于矢量表示以識(shí)別相關(guān)圖像群。
文檔編號(hào)G06F17/30GK1694102SQ20051007922
公開(kāi)日2005年11月9日 申請(qǐng)日期2005年4月29日 優(yōu)先權(quán)日2004年4月29日
發(fā)明者蔡登 , 文繼榮, 馬維英, X·何 申請(qǐng)人:微軟公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
两当县| 永新县| 阿鲁科尔沁旗| 麦盖提县| 林芝县| 苗栗县| 景宁| 洪江市| 抚远县| 特克斯县| 定南县| 富宁县| 张北县| 湘阴县| 广安市| 且末县| 河北省| 通州区| 治多县| 两当县| 尼玛县| 申扎县| 咸丰县| 阳信县| 方山县| 吐鲁番市| 车险| 电白县| 敦煌市| 庆安县| 铜陵市| 陇川县| 衡水市| 康平县| 神池县| 德钦县| 拉孜县| 武宁县| 温泉县| 宁海县| 光泽县|