欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

在網(wǎng)站和類似信息源中導航的制作方法

文檔序號:6482746閱讀:163來源:國知局
專利名稱:在網(wǎng)站和類似信息源中導航的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種定位和導航到萬維網(wǎng)上諸如網(wǎng)站或類似信息源之類的信息組內(nèi)所包含的信息的改進系統(tǒng)和方法。本發(fā)明還涉及一種產(chǎn)生容易地對這樣的信息進行導航的交互指南的系統(tǒng)和方法。
背景技術(shù)
高級主管和研究員經(jīng)常難以在公司組織結(jié)構(gòu)內(nèi)詳細地獲得與什么事務正在進行有關(guān)的精確信息。然而,公司網(wǎng)站越來越包含大量的信息,例如關(guān)于公司的產(chǎn)品、人員和組織結(jié)構(gòu)的信息。如果很快地進行對該信息的輕松訪問,則可以提供有價值的資源。然而,當前,由于當前網(wǎng)站位置和瀏覽技術(shù)的低效,和識別大量可用信息中的重要主題的困難,難以定位相關(guān)網(wǎng)站和找到信息。
當前可以使用各種搜索和瀏覽技術(shù)來在網(wǎng)站中進行定位和導航。這些技術(shù)中的第一種技術(shù)是傳統(tǒng)的搜索引擎。這可以識別包含了在搜索引擎框中輸入的特定詞或短語的網(wǎng)頁。該技術(shù)依賴于搜索者知道在網(wǎng)站上使用的準確的詞或短語以識別特定主題。盡管該搜索方法對于產(chǎn)品名稱之類的硬信息(hard information)可能非常有效,但是當搜索更為抽象的概念且在可以使用不同的詞和短語來描述相同或相關(guān)信息的情況下,其不太有效。例如,如果所有的所需信息都處于包含詞“教師”的網(wǎng)頁上,則在搜索引擎或網(wǎng)站上對詞“教師”的搜索可能是有效的。然而,如果在另一網(wǎng)頁上存在不包括詞“教師”的相關(guān)信息,例如“教育”、“學?!薄ⅰ昂⒆印焙汀敖淌摇?,則通過僅針對關(guān)鍵詞“教師”的搜索引擎搜索將無法對此進行定位。當查找特定類型的業(yè)務時(例如,當定位潛在的聯(lián)合體和買進對象、市場和營銷前景或商業(yè)伙伴時)該方法的另外的缺點在于其定位的各網(wǎng)頁可能僅反映給定公司的活動的很小部分。在給定的公司網(wǎng)站上可能存在好幾萬網(wǎng)頁,因此通常單個的網(wǎng)頁無法從整體上反映公司的活動,這使得根據(jù)其活動范圍來識別公司的過程變得非常困難。
為了幫助用戶在網(wǎng)站內(nèi)進行導航,傳統(tǒng)的解決方案是提出網(wǎng)站地圖或鏈接網(wǎng)頁。這典型地提供了主要主題或子主題的較長列表,具有去往在網(wǎng)站中包含這樣的主題的各個網(wǎng)頁的鏈接。網(wǎng)站地圖通常手動地產(chǎn)生并處于相對較高的級別。因此,其通常缺少大量的細節(jié)且組織和結(jié)構(gòu)上相當扁平。這意味著獲得信息可能會非常困難,因為其通常不能夠“向下鉆”過一個信息級別,而每一次當用戶想要瀏覽與不同的主題有關(guān)的信息時,需要用戶返回到網(wǎng)站地圖。
用于在網(wǎng)站內(nèi)導航的另一傳統(tǒng)技術(shù)是手動瀏覽。典型地,萬維網(wǎng)包含通過每一個網(wǎng)頁之間的多個可能路徑而相互鏈接的數(shù)百萬個網(wǎng)頁。選擇在特定網(wǎng)頁內(nèi)所包含的鏈接允許用戶導航到包含由鏈接文本或圖形所識別的信息的下一鏈接網(wǎng)頁。然而,當手動瀏覽時可能難以確保包含相關(guān)信息的網(wǎng)頁未被錯過,并且網(wǎng)頁在先前并未訪問過。此外,由于充分描述能夠通過鏈接而得到的大量主題的空間限制,在典型網(wǎng)站上所使用的文本鏈接通常包含不充分的詞。手動瀏覽的另一缺點在于用戶經(jīng)常會略讀每一個網(wǎng)頁,不可避免地導致了在網(wǎng)頁上可視地突顯的題頭文本和其他項的更為敏感地重點關(guān)注。如果所需的關(guān)鍵詞并未包含在重點關(guān)注的文本中,這可能會在通過略讀網(wǎng)頁來識別關(guān)鍵詞信息時,歪曲用戶的有效性。

發(fā)明內(nèi)容
本發(fā)明的目的是提出一種對萬維網(wǎng)上的信息組或其他類似信息源進行定位的系統(tǒng)和方法。這樣的信息組典型地將包含在由諸如www.google.com或www.uspto.gov等統(tǒng)一資源定位符(URL)所標識的網(wǎng)站內(nèi)。
本發(fā)明的另一目的是提出一種在萬維網(wǎng)或其他信息存儲器上的信息組之間和之內(nèi)進行導航的改進方法。這樣的信息組典型地將被包含在單個網(wǎng)站的界限內(nèi)、或通過內(nèi)容相關(guān)的網(wǎng)站內(nèi)。
在所附獨立權(quán)利要求中限定了本發(fā)明的各個方面。在從屬權(quán)利要求中限定了一些優(yōu)選的特征。
根據(jù)本發(fā)明的一個方面,提出了一種對基于文本(text)的電子文檔的組或集合進行分布(profiling)的方法,所述方法包括分析組中的每一個文檔以識別關(guān)鍵主題;將重要性量度分配給已識別的關(guān)鍵主題;以及使用該量度產(chǎn)生包括多個主題標識符的主題分布圖和已識別每一個主題對所述組在整體上的重要性的指示。
優(yōu)選地,所述電子文檔的組包括網(wǎng)站的網(wǎng)頁。在這種情況下,所述方法還可以包括下載網(wǎng)站的每一個網(wǎng)頁以便執(zhí)行分析步驟。
所述分析文檔的步驟可以包括搜索特定單詞。另外或可選地,所述分析步驟包括搜索并消除與重要關(guān)鍵詞無關(guān)的主題。另外或優(yōu)選地,所述分析步驟可以包括確定與組中已識別的多個關(guān)鍵主題的每一個相關(guān)的單詞列表;確定每一個關(guān)鍵主題是否出現(xiàn)于針對所述組中的其他關(guān)鍵主題的任一個的相關(guān)單詞的列表中,并丟棄關(guān)鍵主題并未出現(xiàn)于針對任意其他關(guān)鍵主題的相關(guān)單詞列表中的任意關(guān)鍵主題。
根據(jù)本發(fā)明的另一方面,提出了一種對基于文本的電子文檔的組或集合進行分布的系統(tǒng),所述系統(tǒng)包括用于分析組中的每一個文檔以識別關(guān)鍵主題的裝置;用于將重要性量度分配給已識別的關(guān)鍵主題的裝置;以及使用所述量度產(chǎn)生包括多個主題標識符的主題分布圖和已識別的主題對所述組在整體上的重要性的量度或指示的裝置。
根據(jù)本發(fā)明的另一方面,提出了一種在諸如因特網(wǎng)或內(nèi)聯(lián)網(wǎng)網(wǎng)站之類例如萬維網(wǎng)的子集的電子文檔的組內(nèi)進行導航的方法,所述方法包括在屏幕或顯示器上自動呈現(xiàn)多個主題標識符和已識別主題對所述組在整體上的相對重要性的指示,每一個主題是用戶可選的;接收用戶對給定主題的選擇,并響應用戶的選擇,提供對關(guān)于所選主題的信息的訪問。
通過自動呈現(xiàn)主題標識符以及其相對重要性而不需用戶啟動關(guān)鍵詞搜索,提供了一種簡單而有效的技術(shù)來允許用戶對感興趣的信息進行容易的導航。
根據(jù)本發(fā)明的另一方面,提出了一種允許對諸如因特網(wǎng)或內(nèi)聯(lián)網(wǎng)網(wǎng)站之類電子文檔組進行導航的交互/電子指南,所述指南用于自動地呈現(xiàn)多個主題標識符和已識別的主題的重要性的指示,每一個主題是用戶可選的,其中對給定主題的選擇提供對關(guān)于所選主題的信息的訪問。
根據(jù)本發(fā)明的另一方面,提出了一種在萬維網(wǎng)上或其他信息存儲器中定位信息組的方法,所述方法包括識別多個候選信息組;獲得針對每一個候選組的內(nèi)容分布圖;將第一候選組的分布圖與所述多個候選組中的每一個其他候選組進行比較,以便識別和測量第一與其他候選組之間的分布圖上的任何差別。
通過比較多個不同網(wǎng)站的內(nèi)容分布圖,提出了一種簡單的機制來識別具有相似或相關(guān)內(nèi)容的網(wǎng)站、或者識別與任意所需內(nèi)容分布圖相匹配的網(wǎng)站。
根據(jù)本發(fā)明的另一方面,提出了一種在萬維網(wǎng)或其他信息存儲器上的信息組之間和之內(nèi)進行導航的方法,包括在屏幕或顯示器上自動呈現(xiàn)多個組標識符、以及已識別的組相對于所需內(nèi)容分布圖的相似性的指示,每一個組是用戶可選的;接收用戶對給定組標識符的選擇,并響應用戶的選擇,提供對關(guān)于所選組的信息的訪問。
根據(jù)本發(fā)明的另一方面,提出了一種用于在萬維網(wǎng)等上定位諸如網(wǎng)站等文檔組的交互/電子指南,所述指南用于呈現(xiàn)多個組標識符、以及每一個組對目標內(nèi)容分布圖的相似性的指示,每一個組標識符是用戶可選的;其中對組標識符的選擇提供了對關(guān)于所選組的信息的訪問。


將僅作為示例并參考附圖來描述本發(fā)明的各個方面,其中圖1是用于在具有關(guān)鍵網(wǎng)站標題列表的網(wǎng)站內(nèi)定位和導航以及對這些網(wǎng)站進行定位和導航的電子指南的主視圖的示例圖;圖2是當從圖1的列表中選擇關(guān)鍵主題時呈現(xiàn)給用戶的后續(xù)視圖的示例圖;圖3是在圖1和2所示的網(wǎng)頁之間的鏈接的分級結(jié)構(gòu)的圖;圖4是對與諸如圖1所示的目標主題分布圖相關(guān)的網(wǎng)站進行定位和導航的電子指南的相關(guān)視圖的示例圖;圖5示出了該指南的無限鉆過能力;圖6示出了用戶可以通過圖1到3的指南進行導航的各種方式;圖7是創(chuàng)建圖1到3的指南的步驟的高級流程圖;圖8是創(chuàng)建圖1到3的指南所采用的步驟的更詳細的流程圖;圖9是設(shè)計關(guān)鍵主題的初始列表的步驟的流程圖;圖10是簡化通過執(zhí)行圖9的步驟所獲得的初始關(guān)鍵主題列表的各種步驟的流程圖;圖11示出了丟棄從整體上與信息子集無關(guān)的主題的相關(guān)詞的使用;圖12是示出了在兩組信息之間比較標題分布圖的過程的圖;圖13是比較兩個網(wǎng)站的分布圖所需的步驟的流程圖;圖14是利用關(guān)鍵詞主題信息來創(chuàng)建圖1的主視圖網(wǎng)頁的步驟的流程圖;圖15是創(chuàng)建圖2的后續(xù)視圖網(wǎng)頁的步驟的流程圖;以及圖16是創(chuàng)建圖3的相關(guān)視圖網(wǎng)頁的步驟的流程圖。
具體實施例方式
圖1示出了網(wǎng)站的電子指南12的主視圖網(wǎng)頁10,其中自動地呈現(xiàn)用戶可選的關(guān)鍵主題標識符14,而用戶不用必須輸入主題或關(guān)鍵詞來啟動搜索。實際上,在從遠程服務器下載來自網(wǎng)站的頁面之前,可以將指南12呈現(xiàn)給觀看者。當然,創(chuàng)建并下載網(wǎng)站的機制是非常公知的,并且這里不將詳細描述。典型地,關(guān)鍵主題列表擴展到多個網(wǎng)站網(wǎng)頁上。為了實現(xiàn)在這些網(wǎng)頁之間的導航,提出了一組導航按鈕,包括“第一個”、“下一個”、“前一個”和“最后一個”按鈕。點擊這些按鈕的任一個引起了關(guān)鍵標題的所需集合被列出。點擊關(guān)鍵主題的連續(xù)集合按照相繼的次序?qū)⒂脩魪年P(guān)鍵主題的最重要的集合帶到最不重要的集合。
按照預定的次序來提供圖1所示的主視圖10的關(guān)鍵主題標識符14,最重要的標題最先呈現(xiàn)。這意味著搜索者并不需要預先知道針對作者在網(wǎng)站中已經(jīng)使用的主題的實際文本,而能夠從可能主題列表中選擇對其最感興趣的。這樣,例如,針對教師的網(wǎng)站可以識別所有的主題“教師”、“教育”、“學校”、“小孩”和“教室”,作為該網(wǎng)站中的最重要的主題,并且將這些顯示在重要主題列表的頂部,允許用戶點擊其中之一以對相關(guān)內(nèi)容進行導航。給定針對或關(guān)于教師的網(wǎng)站訪問者可能會對所有這些主題感興趣,這是相對于傳統(tǒng)搜索引擎的關(guān)鍵詞優(yōu)勢,在傳統(tǒng)搜索引擎中,僅當在搜索框中輸入其時,將返回與單個主題“教師”有關(guān)的內(nèi)容。同樣,如圖1所示,對于針對從事航空工程產(chǎn)品的公司(例如公司X)的網(wǎng)站,主題可能是“電子”、“飛機”、“公司”等。
除了按照最重要的主題處于列表中的第一位來呈現(xiàn)主題之外,圖1提供了給出各個主題的相對重要性的清楚的可視指示的可視主題分布圖。特別地,圖1示出了關(guān)鍵主題的列表、以及這些主題的重要性的圖形指示16,網(wǎng)站上的最重要的主題出現(xiàn)在頂部。更具體地,對于圖1的指南中的每一個主題,提供了示出了主題對網(wǎng)站的重要性的橫條(bar)16。這允許對重要內(nèi)容進行突顯,即使其藏在網(wǎng)站的深處而非清楚地顯示在網(wǎng)站主頁上。該關(guān)鍵主題列表可以將每一個關(guān)鍵主題示作單個詞或多個詞的短語。
可以對關(guān)鍵主題分布圖中的每一個主題標識符14或橫條16進行選擇。點擊標識符和/或橫條使得包含另一主題列表的后續(xù)視圖18得以呈現(xiàn)。在該后續(xù)視圖18中,可以將信息特定地與包含與主視圖10中的所選關(guān)鍵主題有關(guān)的內(nèi)容的網(wǎng)頁進行關(guān)聯(lián)。
圖2示出了當選擇圖1的標題14和橫條16之一時所呈現(xiàn)的后續(xù)視圖18的示例。這在框架中具有活動網(wǎng)頁20。在該示例中,該指南適合于允許用戶點擊到活動網(wǎng)頁20自身;點擊到對使用“第一個”、“下一個”、“前一個”和“最后一個”按鈕的已選主題較為重要的另一后續(xù)視圖網(wǎng)頁;或者點擊到包含與該后續(xù)視圖網(wǎng)頁上所列出的其他關(guān)鍵主題24有關(guān)的信息的另外的后續(xù)視圖網(wǎng)頁。這些其他關(guān)鍵主圖24是僅對該網(wǎng)頁較為重要而非從整體上對網(wǎng)站較為重要且以對網(wǎng)頁的重要性的降序列出的主題。這使得容易對相關(guān)主題進行訪問,因為互相關(guān)的主題經(jīng)常群集在相同的網(wǎng)頁上,且這樣點擊這些相關(guān)關(guān)鍵主題的任一個將用戶直接帶到針對該關(guān)鍵主題的頂部網(wǎng)頁,使得容易進行瀏覽。例如,針對與“史密斯博士的化學課”有關(guān)的網(wǎng)頁的后續(xù)視圖可以列出僅與該網(wǎng)頁相關(guān)的以下關(guān)鍵主題史密斯博士、化學、本生燈、元素、化學系,并且允許對針對網(wǎng)頁上的這些關(guān)鍵主題的每一個的頂部后續(xù)視圖網(wǎng)頁的一次點擊訪問。這樣的點擊能力允許通過向下鉆/鉆過能力對關(guān)鍵內(nèi)容進行容易的訪問,這消除了當想要導航到網(wǎng)站內(nèi)的另一重要主題時返回到網(wǎng)站地圖網(wǎng)頁或主視圖的需要。
在圖2的后續(xù)視圖18中,還提供了主題分級。這示出了該主題相對于其他主題分級為多高,不管是在該網(wǎng)頁還是作為整體在網(wǎng)站上。特別地,設(shè)置了具有兩個尺度和兩個指針的指示符26。第一尺度的指針28指示了所選關(guān)鍵主題對整個網(wǎng)站的重要性。第二尺度的指針30指示了后續(xù)視圖列表中的所選主題相對于后續(xù)視圖列表中的其他主題的重要性。利用諸如“下一個”等導航按鈕來點擊針對所選主題的關(guān)鍵網(wǎng)頁的連續(xù)后續(xù)視圖按照相繼的次序?qū)⒂脩魪尼槍υ撝黝}的最重要關(guān)鍵網(wǎng)頁帶到最不重要關(guān)鍵網(wǎng)頁。圖3示出了如何對圖1和2的網(wǎng)頁進行鏈接。
除了提供導航網(wǎng)站的機制之外,圖1的指南適合于提供將用戶與具有類似主題分布圖的網(wǎng)站鏈接的裝置,從而提供網(wǎng)站間訪問機制、以及網(wǎng)站內(nèi)訪問。為了該目的,該指南包括一個或多個相關(guān)的視圖網(wǎng)頁32。這些可以通過點擊在每一個主要和后續(xù)視圖中表示的“相關(guān)視圖”鏈路33來訪問。圖4示出了用于對這樣的相關(guān)網(wǎng)站進行導航的相關(guān)視圖網(wǎng)頁32,其中呈現(xiàn)了用戶可選的網(wǎng)站標識符34。圖4所示的相關(guān)視圖32的相關(guān)網(wǎng)站標識符34以預定次序提供,其中這些網(wǎng)站具有最類似于首先呈現(xiàn)的目標主題分布圖的主題分布圖。優(yōu)選地,相關(guān)視圖網(wǎng)頁32提供可視分布圖,給出了網(wǎng)站與目標分布圖的相似性的清楚可視指示。特別地,圖4示出了網(wǎng)站的列表、以及網(wǎng)站與目標分布圖的相似性的圖形指示36,最相似的網(wǎng)站呈現(xiàn)在開始處。更具體地,針對圖4的網(wǎng)頁中的每一個網(wǎng)站,提供了示出了網(wǎng)站與目標分布圖的相似性的橫條36。這意味著當可能獲取者和被獲取者的目標分布圖可能類似時,搜索者可以容易地從相關(guān)網(wǎng)站中進行選擇。這允許用戶定位可能有幫助的相似網(wǎng)站,例如,當識別合并和獲取目標時。
典型地,圖4的網(wǎng)站列表在多個網(wǎng)站網(wǎng)頁上擴展。如前所述,為了實現(xiàn)這一點,通常,提供了一組導航按鈕38,包括“第一個”、“下一個”、“前一個”和“最后一個”按鈕。點擊這些按鈕允許用戶列出所需的網(wǎng)站集合。點擊連續(xù)的網(wǎng)站集合按照相繼的次序?qū)⒂脩魪木W(wǎng)站的最緊密相關(guān)集合帶到最不緊密相關(guān)集合。此外,可以對網(wǎng)站列表中的每一個網(wǎng)站標識符34或橫條36進行選擇。優(yōu)選地,對相關(guān)視圖網(wǎng)頁進行適配,從而點擊標識符34或橫條36的任一個使得與各個主題分布圖之間的重疊和差別有關(guān)的信息得以呈現(xiàn)。
圖1到3的指南具有提供對無限深度的向下鉆能力的鏈接特性,如圖5所示,在不同網(wǎng)站地圖中這是不可能的。該向下鉆能力依賴于互相關(guān)的標題經(jīng)常在網(wǎng)頁的文本中群集在彼此周圍的事實。這樣,例如,諸如“教育”、“學?!薄ⅰ靶『ⅰ焙汀敖淌摇钡认嚓P(guān)主題經(jīng)常群集在網(wǎng)頁上詞“教師”的周圍。這允許已經(jīng)從主視圖10點擊到針對主題“教師”的第一后續(xù)視圖18的搜索者回顧在該網(wǎng)頁上的所有其他關(guān)鍵主題,包括那些最緊密相關(guān)的,然后點擊到針對網(wǎng)頁上的任意其他關(guān)鍵主題的第一后續(xù)視圖。這允許無限地鉆過網(wǎng)站,在主題和網(wǎng)頁之間點擊,而不需返回到主視圖或網(wǎng)站地圖,從而提供了在網(wǎng)站內(nèi)導航的顯著改進的技術(shù)。相反,傳統(tǒng)網(wǎng)站地圖將需要用戶點擊回到網(wǎng)站地圖以點擊到針對網(wǎng)站上的另一主題的網(wǎng)頁。除此之外,通過提供相關(guān)視圖網(wǎng)頁,用戶能夠有利地進行網(wǎng)站間搜索和導航。
圖6示出了當在圖1和2和3的導航網(wǎng)頁之間導航時能夠使用的不同導航路線。從初始主視圖,優(yōu)選地,以最重要的主題開始,可以使用按鈕“第一個”、“下一個”、“前一個”和“最后一個”來對主視圖中的關(guān)鍵主題的列表進行導航。選擇主視圖中的主題標識符使得后續(xù)視圖網(wǎng)頁得以呈現(xiàn),并且可以利用“第一個”、“下一個”、“前一個”和“最后一個”按鈕對另外的后續(xù)視圖網(wǎng)頁進行導航,優(yōu)選地,針對在主視圖中預先選擇的主題,從最重要的網(wǎng)頁導航到最不重要的網(wǎng)頁。在后續(xù)視圖中選擇“主視圖”按鈕返回到針對該網(wǎng)站的主視圖。在任意后續(xù)或主視圖中選擇“相關(guān)視圖”按鈕33導航到相關(guān)視圖網(wǎng)頁,從中可以使用“第一個”、“下一個”、“前一個”和“最后一個”按鈕來導航該相關(guān)網(wǎng)站的列表,優(yōu)選地,從最相似的網(wǎng)站開始。在相關(guān)視圖中選擇任意相關(guān)的網(wǎng)站標識符(通常為URL)將導航到針對相關(guān)網(wǎng)站的主視圖,而在主視圖中選擇“相關(guān)視圖”按鈕將導航到相似網(wǎng)站的相關(guān)視圖,優(yōu)選地,從最相似的網(wǎng)站開始。
圖7示出了構(gòu)造圖1和2和3中的指南的步驟。實際上,將通過適當處理器(未示出)中的指南創(chuàng)建/分析軟件來執(zhí)行這些步驟。第一步驟是完整地并綜合地分析感興趣的網(wǎng)站以識別關(guān)鍵主要的主題。為此,首先將來自每一個目標網(wǎng)站的可訪問網(wǎng)頁的一些或全部從其設(shè)置于其上的基于服務器或計算機的處理器下載40到包括分析軟件的處理器。然后,對每一個網(wǎng)頁進行分析42以識別關(guān)鍵主題。然后,確定44每一個關(guān)鍵主題的重要性,并比較主題的分布圖。最后,使用該信息來產(chǎn)生指南46。更具體地,對網(wǎng)站的每一個網(wǎng)頁進行處理(僅一次)以提取重要主題。這確保了在每一個網(wǎng)頁上的關(guān)鍵主題僅在每一個網(wǎng)頁上識別和記錄一次。將互斥的、彼此完備的處理應用于網(wǎng)站上的所有可訪問內(nèi)容。該處理不會在不同的內(nèi)容格式之間進行區(qū)分。因此,與主體文本相同地對格式化為題頭的文本進行處理以消除當用戶略讀網(wǎng)頁時可能會出現(xiàn)的理解偏差。
為了識別關(guān)鍵主題,所使用的基本技術(shù)將處理網(wǎng)站上的每一個詞,并且將可能主題的數(shù)量連續(xù)地從完整的詞內(nèi)容減小到可管理的水平,從而突顯關(guān)鍵主題。圖8示出了在識別關(guān)鍵主題的示例方法中所采用的步驟。這涉及到識別單個關(guān)鍵詞的初始簡化列表48;修改該簡化列表以包括多個單詞的短語50;排除單個單詞,除了從簡化列表中一些所選的單個單詞之外52;根據(jù)主題在網(wǎng)站中的出現(xiàn)頻率來分配重要性量度54;以及根據(jù)重要性量度來分配等級56。圖9更詳細地示出了用于識別初始簡化列表的更詳細的步驟。這涉及到對網(wǎng)站中的每一個詞的出現(xiàn)數(shù)量進行計數(shù)58;將這些數(shù)量與針對按照整體上的網(wǎng)站的特定語言(例如英語)、或該語言的子集的每一個詞的平均頻率進行比較60,并且選擇具有以上平均出現(xiàn)頻率的這些詞62。
一旦確定了初始簡化列表,則采用多種技術(shù)來縮減所包括的關(guān)鍵主題的數(shù)量。這是必須的,因為傳統(tǒng)搜索引擎技術(shù)具有有限的精度和相關(guān)性,通常包括對于網(wǎng)站的特定內(nèi)容并非真正地關(guān)鍵的簡化列表中的短語。一種簡化關(guān)鍵主題的技術(shù)是搜索并包括多個單詞的短語。這通過以下方式來實現(xiàn)定位在單詞在網(wǎng)站上的初始簡化列表中的每一次出現(xiàn),并且從網(wǎng)站中提取并添加后續(xù)單詞以形成針對每一個關(guān)鍵詞64的關(guān)鍵短語,如圖10所示。對這些關(guān)鍵短語的每一個的出現(xiàn)進行計數(shù)66,并且選擇具有最高頻率的這些短語并包括在列表中68。
在分析多個詞的短語并添加到列表中之后,排除在列表上的一些單個單詞的標題。這是因為通常與多個單詞的標題相比,單個單詞標題傳遞了較少特別的信息給用戶,并因而對于想要快速識別特定信息的用戶而言較為不相關(guān)。例如,將第二、或許為描述性的單詞添加到單個單詞上顯著地提升了其含義,例如“化學教師”與只有“教師”相比傳遞了與教師有關(guān)的更多信息,并因而將化學教師保持為更為具體,并因而是與教師相比可能更為相關(guān)的主題。然而,一些單個單詞的特例被保留。例如,作為諸如人名、地名或產(chǎn)品等專有名詞的主題由其大寫字母的使用來識別并包括在內(nèi),因為這些經(jīng)常會涉及專有或個人信息,例如商品名、或諸如CEO等重要人物的名稱,這可以表示主管或研究員要找到的重要主題。在標準詞典中未包括的詞也可以被保留。這是因為在詞典中并未包括的任意單詞橫可能為高度專用的或不常見的,因此非??赡艿氖沁@將與該網(wǎng)站相關(guān),無論網(wǎng)站的特定內(nèi)容。
網(wǎng)站分析還排除了在簡化列表中并不與至少一個其他主題相關(guān)的主題,如圖11所示。為此,該分析涉及到確定與網(wǎng)站中已識別的多個關(guān)鍵主題的每一個相關(guān)的單詞列表;以及確定每一個關(guān)鍵主題是否出現(xiàn)在針對網(wǎng)站中的任意其他關(guān)鍵主題的相關(guān)單詞列表中。然后,丟棄其中關(guān)鍵主題并未出現(xiàn)在針對任意其他關(guān)鍵主題的相關(guān)單詞列表中的任意關(guān)鍵主題。可以使用詞典或辭典或其他方法來確定相關(guān)單詞。作為示例,在與“教師”相關(guān)的網(wǎng)站上,主題“運輸”沒有與其他與教師相關(guān)的關(guān)鍵主題的任一個的明顯相關(guān)性,并因而被排除,而,簡化列表中的“班級”的主題將被識別為與“教師”相關(guān)(還可以是簡化列表中的其他主題),并因而將包括在內(nèi)。類似地,盡管其并未表現(xiàn)為與“教師”相關(guān),但是可能與“教育”松散地相關(guān)的單詞也可以包括在內(nèi),構(gòu)建其相關(guān)性逐漸減小的關(guān)鍵主題列表是可行的(traversed),但是其主要排除了無關(guān)主題。
測試相關(guān)關(guān)鍵詞的優(yōu)點在于該過程可以通過去除無關(guān)的主題來增加結(jié)果的精度,同時消除了預先知道正在分析的網(wǎng)站的內(nèi)容以選擇所有其他網(wǎng)站必須與其相關(guān)的初始關(guān)鍵詞的傳統(tǒng)要求。這是因為利用標準詞典針對簡化主題列表中的單詞的彼此關(guān)系而對簡化列表中的所有可能主題單詞進行了測試,而非針對通過預先知道網(wǎng)站內(nèi)容而選擇的關(guān)鍵單詞的關(guān)系進行測試??蛇x地,可以對簡化主題列表的子集進行測試以簡化所需的處理。
搜索過程適合于為相對于諸如網(wǎng)頁上的有界框(隱藏或可見)等格式化元素具有較大位置變化的主題提供優(yōu)先。這是因為并非真正主題的許多單詞出現(xiàn)在許多或所有網(wǎng)頁的相同位置中,例如,在每一個網(wǎng)頁的相同位置處重復的橫幅或按鈕條中。這些可能會在傳統(tǒng)搜索中錯誤地出現(xiàn),傳統(tǒng)搜索僅依賴于出現(xiàn)頻率。然而,真正主題的特征在于其經(jīng)常分散在文本中間,而非文檔的一個特定位置處。結(jié)果,對主題相對于通常圍繞橫幅和按鈕條的格式化元素的位置變化的檢查趨向于從簡化列表中排除一些這樣的靜態(tài)定位的元素。
一旦確定了網(wǎng)站的所有網(wǎng)頁上的關(guān)鍵主題的簡化列表,則對預先記錄的每一個網(wǎng)頁的內(nèi)容逐網(wǎng)頁地再次分析,識別針對最終簡化列表中的主題的等級最高的那些網(wǎng)頁。同時,還對每一個網(wǎng)頁進行處理以在每一個網(wǎng)頁上產(chǎn)生關(guān)鍵主題的逐網(wǎng)頁的標題列表。然后,使用該簡化列表來產(chǎn)生所有主視圖并使用逐網(wǎng)頁的主題列表來產(chǎn)生所有后續(xù)視圖。為了提供主題等級,使用每一個主題的出現(xiàn)率來分配對該主題的重要性量度。這通過對網(wǎng)站上作為整體提到特定主題的實例數(shù)進行計數(shù)來實現(xiàn)。優(yōu)選地,將重要性量度表達為作為整體的網(wǎng)站上的單詞總數(shù)的百分比或可選地表達為所有關(guān)鍵主題單詞的實例和的百分比。
當確定了每一個主題的重要性的測量值時,使用其來構(gòu)造指南或地圖的主視圖10。通常,將最重要的主題出現(xiàn)在關(guān)鍵主題列表的頂部,如圖1所示。由此,本發(fā)明具體實現(xiàn)的指南提供了非常簡單有效的機制來使用戶能夠?qū)W(wǎng)站進行導航。理想地,當訪問網(wǎng)站時,將指南或地圖自動地提供給用戶而無需用戶啟動關(guān)鍵詞搜索。為了確保地圖是最新的,應該定期地對網(wǎng)站進行分析。
總之,分析該網(wǎng)站的總體策略如下通過對每一個單詞在網(wǎng)站中的出現(xiàn)次數(shù)進行計數(shù)來識別單個關(guān)鍵詞的初始簡化列表;將每一個單詞的出現(xiàn)次數(shù)與按照該網(wǎng)站語言的每一個單詞的平均頻率進行比較;在網(wǎng)站上或在大量網(wǎng)站上或按照目標語言,選擇與平均值相比具有最高頻率的那些單詞。一旦這樣做之后,通過以下方式修改簡化列表以包括多個單詞的短語定位單詞在網(wǎng)站的簡化列表中的每一個出現(xiàn)并提取且添加網(wǎng)站上的后續(xù)單詞以形成針對每一個關(guān)鍵詞的關(guān)鍵短語;對網(wǎng)站中的每一個關(guān)鍵短語的出現(xiàn)次數(shù)進行計數(shù)并選擇網(wǎng)站上具有最高頻率的那些短語。然后,從簡化列表中排除單個單詞,除了專有名詞或單詞、在詞典中不存在的單詞、或與簡化列表中的其他單詞相關(guān)的單詞。然后,根據(jù)其在網(wǎng)站中的出現(xiàn)率對這些短語分配等級,并且選擇最高等級的短語且將其包括在作為整體的網(wǎng)站的最終關(guān)鍵主題列表中。之后,從先前記錄的信息對每一個網(wǎng)頁的內(nèi)容逐網(wǎng)頁地進行再次分析,識別針對最終簡化列表中的每一個主題具有最高重要性的那些網(wǎng)頁。然后,在逐網(wǎng)頁的關(guān)鍵主題列表中對網(wǎng)頁上的簡化列表中的所有其他關(guān)鍵主題進行記錄,將其用來在稍后的過程中產(chǎn)生后續(xù)視圖。一旦這樣做之后,可以產(chǎn)生指南的主視圖和后續(xù)視圖。
可以將確定主題分布圖的上述技術(shù)應用于多個不同的網(wǎng)站,并且這些分布圖可以用來識別相似度。一旦已經(jīng)針對多于一個的網(wǎng)站上的每一個關(guān)鍵主題確定了重要性量度,則可以通過依次選擇每一個網(wǎng)站、然后依次選擇每一個其他網(wǎng)站來形成一系列(目標網(wǎng)站、候選網(wǎng)站)對來比較所得到的主題分布圖。然后,通過選擇目標分布圖中的每一個主題、將該主題的重要性量度與候選網(wǎng)站中的相同或相似主題(如果其存在)的重要性量度進行比較,來比較針對這些對中的每一個的主題分布圖。這由圖12所示。在優(yōu)選實施例中,這可以相當簡單地實現(xiàn),因為作為上述分布圖構(gòu)建過程的一部分對重要性量度進行歸一化,從而使重要性量度通常表達為預定特性的百分比或分數(shù)。然后,可以計算重要性的總計量度,其是在兩個網(wǎng)站共用的所有主題上的比較值的總計。作為對此的變化,除了使用先前所述而產(chǎn)生的主題分布圖之外,目標分布圖可以是手工分布圖,包含多于一個的主題且可以包括主題對作為整體的目標網(wǎng)站的重要性量度。
為了對主題分布圖進行比較,首選和最簡單的方法是對兩個分布圖共用的主題進行計數(shù)。第二種、可能是更為精確的方法如圖13所示。這涉及對目標分布圖70和第一候選網(wǎng)站分布圖72進行選擇。然后,優(yōu)選地從目標分布圖中的最重要的主題開始,選擇對候選分布圖共用的該分布圖中的每一個主題74,并且與候選網(wǎng)站中的相同或相似主題進行比較。特別地,對兩個分布圖中的重要性的主題量度的幅度(例如主題單詞頻率)進行比較,如圖12所示。這提供了在正在被比較的兩個網(wǎng)站上、針對這些分布圖的該主題的相似性的比較值。針對目標分布圖中的所有關(guān)鍵主題對此進行重復76。然后,通過對正在被比較的兩個網(wǎng)站上的針對所有公共主題的比較的大小進行求和,可以實現(xiàn)對總計比較值的獲取。然后,針對所有候選網(wǎng)站重復該過程78。
一旦已經(jīng)識別了關(guān)鍵主題,則可以產(chǎn)生針對指南的主要、后續(xù)和相關(guān)視圖。圖14、15和16示出了這樣做的步驟。為此,首先必須產(chǎn)生三個網(wǎng)頁模板,一個針對主視圖,如圖1所示,一個針對后續(xù)視圖,作為圖2所示的網(wǎng)頁;以及一個針對相關(guān)視圖,作為圖3所示的網(wǎng)頁。這些模板可以采用任意所需的形式或布局或設(shè)計。
一旦提供了這些模板,則可以使用其來產(chǎn)生指南。如圖14所示,產(chǎn)生主視圖網(wǎng)頁涉及選擇針對圖1的網(wǎng)頁模板結(jié)構(gòu),即,主視圖網(wǎng)頁布局(HTML碼)80。然后,優(yōu)選地,從關(guān)鍵主題列表中的最重要主題開始,將每一個主題和等級作為HTML碼插入在模板82中。然后,將網(wǎng)頁公布到所得到的網(wǎng)站84。對此進行重復,直到已經(jīng)將所有關(guān)鍵主題插入到模板中為止86。圖15示出了產(chǎn)生后續(xù)視圖網(wǎng)頁的步驟。這可以在產(chǎn)生主視圖網(wǎng)頁之后進行,并且首先涉及到針對圖2的網(wǎng)頁布局(HTML碼)選擇網(wǎng)頁模板結(jié)構(gòu)88。然后,優(yōu)選地,從針對每一個主題的最重要的網(wǎng)頁開始,將來自逐網(wǎng)頁的關(guān)鍵主題列表的關(guān)鍵主題和相應等級作為HTML碼插入到模板中90。然后,將該網(wǎng)頁公布到所得到的網(wǎng)站92。對此進行重復,直到已經(jīng)將針對關(guān)鍵主題的所要網(wǎng)頁插入到模板為止94,然后,針對簡化列表96中的所有其他關(guān)鍵主題重復整個過程96。最后,通過選擇適當?shù)木W(wǎng)頁模板結(jié)構(gòu)來產(chǎn)生相關(guān)的視圖網(wǎng)頁(如圖3所示),如圖16所示。然后,優(yōu)選地從與相關(guān)網(wǎng)站列表中的目標分布圖的最相似網(wǎng)站開始,將每一個網(wǎng)站和相似性作為HTML碼插入到模板中。然后,將網(wǎng)頁公布到所得到的網(wǎng)站。對此進行重復直到已經(jīng)將所有相關(guān)的網(wǎng)站插入到模板為止。
一旦創(chuàng)建了指南,則能夠?qū)⑵浒ǖ较嚓P(guān)的網(wǎng)站中或主持為單獨、鏈接的網(wǎng)站,由此,當選擇網(wǎng)站時或當用戶想要瀏覽該網(wǎng)站時,將其呈現(xiàn)給用戶。當然,對此進行實現(xiàn)的技術(shù)是本領(lǐng)域的技術(shù)人員所公知的。
本領(lǐng)域的技術(shù)人員將會意識到,在不脫離本發(fā)明的情況下,所公開的結(jié)構(gòu)的變體均為可能的。例如,可以將主頁或公司金融信息與圖1中的關(guān)鍵主題列表一起呈現(xiàn)在主視圖中。典型地,這將會示出對網(wǎng)站主頁的預覽,從而提供用戶正在查看正確的網(wǎng)站的快速可視指示。作為第二示例,后續(xù)視圖可以顯示該主題列表所涉及的網(wǎng)頁的網(wǎng)頁預覽,以允許用戶快速地評估該網(wǎng)頁是否授權(quán)進一步的調(diào)查,例如點擊活動網(wǎng)頁。作為另一可選方案,盡管主要參考網(wǎng)站和因特網(wǎng)對本發(fā)明進行了描述,但是將會意識到,這里所述的技術(shù)可以用來提供對基于文本的電子文檔的任意集合進行導航的機制。例如,該系統(tǒng)可以用于基于Windows的系統(tǒng)中,從而提供在本地PC上所存儲的所有基于文本的文檔的標題分布圖,而與格式無關(guān)。因此,以上對特定實施例的描述僅是示例性的而非限定性。對于本領(lǐng)域的技術(shù)人員顯而易見,在不對所述操作進行非常巨大的改變的情況下,可以進行各種少量修改。
權(quán)利要求
1.一種允許對諸如因特網(wǎng)或內(nèi)聯(lián)網(wǎng)網(wǎng)站之類的電子文檔組進行導航的交互/電子指南,所述指南用于自動地呈現(xiàn)多個主題標識符,和已識別的主題對所述組在整體上或部分上的重要性的指示,每一個主題是用戶可選的,其中對主題標識符進行呈現(xiàn),而無需用戶啟動關(guān)鍵詞搜索,且對給定主題的選擇提供了對所述組中關(guān)于所選主題的信息的訪問。
2.根據(jù)權(quán)利要求1所述的指南,其中主題按照預定次序呈現(xiàn),從而提供主題對所述組在整體上或部分上的重要性的指示。
3.根據(jù)權(quán)利要求2所述的指南,其中所述主題按照重要性的降序呈現(xiàn),最重要的主題呈現(xiàn)在列表的開始處,而最不重要的主題呈現(xiàn)在列表的末尾處。
4.根據(jù)權(quán)利要求1到3任一個所述的指南,其中所述主題標識符是一個或多個關(guān)鍵字或關(guān)鍵短語標識符。
5.根據(jù)權(quán)利要求1到4任一個所述的指南,其中提供圖形指示,以給出主題對所述組在整體上或部分上的重要性的可視指示。
6.根據(jù)權(quán)利要求5所述的指南,其中所述圖形標識符是橫條,其長度提供了相關(guān)主題對所述組在整體上或部分上的重要性的指示。
7.根據(jù)權(quán)利要求5或6所述的指南,其中所述圖形標識符是可選的,從而允許用戶選擇相關(guān)的主題。
8.根據(jù)權(quán)利要求1到7任一個所述的指南,其中對給定主題的選擇使得多個附加指南網(wǎng)頁之一得以呈現(xiàn)。
9.根據(jù)權(quán)利要求8所述的指南,其中在選擇任一主題或主題標識符時,所述指南用于使附加主題標識符的相似列表得以呈現(xiàn)或者使包含與所需主題相關(guān)的內(nèi)容的活動網(wǎng)頁得以呈現(xiàn)。
10.根據(jù)前述權(quán)利要求任一個所述的指南,其中所述指南用于呈現(xiàn)識別諸如以太網(wǎng)或內(nèi)聯(lián)網(wǎng)網(wǎng)站之類一個或多個相關(guān)的電子文檔組的相關(guān)組標識符,和第一組與每一個相關(guān)組的關(guān)鍵主題分布圖之間的相似性的指示或量度。
11.一種允許在諸如因特網(wǎng)或內(nèi)聯(lián)網(wǎng)網(wǎng)站之類例如萬維網(wǎng)的子集的電子文檔的組內(nèi)進行導航的方法,所述方法包括在屏幕或顯示器上自動呈現(xiàn)多個主題標識符,和已識別主題對所述組在整體上或部分上的相對重要性的指示;接收用戶對給定主題的選擇,并響應用戶的選擇,提供對關(guān)于所選主題的信息的訪問。
12.根據(jù)權(quán)利要求11所述的方法,包括呈現(xiàn)用于識別諸如以太網(wǎng)或內(nèi)聯(lián)網(wǎng)網(wǎng)站之類一個或多個相關(guān)的電子文檔組的相關(guān)組標識符,和第一組與每一個相關(guān)組的關(guān)鍵主題分布圖之間的相似性的指示或量度。
13.一種在諸如因特網(wǎng)或內(nèi)聯(lián)網(wǎng)網(wǎng)站之類例如萬維網(wǎng)子集的電子文檔的組內(nèi)進行導航的系統(tǒng),所述系統(tǒng)包括自動地在屏幕或顯示器上呈現(xiàn)多個主題標識符,和已識別主題對所述組在整體上或部分上的相對重要性的指示的裝置;用于接收用戶對給定主題的選擇的裝置;以及響應用戶的選擇提供對關(guān)于所選主題的信息的訪問的裝置。
14.根據(jù)權(quán)利要求13所述的方法,包括用于呈現(xiàn)識別諸如以太網(wǎng)或內(nèi)聯(lián)網(wǎng)網(wǎng)站之類一個或多個相關(guān)的電子文檔組的相關(guān)組標識符,和第一組與每一個相關(guān)組的關(guān)鍵主題分布圖之間的相似性的指示或量度的裝置。
15.一種優(yōu)選地位于數(shù)據(jù)載體上或其他一些計算機可讀介質(zhì)上的計算機程序,所述計算機程序用于產(chǎn)生在因特網(wǎng)或內(nèi)聯(lián)網(wǎng)等中使用的交互/電子指南,所述程序具有配置來實現(xiàn)以下功能的代碼或指令自動地呈現(xiàn)多個主題標識符和所述主題對文檔組在整體上或部分上的重要性的指示,每一個主題是用戶可選的,接收對給定主題的選擇,并響應主題選擇,提供對關(guān)于所選主題的信息的訪問。
16.根據(jù)權(quán)利要求15所述的計算機程序,其中所述計算機程序用于呈現(xiàn)識別諸如以太網(wǎng)或內(nèi)聯(lián)網(wǎng)網(wǎng)站之類一個或多個相關(guān)的電子文檔組的相關(guān)組標識符,和第一組與每一個相關(guān)組的關(guān)鍵主題分布圖之間的相似性的指示或量度。
17.一種在萬維網(wǎng)上或其他信息存儲器中定位信息組的方法,所述方法包括識別多個候選信息組;獲得針對每一個候選組的內(nèi)容分布圖;將第一候選組的分布圖與所述多個候選組中的每一個其他候選組進行比較,以便識別第一與其他候選組之間的分布圖上的任何差別。
18.根據(jù)權(quán)利要求17所述的方法,其中所述分布圖由多個主題構(gòu)成。
19.根據(jù)權(quán)利要求17或18所述的方法,其中每一個所述主題分配有所述主題對所述組在整體上或部分上的內(nèi)容的重要性量度。
20.根據(jù)權(quán)利要求19所述的方法,其中所述比較步驟包括對第一和其他候選組共用的主題數(shù)量進行計數(shù)。
21.根據(jù)權(quán)利要求17到20任一個所述的方法,其中所述比較步驟包括將針對所述第一候選組的每一個關(guān)鍵主題的重要性量度與其他候選組中的相同或相似主題的重要性量度進行比較。
22.根據(jù)權(quán)利要求17所述的方法,其中所述比較步驟包括計算所述第一和其他候選組之間共用的所有主題上的總計比較。
22.根據(jù)權(quán)利要求17到22任一個所述的方法,還包括針對任一個或多個候選組,自動地呈現(xiàn)多個主題標識符和已識別的主題的重要性的指示,每一個主題是用戶可選的,其中呈現(xiàn)所述主題標識符,而無需用戶啟動關(guān)鍵字搜索,并且對給定主題的選擇提供了對關(guān)于所選主題的信息的訪問。
23.一種在萬維網(wǎng)或其他信息存儲器上定位信息組的系統(tǒng),所述系統(tǒng)包括用于識別多個候選信息組的裝置;用于獲得針對每一個候選組的內(nèi)容的分布圖的裝置;以及用于將第一候選組與所述多個候選組中的每一個其他第二候選組進行比較的裝置。
24.根據(jù)權(quán)利要求23所述的系統(tǒng),其中所述比較裝置用于計算每一個候選組之間的主題分布圖上的任何差別。
25.根據(jù)權(quán)利要求23或24所述的系統(tǒng),其中所述獲得主題分布圖的裝置包括用于識別所述組中的多個關(guān)鍵主題的裝置。
26.根據(jù)權(quán)利要求23到25任一個所述的系統(tǒng),其中所述獲得關(guān)鍵主題的裝置包括分配所述主題對所述多個候選組在整體上或部分上的內(nèi)容的重要性量度的裝置。
27.根據(jù)權(quán)利要求23到26任一個所述的系統(tǒng),其中所述比較裝置包括用于將針對第一候選組的一個關(guān)鍵主題的重要性量度與第二候選組中的相同或相似主題的重要性量度進行比較的裝置。
28.根據(jù)權(quán)利要求23到27所述的系統(tǒng),其中所述比較裝置包括總計裝置,用于通過對針對所述主題分布圖中的每一個主題的各個差值進行求和,計算第一與其他候選組之間的分布圖之間的總計差值。
29.一種在萬維網(wǎng)或其他信息存儲器上的信息組之間和之內(nèi)進行導航的方法,包括在屏幕或顯示器上自動呈現(xiàn)多個組標識符,和已識別的組相對于所需主題分布圖的相似性的指示,每一個組是用戶可選的;接收用戶對給定組標識符的選擇,并響應用戶的選擇,提供對關(guān)于所選組的信息的訪問。
30.一種在萬維網(wǎng)或其他信息源上的信息組之間和之內(nèi)進行導航的方法,所述方法包括在屏幕或顯示器上自動呈現(xiàn)多個組標識符,和已識別的組對目標主題分布圖的相似性的指示的裝置,每一個組是用戶可選的;用于接收用戶對給定組標識符的選擇的裝置;以及響應用戶的選擇,提供對關(guān)于所選組的信息的訪問的裝置。
31.一種用于在萬維網(wǎng)等上定位網(wǎng)站或其他信息組的交互/電子指南,所述指南用于呈現(xiàn)多個組標識符,和每一個組對內(nèi)容主題的目標分布圖的相似性的指示,每一個組標識符是用戶可選的;其中對組標識符的選擇提供了對關(guān)于所選組的信息的訪問。
32.根據(jù)權(quán)利要求31所述的指南,其中所述組標識符按照預定次序呈現(xiàn),從而提供了所述組對目標分布圖的相似性的指示。
33.根據(jù)權(quán)利要求33所述的指南,其中所述組按照相似性的降序來呈現(xiàn),相對于目標分布圖最相似的組呈現(xiàn)在列表的開始處,而最不相似的組呈現(xiàn)在所述列表的結(jié)尾處。
34.根據(jù)權(quán)利要求31到33任一個所述的指南,其中提供圖形指示以提供對組相對于目標分布圖的相似性的可視指示。
35.根據(jù)權(quán)利要求34所述的指南,其中所述圖形標識符是可選的,從而允許用戶選擇相關(guān)組。
36.根據(jù)權(quán)利要求31所述的指南,其中所述指南用于通過選擇給定組,使多個附加定位網(wǎng)頁之一得以呈現(xiàn),優(yōu)選地,其中所述定位網(wǎng)頁包括多個主題標識符,優(yōu)選地以在所定位的組內(nèi)已識別的主題的重要性來排序,優(yōu)選地每一個主題是用戶可選的,優(yōu)選地對給定主題的選擇提供了對關(guān)于所選主題的信息的訪問。
37.一種優(yōu)選地位于數(shù)據(jù)載體上或一些其他計算機可讀介質(zhì)上的計算機程序,所述計算機程序用于產(chǎn)生在因特網(wǎng)或內(nèi)聯(lián)網(wǎng)網(wǎng)站之類上使用的系統(tǒng),所述具有配置來執(zhí)行以下功能的代碼或指令呈現(xiàn)多個組標識符,和所述組相對于所需主題分布圖的相似性的指示,每一個組是用戶可選的;接收對給定組的選擇,并且響應對所述組的選擇,提供對已定位組或相關(guān)信息的訪問。
38.一種對基于文檔的電子文檔的組或集合進行分布的方法,所述方法包括分析組中的每一個文檔以識別關(guān)鍵主題;將重要性量度分配給已識別的關(guān)鍵主題;以及使用所述量度來產(chǎn)生包括多個主題標識符的主題分布圖,和已識別每一個主題對所述組在整體上或部分上的重要性的指示。
39.根據(jù)權(quán)利要求38所述的方法,其中電子文檔的組包括網(wǎng)站的網(wǎng)頁。
40.根據(jù)權(quán)利要求39所述的方法,還包括下載網(wǎng)站的每一個網(wǎng)頁以便執(zhí)行分析步驟。
41.根據(jù)權(quán)利要求38或39所述的方法,其中所述分析文檔的步驟包括搜索特定單詞。
42.根據(jù)權(quán)利要求38到41任一個所述的方法,其中所述分析步驟包括搜索并消除與重要關(guān)鍵詞無關(guān)的主題。
43.根據(jù)權(quán)利要求42所述的方法,包括確定與組中已識別的多個關(guān)鍵主題的每一個相關(guān)的單詞列表;確定每一個關(guān)鍵主題是否出現(xiàn)于針對所述組中的其他關(guān)鍵主題的任一個的相關(guān)單詞的列表中,并丟棄關(guān)鍵主題并未出現(xiàn)于針對任意其他關(guān)鍵主題的相關(guān)單詞列表中的任意關(guān)鍵主題。
44.一種對基于文檔的電子文檔的組或集合進行分布的系統(tǒng),所述系統(tǒng)包括用于分析組中的每一個文檔以識別關(guān)鍵主題的裝置;用于將重要性量度分配給已識別的關(guān)鍵主題的裝置;以及使用所述量度產(chǎn)生包括多個主題標識符的主題分布圖,和已識別每一個主題對所述組在整體上或部分上的重要性的指示的裝置。
45.根據(jù)權(quán)利要求44所述的系統(tǒng),其中所述電子文檔的組包括網(wǎng)站的網(wǎng)頁。
46.根據(jù)權(quán)利要求45所述的系統(tǒng),其中還包括下載網(wǎng)站的每一個網(wǎng)頁以便進行分析的裝置。
47.根據(jù)權(quán)利要求45或46所述的系統(tǒng),其中所述分析裝置用于搜索對于網(wǎng)站擁有者的具有重要性的特定單詞。
48.根據(jù)權(quán)利要求44到47任一個所述的系統(tǒng),其中所述分析裝置用于搜索并消除與重要關(guān)鍵詞無關(guān)的主題。
49.根據(jù)權(quán)利要求48所述的系統(tǒng),其中包括用于確定與組中已識別的多個關(guān)鍵主題的每一個相關(guān)的單詞列表的裝置;用于確定每一個關(guān)鍵主題是否出現(xiàn)于針對所述組中的其他關(guān)鍵主題的任一個的相關(guān)單詞的列表中的裝置;以及丟棄關(guān)鍵主題并未出現(xiàn)于針對任意其他關(guān)鍵主題的相關(guān)單詞列表中的任意關(guān)鍵主題的裝置。
全文摘要
一種允許對諸如因特網(wǎng)或內(nèi)聯(lián)網(wǎng)網(wǎng)站等電子文檔組進行導航的交互/電子指南(10),所述指南用于自動地呈現(xiàn)多個主題標識符(14)已識別的主題在網(wǎng)站內(nèi)的重要性的指示(16),每一個主題(14,16)是用戶可選的。對給定主題(14,16)的選擇提供對關(guān)于該主題的信息的訪問。優(yōu)選地,該指南(10)還提供了可能通過內(nèi)容相關(guān)的多個網(wǎng)站有關(guān)的信息、以及對這樣的多個網(wǎng)站之間的內(nèi)容的相似性程度的指示。
文檔編號G06F17/30GK1777892SQ200480010784
公開日2006年5月24日 申請日期2004年4月23日 優(yōu)先權(quán)日2003年4月23日
發(fā)明者戴維·瓦特·斯蒂芬森 申請人:戴維·瓦特·斯蒂芬森
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
山阴县| 清远市| 临澧县| 金川县| 清新县| 明星| 海阳市| 江城| 莱州市| 峨眉山市| 文成县| 鄢陵县| 中江县| 黔西县| 萍乡市| 沂南县| 苏州市| 休宁县| 呼玛县| 久治县| 荔浦县| 马公市| 上高县| 麟游县| 临西县| 远安县| 九江市| 临江市| 永新县| 成武县| 宿迁市| 鹿邑县| 新闻| 东源县| 迁西县| 鄂州市| 晋江市| 英山县| 郎溪县| 嘉祥县| 灵石县|