專利名稱:信息處理裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及在web頁面瀏覽期間提供的補(bǔ)充服務(wù)。
背景技術(shù):
近來提出了在web頁面瀏覽期間提供的補(bǔ)充服務(wù)。例如,提出了服務(wù)提供系統(tǒng)(以 下稱為“興趣鏈接系統(tǒng)”),其用于顯示這樣的鏈接,該鏈接指向與當(dāng)前瀏覽的web頁面相關(guān) 的web頁面并且對應(yīng)于用戶的指令(涉及興趣或搜索方向)。興趣鏈接系統(tǒng)能夠推薦可引起 用戶興趣的web頁面。因此,這個系統(tǒng)可很好地提高web瀏覽的便利性。具體地,興趣鏈接 系統(tǒng)可減少用戶訪問該用戶非常感興趣的web頁面所必要的操作次數(shù),并因此適用于沒有 足夠的用戶接口功能的信息處理終端(例如移動終端)。然而,為了獲取推薦的web頁面, 興趣鏈接系統(tǒng)必須向搜索站點(diǎn)發(fā)送從用戶瀏覽的web頁面提取的關(guān)鍵字,并獲取搜索的結(jié) 果。根據(jù)這個結(jié)構(gòu),可發(fā)生這樣的情形,即,將從包括要保密的信息的web頁面提取關(guān)鍵字, 并且可能泄露至外部。日本專利申請?zhí)亻_No. 2008-117152公開了一種歷史信息顯示裝置,其中記錄了 關(guān)于裝置的操作單元的日志。在該裝置中,用戶可手動指定從日志排除某些數(shù)據(jù)。所指定 的數(shù)據(jù)不會被存儲在歷史信息顯示裝置中。因此,歷史信息顯示裝置可基于要從日志排除 的數(shù)據(jù)的手動指定來過濾信息。然而,對于用戶來說,執(zhí)行上述這樣的手動指定很繁瑣,因 此降低了對于用戶使用裝置的便利性。日本專利申請?zhí)亻_No. 2005-301759公開了一種搜索裝置,其基于關(guān)鍵字等執(zhí)行 爬行(crawling),并獲得關(guān)于內(nèi)容的信息。在爬行過程中,搜索裝置從搜索結(jié)果排除關(guān)于非 法內(nèi)容的信息。更具體地,該搜索裝置從爬行目標(biāo)排除不符合內(nèi)容提供規(guī)則的信息。這種 搜索裝置在服務(wù)器端過濾關(guān)于非法內(nèi)容的信息。即使對于興趣鏈接系統(tǒng)的一部分(例如搜 索站點(diǎn))應(yīng)用該公開的技術(shù),也不能夠抑制從要保密的web頁面提取的關(guān)鍵字向外部的泄 Mo
發(fā)明內(nèi)容
根據(jù)本發(fā)明一方面,提供一種信息處理裝置,包括監(jiān)視單元,被配置為監(jiān)視由瀏 覽器顯示的web頁面的轉(zhuǎn)換;確定單元,被配置為當(dāng)發(fā)生由瀏覽器顯示的web頁面的轉(zhuǎn)換時 確定當(dāng)前web頁面是否為特定類型的頁面;提取單元,被配置為當(dāng)所述當(dāng)前web頁面不是特 定類型的頁面時從所述當(dāng)前web頁面提取特征量;以及提供單元,被配置為使用所提取的 特征量提供與所述當(dāng)前web頁面相關(guān)的補(bǔ)充服務(wù)。根據(jù)本發(fā)明另一方面,提供一種信息處理裝置,包括確定單元,被配置為當(dāng)接收數(shù)據(jù)是web頁面時確定所述接收數(shù)據(jù)是否為特定類型的頁面;解析器,被配置為當(dāng)所述接 收數(shù)據(jù)是web頁面并且不是特定類型的頁面時分析所述接收數(shù)據(jù)并生成當(dāng)前web頁面;提 取單元,被配置為從所述當(dāng)前web頁面提取特征量;以及提供單元,被配置為使用所提取的 特征量提供與所述當(dāng)前web頁面相關(guān)的補(bǔ)充服務(wù)。根據(jù)本發(fā)明另一方面,提供一種信息處理裝置,包括獲取單元,被配置為獲取 web頁面;確定單元,被配置為確定所獲取的web頁面是否為特定類型的頁面;提取單元,被 配置為當(dāng)所獲取的web頁面不是特定類型的頁面時從所獲取的web頁面提取關(guān)鍵字;以及 生成單元,被配置為基于所述關(guān)鍵字生成搜索查詢。
圖1是示出根據(jù)第一實(shí)施例的信息處理裝置的框圖;圖2是示出圖1中所示的興趣鏈接引擎的一部分操作的流程圖;圖3是示出圖1中所示的興趣鏈接引擎的整個操作的流程圖;圖4是示出根據(jù)第二實(shí)施例的信息處理裝置的框圖;圖5是示出圖4中所示的頁面類型確定單元的操作的流程圖;以及圖6是示出圖4中所示的興趣鏈接引擎的操作的流程圖。
具體實(shí)施例方式將參照附圖描述本發(fā)明實(shí)施例。(第一實(shí)施例)如圖1所示,根據(jù)本發(fā)明第一實(shí)施例的信息處理裝置100包括瀏覽器110、興趣 鏈接引擎120和通信單元130。信息處理裝置100是可用于瀏覽web頁面的裝置,例如移動 電話、PC、便攜式媒體播放器、視頻游戲機(jī)、電視機(jī)。此外,信息處理裝置100具有處理器、存 儲器、顯示器等的基本硬件配置,盡管沒有將他們示出。瀏覽器110是安裝在信息處理裝置100中的軟件模塊。瀏覽器110可以是通用的 web瀏覽器。瀏覽器110具有等同于或類似于通用瀏覽器的功能。例如,瀏覽器110接受用 戶希望瀏覽的web頁面的URL (統(tǒng)一資源定位符),或經(jīng)由因特網(wǎng)、內(nèi)聯(lián)網(wǎng)或本地文件獲取具 有用戶所指定的URL的web頁面的源數(shù)據(jù)。此外,瀏覽器110解譯所獲取的源數(shù)據(jù),并適當(dāng) 地顯示字符、圖像等。此外,瀏覽器110可提供外部接口,用于使得數(shù)據(jù)的一部分或?yàn)g覽器 的功能能夠被其他應(yīng)用使用,或用于使得能夠向應(yīng)用報告瀏覽器的狀態(tài)。興趣鏈接引擎120是安裝在信息處理裝置100中的軟件模塊。興趣鏈接引擎120 向用戶提供關(guān)聯(lián)信息,其包括用于指示到當(dāng)前瀏覽的web頁面的關(guān)聯(lián)web頁面的鏈接的鏈 接信息。興趣鏈接引擎120可用其他補(bǔ)充服務(wù)提供引擎來代替。補(bǔ)充服務(wù)提供引擎使用當(dāng) 前瀏覽的web頁面的特征量,以提供任意補(bǔ)充服務(wù)。興趣鏈接引擎120包括瀏覽器操作監(jiān)視單元121、頁面類型確定單元122、關(guān)鍵字 提取單元123、操作接受UI (用戶接口)124、關(guān)聯(lián)信息生成單元125和結(jié)果顯示UI 126。瀏覽器操作監(jiān)視單元121監(jiān)視由瀏覽器110所顯示的web頁面的轉(zhuǎn)換(移動)。 例如,瀏覽器操作監(jiān)視單元121使用由瀏覽器110提供的接口,以預(yù)登記用于接收指示web 頁面的轉(zhuǎn)換的信號的回調(diào)。當(dāng)瀏覽器操作監(jiān)視單元121檢測到web頁面的轉(zhuǎn)換時,頁面類型確定單元122開始操作。當(dāng)由瀏覽器110所顯示的web頁面從一個web頁面轉(zhuǎn)換到另一個web頁面時,頁 面類型確定單元122確定所述另一 web頁面(以下稱為“當(dāng)前web頁面”)是否為特定類型 頁面。例如,頁面類型確定單元122通過使用由瀏覽器110提供的接口來獲取當(dāng)前web頁 面,并確定其是否為特定類型頁面。如果頁面類型確定單元122確定當(dāng)前web頁面不是特 定類型頁面,則其向關(guān)鍵字提取單元123發(fā)送關(guān)鍵字提取請求。隨后將給出頁面類型確定 單元122的確定處理、以及特定類型的頁面的詳細(xì)描述。關(guān)鍵字提取單元123從當(dāng)前web頁面的源數(shù)據(jù)提取特征量,例如關(guān)鍵字。例如,關(guān) 鍵字提取單元123使用由瀏覽器110提供的接口來獲取當(dāng)前web頁面的源數(shù)據(jù)。可使用各 種方法來提取特征量。特征量不限于關(guān)鍵字,也可以是圖像特征量或聲音特征量。然而,在 以下描述中,為了簡化假設(shè)特征量指示關(guān)鍵字。在關(guān)鍵字提取單元123完成關(guān)鍵字提取之 后,其向操作接受UI IM報告所述完成。操作接受UI IM接受用于生成關(guān)聯(lián)信息的用戶的指令操作。例如,操作接受UI IM在瀏覽器110的屏幕上顯示用于指示指令選擇的⑶I組件(按鈕、圖標(biāo)、軟鍵等)。操 作接受UI IM要接受的指令操作為例如用戶所請求的關(guān)聯(lián)信息的類別(新聞、購物、相片) 的選擇。操作接受UI IM向關(guān)聯(lián)信息生成單元125提供用于指示接受的指令操作的數(shù)據(jù)。 可在從關(guān)鍵字提取單元123接收報告之后顯示⑶I組件。替代地,最初可在非活動模式下 顯示⑶I組件,并且一旦接收到報告就轉(zhuǎn)換成活動模式。關(guān)聯(lián)信息生成單元125基于操作接受UI IM所接受的指令操作以及關(guān)鍵字提取 單元123所提取的關(guān)鍵字生成用于適當(dāng)搜索站點(diǎn)20的搜索查詢。搜索站點(diǎn)20是在web瀏 覽中普遍使用的任意搜索站點(diǎn)。用戶可以指定,或可以預(yù)定單個或多個搜索站點(diǎn)20。此外, 例如,關(guān)聯(lián)信息生成單元125可保持用于指示可由操作接受UI IM接受的指令操作的數(shù) 據(jù),以及與指令操作相應(yīng)的搜索站點(diǎn)的URL,并且可生成搜索查詢,用于請求與實(shí)際接受的 指令操作相應(yīng)的搜索站點(diǎn)的上述關(guān)鍵字的搜索。關(guān)聯(lián)信息生成單元125將生成的搜索查詢 發(fā)送至通信單元130。關(guān)聯(lián)信息生成單元125經(jīng)由通信單元130獲取與搜索查詢相應(yīng)的搜索結(jié)果。關(guān)聯(lián) 信息生成單元125分析搜索結(jié)果,并選擇適當(dāng)?shù)年P(guān)聯(lián)web頁面。關(guān)聯(lián)信息生成單元125在 預(yù)設(shè)規(guī)則下從搜索結(jié)果提取包括與所選關(guān)聯(lián)web頁面相關(guān)的鏈接信息的關(guān)聯(lián)信息,并向結(jié) 果顯示UI 1 輸入提取結(jié)果。例如,除了與關(guān)聯(lián)web頁面相關(guān)的鏈接信息以外,關(guān)聯(lián)信息 還可包括關(guān)于關(guān)聯(lián)web頁面的說明文本、關(guān)聯(lián)web頁面的主題、關(guān)聯(lián)web頁面的摘要、與關(guān) 聯(lián)web頁面關(guān)聯(lián)的縮略圖等。結(jié)果顯示UI 126顯示從關(guān)聯(lián)信息生成單元125獲得的關(guān)聯(lián)信息。例如,結(jié)果顯示 UI 126以使得指向關(guān)聯(lián)web頁面的鏈接能夠被選擇的格式在瀏覽器110的屏幕上顯示關(guān)聯(lián) 信息。當(dāng)用戶通過點(diǎn)擊或觸摸輸入確定關(guān)聯(lián)信息的選擇時,將關(guān)聯(lián)web頁面的URL發(fā)送至 瀏覽器110。隨后,瀏覽器110獲取并顯示關(guān)聯(lián)web頁面。通信單元130向網(wǎng)絡(luò)10 (例如因特網(wǎng)或內(nèi)聯(lián)網(wǎng))發(fā)送信息,并從網(wǎng)絡(luò)10接收信息。 具體地,通信單元130接收與瀏覽器110所指定的URL相應(yīng)的web頁面,并經(jīng)由網(wǎng)絡(luò)10將 從關(guān)聯(lián)信息生成單元125發(fā)送的搜索查詢發(fā)送到搜索站點(diǎn)20。通信單元130可支持各種通 信功能,包括經(jīng)由無線LAN和有線LAN實(shí)現(xiàn)的通信功能、紅外通信功能、短距離無線通信功能(例如藍(lán)牙)、和經(jīng)由通用串行總線(USB)實(shí)現(xiàn)的通信功能。現(xiàn)在參照圖2,將給出興趣鏈接處理的描述,其作為興趣鏈接引擎120的操作的一 部分。興趣鏈接處理通過并入在興趣鏈接引擎120中的關(guān)鍵字提取單元123、操作接受UI 124、和關(guān)聯(lián)信息生成單元125和結(jié)果顯示UIU6執(zhí)行。當(dāng)開始興趣鏈接處理時,關(guān)鍵字提取單元123從當(dāng)前web頁面提取關(guān)鍵字(步驟 S201)。之后,關(guān)鍵字提取單元123向操作接受UI IM發(fā)送報告關(guān)鍵字提取的完成的數(shù)據(jù), 從而起動操作接受UI 124(步驟S202)。操作接受UI IM接受來自用戶的指令操作(步驟 S203)。關(guān)聯(lián)信息生成單元125基于在步驟S201提取的關(guān)鍵字以及在步驟S203接受的指 令操作生成搜索查詢,并經(jīng)由通信單元130將搜索查詢發(fā)送至搜索站點(diǎn)20 (步驟S204)。關(guān) 聯(lián)信息生成單元125經(jīng)由通信單元130獲取對步驟S204發(fā)送的搜索查詢的搜索結(jié)果(步 驟S205)。基于在步驟S205獲取的搜索結(jié)果,關(guān)聯(lián)信息生成單元125生成關(guān)聯(lián)信息,并在例 如瀏覽器110的屏幕上顯示關(guān)聯(lián)信息(步驟S206),這是興趣鏈接處理的結(jié)束。然后參照圖3,將描述興趣鏈接引擎120的整個操作。作為實(shí)例,每當(dāng)執(zhí)行由瀏覽 器110顯示的web頁面的轉(zhuǎn)換時,開始圖3中所示的處理。在瀏覽器110進(jìn)行web頁面瀏覽期間,通過瀏覽器110獲取和顯示web頁面(步 驟S301)。瀏覽器操作監(jiān)視單元121檢測由瀏覽器110獲取和顯示的web頁面的轉(zhuǎn)換。當(dāng) 瀏覽器操作監(jiān)視單元121檢測到web頁面的轉(zhuǎn)換時,頁面類型確定單元122從瀏覽器110 獲取由瀏覽器110當(dāng)前顯示的web頁面的信息(步驟S302)。頁面類型確定單元122基于在步驟S302獲取的信息確定當(dāng)前web頁面是否為特 定類型的頁面(步驟S303)。如果當(dāng)前web頁面不是特定類型的頁面,則該處理進(jìn)行到步驟 S200。在步驟S200執(zhí)行的處理是圖2中所示的興趣鏈接處理。相反,如果當(dāng)前web頁面是 特定類型的頁面,則處理完成。在步驟S200的興趣鏈接處理可由任意補(bǔ)充服務(wù)提供處理來 代替,該補(bǔ)充服務(wù)提供處理通過使用當(dāng)前web頁面的特征量提供補(bǔ)充服務(wù)。將詳細(xì)描述頁面類型確定單元122的確定處理和特定類型的頁面。特定類型指示要保密的web頁面的類型。預(yù)設(shè)一定數(shù)量的特定類型。頁面類型確 定單元122確定當(dāng)前web頁面是否符合為各個預(yù)設(shè)特定類型所設(shè)置的確定標(biāo)準(zhǔn)之一,以獲 取確定結(jié)果。可將加密的web頁面(為了方便,以下還稱為“第一特定類型頁面”)限定為一種 特定類型的頁面。由于很可能第一特定類型頁面包含個人信息或與用戶相關(guān)的秘密信息, 所以應(yīng)使得第一特定類型頁面保密。例如,頁面類型確定單元122經(jīng)由瀏覽器110提供的 接口獲取當(dāng)前web頁面的URL,從而根據(jù)URL是否以“https // ”開始來確定當(dāng)前web頁面 是否為第一特定類型頁面。替代地,頁面類型確定單元122經(jīng)由瀏覽器110提供的接口獲 取用于接收當(dāng)前web頁面的端口號,從而根據(jù)端口號是否為“443”來確定當(dāng)前web頁面是 否為第一特定類型頁面。還替代地,頁面類型確定單元122經(jīng)由瀏覽器110提供的接口獲 取用于指示瀏覽器110是否基于加密算法執(zhí)行解密處理以解密當(dāng)前web頁面的信息,從而 根據(jù)該信息確定當(dāng)前web頁面是否為第一特定類型頁面。此外,可將當(dāng)被訪問時需要輸入密碼的web頁面(為了方便,以下還稱為“第二特 定類型頁面”)限定為另一種特定類型的頁面。由于很可能第二特定類型頁面以僅允許授權(quán)的用戶訪問頁面為目標(biāo),所以應(yīng)使得第二特定類型頁面保密。頁面類型確定單元122可 經(jīng)由瀏覽器110提供的接口獲取用于指示當(dāng)前web頁面是否要求BASIC驗(yàn)證、摘要驗(yàn)證等 的信息,從而根據(jù)所獲取的信息確定當(dāng)前web頁面是否為第二特定類型頁面。此外,可將從當(dāng)被訪問時需要密碼的web頁面轉(zhuǎn)換獲得的web頁面(為了方便,以 下還稱為“第三特定類型頁面”)限定為再一種特定類型的頁面。由于很可能第三特定類 型頁面是私人web頁面,例如用于成員的專屬使用、個人空間等的頁面,并且包含個人信息 和/或秘密信息,所以應(yīng)使得第三特定類型頁面保密。例如,在轉(zhuǎn)換到當(dāng)前web頁面之前上 一個訪問的web頁面中,瀏覽器110可提供這樣的接口,其用于保持基于用戶的操作所獲得 的,并指示是否向表格,例如專用于密碼輸入的文本框輸入了密碼(即,是否需要驗(yàn)證)的 信息,并用于外部地公開在當(dāng)前web頁面之前上一個web頁面中的驗(yàn)證已成功,從而實(shí)現(xiàn)到 當(dāng)前web頁面的轉(zhuǎn)換。如果瀏覽器110提供這樣的接口,則頁面類型確定單元122可從該 接口獲取用于指示在當(dāng)前web頁面之前的上一個web頁面中需要驗(yàn)證的信息,從而使用該 信息作為確定標(biāo)準(zhǔn)來確定當(dāng)前web頁面是否為第三特定類型頁面。此外,例如,瀏覽器110 可提供用于獲取其自身Cookie并將其進(jìn)行外部公布的接口。如果瀏覽器110提供這樣的 接口,則頁面類型確定單元122可從該接口獲取Cookie,并基于該Cookie檢測當(dāng)前web頁 面是否為需要密碼的web頁面。通過使用基于Cookie的檢測結(jié)果作為確定標(biāo)準(zhǔn),頁面類型 確定單元122可確定當(dāng)前web頁面是否為第三特定類型頁面。因此通過使用基于Cookie 的檢測結(jié)果作為確定標(biāo)準(zhǔn),不僅從需要密碼輸入的web頁面轉(zhuǎn)換到的web頁面,而且從例如 用于成員的專屬使用的頁面進(jìn)一步轉(zhuǎn)換到的私人頁面都被確定為第三特定類型頁面。此外,可將經(jīng)由內(nèi)聯(lián)網(wǎng)獲取的web頁面(為了方便,以下還稱為“第四特定類型頁 面”)限定為又一特定類型的頁面。由于很可能第四特定類型頁面僅允許有限用戶訪問,所 以應(yīng)使得第四特定類型頁面保密。頁面類型確定單元122可經(jīng)由瀏覽器110提供的接口獲 取當(dāng)前web頁面的URL,從而根據(jù)例如URL是否以“Y Y. ”開始來確定當(dāng)前web頁面是否為 第四特定類型頁面。通過將上述特定類型的頁面從關(guān)鍵字提取目標(biāo)中排除,可防止從要保密的web頁 面提取的關(guān)鍵字泄露。然而,所確定的特定類型頁面的web頁面一部分不會出現(xiàn)問題,即 使將他們看作提取目標(biāo)。例如,在僅用于成員的站點(diǎn)處用于新聞的web頁面可被確定為上 述第二或第三特定類型的頁面。然而,可廣泛公開內(nèi)容,或者用戶可希望獲得與其相關(guān)的信 息。使得這樣的web頁面可被指定為例外在提高用戶便利性方面是有用的。更具體地,可 在頁面類型確定單元122可訪問的存儲器中限定所謂的白列表。白列表可存儲例如指定為 例外的web頁面的部分或所有URL。白列表的內(nèi)容可通過用戶、或與興趣鏈接引擎120或信 息處理裝置100相應(yīng)的軟件模塊的設(shè)計者、制造商或銷售人員來設(shè)置。如果當(dāng)前web頁面 是上述指定的例外頁面之一,則頁面類型確定單元122向關(guān)鍵字提取單元123發(fā)送關(guān)鍵字 提取請求,即使確定了當(dāng)前web頁面是特定類型頁面之一。替代地,頁面類型確定單元122 可在特定類型頁面確定處理之前確定當(dāng)前web頁面是否為上述指定的例外頁面之一,如果 當(dāng)前web頁面是指定的例外頁面之一,則可省略特定類型頁面確定處理,并向關(guān)鍵字提取 單元123發(fā)送關(guān)鍵字提取請求。如上所述,在根據(jù)第一實(shí)施例的信息處理裝置中,在從當(dāng)前web頁面提取特征量 之前,確定當(dāng)前web頁面是否為特定類型頁面之一。如果當(dāng)前web頁面是特定類型頁面之一,則省略從當(dāng)前web頁面提取特征量。由此,第一實(shí)施例的信息處理裝置可抑制從要保密 的web頁面提取特征量以及向外部的泄露。此外,第一實(shí)施例的信息處理裝置的用戶不會 感覺到補(bǔ)充服務(wù)帶來的不適,該補(bǔ)充服務(wù)基于從要保密的web頁面提取的特征量(例如與 用戶相關(guān)的個人信息)提供給用戶。此外,如果當(dāng)前web頁面是要保密的web頁面,則第一 實(shí)施例的信息處理裝置可消除不必要的成本,例如提取特征量的計算成本、向外部發(fā)送搜 索查詢的通信成本。(第二實(shí)施例)如圖4所示,根據(jù)本發(fā)明第二實(shí)施例的信息處理裝置400包括瀏覽器110、興趣 鏈接引擎420和通信單元430。信息處理裝置400是可用于瀏覽web頁面的任意裝置,例如 移動電話、PC、便攜式媒體播放器、視頻游戲機(jī)、電視機(jī)。此外,信息處理裝置400具有處理 器、存儲器、顯示器等的基本硬件配置,盡管他們沒有示出。在與圖4相應(yīng)的以下描述中,通 過相應(yīng)標(biāo)號指示與圖1類似的元件,并且主要描述不同元件。通信單元430具有與圖1中所示的通信單元130等同或類似的功能,但是包括頁 面類型確定單元431。頁面類型確定單元431是安裝在信息處理裝置400中或通信單元430 中的軟件模塊。如果經(jīng)由網(wǎng)絡(luò)10由通信單元430接收的數(shù)據(jù)(以下簡稱為“接收數(shù)據(jù)”)指示web 頁面,則頁面類型確定單元431確定接收數(shù)據(jù)是否代表特定類型的頁面。與接收數(shù)據(jù)是否 代表web頁面相關(guān)的確定可通過頁面類型確定單元431或并入在通信單元430中的功能單 元(未示出)來執(zhí)行。在以下描述中,假設(shè)頁面類型確定單元431還確定接收數(shù)據(jù)是否代 表web頁面。如果接收數(shù)據(jù)未指示特定類型頁面,則頁面類型確定單元431向興趣鏈接引擎 420輸入接收數(shù)據(jù)。在第二實(shí)施例中,頁面類型確定單元431向?yàn)g覽器110輸入接收數(shù)據(jù), 不管接收數(shù)據(jù)是否代表特定類型頁面。相反,如果除了頁面類型確定單元431之外的功能 單元執(zhí)行與接收數(shù)據(jù)是否代表web頁面相關(guān)的確定,則僅當(dāng)接收數(shù)據(jù)代表web頁面時向?yàn)g 覽器110輸入接收數(shù)據(jù)。興趣鏈接引擎420包括關(guān)鍵字提取單元423、操作接受UI 124、關(guān)聯(lián)信息生成單 元125、結(jié)果顯示UI 1 和解析器427。解析器427分析從頁面類型確定單元431輸出的 接收數(shù)據(jù),以生成當(dāng)前web頁面。類似于上述關(guān)鍵字提取單元123,關(guān)鍵字提取單元423從當(dāng)前web頁面的源數(shù)據(jù)提 取關(guān)鍵字。例如,關(guān)鍵字提取單元423從解析器427獲取當(dāng)前web頁面的源數(shù)據(jù)。在關(guān)鍵 字提取單元423完成關(guān)鍵字提取之后,其向操作接受UI IM報告完成。應(yīng)注意,由于關(guān)鍵 字提取單元423可從解析器427獲取當(dāng)前web頁面的源數(shù)據(jù),所以瀏覽器110不必向關(guān)鍵 字提取單元423提供使得當(dāng)前web頁面的源數(shù)據(jù)能夠被外部使用的接口。然后參照圖5,將給出對頁面類型確定單元431的操作的描述。首先,頁面類型確定單元431獲取由通信單元430接收的數(shù)據(jù)(步驟S501)。頁面 類型確定單元431確定在步驟S501獲取的接收數(shù)據(jù)是否指示web頁面(步驟S5(^)。如 果在步驟S502確定接收數(shù)據(jù)代表web頁面,則處理進(jìn)行到步驟S503,然而如果在步驟S502 確定接收數(shù)據(jù)不代表web頁面,則處理完成。以下將詳細(xì)描述頁面類型確定單元431的確 定處理。
在步驟S503,頁面類型確定單元431確定在步驟S501中獲取的接收數(shù)據(jù)是否指 示特定類型頁面。如果在步驟S503確定接收數(shù)據(jù)代表特定類型頁面,則處理進(jìn)行到步驟 S505,然而如果確定接收數(shù)據(jù)不代表特定類型頁面,則處理進(jìn)行到步驟S504。在步驟S504,頁面類型確定單元431向興趣鏈接引擎420輸入在步驟S501獲取的 接收數(shù)據(jù),從而處理進(jìn)行到步驟S505。在步驟S505,頁面類型確定單元431向?yàn)g覽器110 輸入在步驟S501獲取的接收數(shù)據(jù),從而處理完成。作為頁面類型確定單元431的上述操作的結(jié)果,如果接收數(shù)據(jù)代表特定類型的 web頁面,則不將其輸入至興趣鏈接引擎420,盡管將其輸入至瀏覽器110。相反,接收數(shù)據(jù) 代表并非特定類型的web頁面,將其輸入至興趣鏈接引擎420和瀏覽器110兩者?,F(xiàn)在參照圖6,將描述興趣鏈接引擎420的操作。首先,在興趣鏈接引擎420中的解析器427從頁面類型確定單元431獲取接收數(shù) 據(jù)(步驟S601)。如上所述,該接收數(shù)據(jù)是web頁面,但并非特定類型。解析器427分析在 步驟S601獲取的接收數(shù)據(jù),并生成當(dāng)前web頁面(步驟S602)。關(guān)鍵字提取單元423、操作接受UI 124、關(guān)聯(lián)信息生成單元125和結(jié)果顯示UI 126 對于在步驟S602生成的當(dāng)前web頁面執(zhí)行興趣鏈接處理(步驟S200)。在步驟S200的興 趣鏈接處理可以是如圖2所示的處理,或者可由任意補(bǔ)充服務(wù)提供處理代替,該補(bǔ)充服務(wù) 提供處理通過使用當(dāng)前web頁面的特征量提供補(bǔ)充服務(wù)。將詳細(xì)描述頁面類型確定單元431的確定處理。具體地,將主要描述與頁面類型 確定單元122不同的這個處理的部分。頁面類型確定單元431可確定接收數(shù)據(jù)是否代表上述第一特定類型的頁面。 例如,頁面類型確定單元431從通信單元430獲取接收數(shù)據(jù)的URL,并根據(jù)URL是否以 “https://”開始來確定接收數(shù)據(jù)是否代表上述第一特定類型的頁面。替代地,頁面類型確 定單元431從通信單元430獲取用于接收當(dāng)前web頁面的端口號,從而根據(jù)端口號是否為 “443”來確定當(dāng)前web頁面是否為第一特定類型頁面。頁面類型確定單元431可確定接收數(shù)據(jù)是否代表上述第二特定類型的頁面。例 如,頁面類型確定單元431從通信單元430獲取接收數(shù)據(jù)的HTTP報頭,并分析HTTP報頭。 頁面類型確定單元431根據(jù)“401”是否被設(shè)置為HTTP報頭的響應(yīng)代碼來確定接收數(shù)據(jù)是 否代表上述第二特定類型的頁面。此外,頁面類型確定單元431可確定接收數(shù)據(jù)是否代表上述第三特定類型的頁 面。例如,瀏覽器110可提供用于獲取其自身Cookie并將其進(jìn)行外部公布的接口。如果瀏 覽器110提供這樣的接口,則頁面類型確定單元431可經(jīng)由接口獲取瀏覽器110的Cookie, 從而基于獲取的Cookie檢查當(dāng)前web頁面是否為需要密碼的web頁面。頁面類型確定單 元431可根據(jù)基于Cookie的檢查結(jié)果確定接收數(shù)據(jù)是否代表第三特定類型的web頁面。通 過由此使用基于Cookie的檢查結(jié)果作為確定標(biāo)準(zhǔn),甚至從例如僅專用于成員的頁面進(jìn)一 步轉(zhuǎn)換到的私人頁面(即指示私人頁面的接收數(shù)據(jù))可被確定為第三特定類型頁面,從需 要密碼輸入的web頁面轉(zhuǎn)換到的web頁面也是如此。此外,頁面類型確定單元431可確定接收數(shù)據(jù)是否代表上述第四特定類型的頁 面。例如,頁面類型確定單元431從通信單元430獲取向接收數(shù)據(jù)的源分配的IP地址,并根 據(jù)IP地址是否為全球IP地址來確定接收數(shù)據(jù)是否代表上述第四特定類型的頁面(如果IP地址是全球IP地址,則頁面類型確定單元431確定接收數(shù)據(jù)不指示第四特定類型頁面)。在頁面類型確定單元431可訪問的存儲器中,可限定上述白列表。白列表的內(nèi)容 可通過用戶、或與頁面類型確定單元431相應(yīng)的軟件模塊的設(shè)計者、制造商或銷售人員或 頁面類型確定單元431來設(shè)置。如果接收數(shù)據(jù)代表上述指定的例外頁面之一,則頁面類型 確定單元431將接收數(shù)據(jù)輸入至興趣鏈接引擎420,即使確定了當(dāng)前web頁面是特定類型頁 面之一。替代地,頁面類型確定單元431可在特定類型頁面確定處理之前確定接收數(shù)據(jù)是 否代表指定的例外頁面之一,如果接收數(shù)據(jù)代表指定的例外頁面之一,則可省略特定類型 頁面確定處理并向興趣鏈接引擎420輸入接收數(shù)據(jù)。如上所述,在根據(jù)第二實(shí)施例的信息處理裝置中,在分析接收數(shù)據(jù)以生成當(dāng)前web 頁面和從中提取特征量之前,確定接收數(shù)據(jù)是否代表其中一種特定類型的web頁面。如果 確定接收數(shù)據(jù)代表其中一種特定類型的web頁面,則省略特征量提取。因此,第二實(shí)施例的 信息處理裝置抑制從要保密的web頁面提取特征量以及特征量向外部的泄露。第二實(shí)施例 的信息處理裝置還抑制基于從要保密的web頁面提取的特征量(例如與用戶相關(guān)的個人信 息)向用戶提供補(bǔ)充服務(wù),從而抑制由于補(bǔ)充服務(wù)帶來的用戶的不適感覺。此外,在當(dāng)前 web頁面是要保密的web頁面時,第二實(shí)施例的信息處理裝置可消除不必要的成本,例如提 取特征量的計算成本、和向外部發(fā)送搜索查詢的通信成本。此外,由于第二實(shí)施例的信息處 理裝置執(zhí)行特定類型頁面的確定,而基本上無需從瀏覽器獲取信息,所以即使當(dāng)瀏覽器未 向外部提供接口時也是有用的。本發(fā)明不限于上述實(shí)施例,而是可以在不脫離范圍的情況下以各種方式修改。可 通過將實(shí)施例中公開的配置元素適當(dāng)組合來實(shí)現(xiàn)各個方面。例如,可刪除某些公開的配置 元素??蛇m當(dāng)?shù)亟M合不同實(shí)施例的某些配置元素。例如,可在計算機(jī)可讀存儲介質(zhì)中存儲用于實(shí)現(xiàn)每個實(shí)施例中的處理的程序???使用各種存儲介質(zhì),例如磁盤、光盤(⑶-ROM、⑶-R、DVD等)、磁光盤(例如M0)、和半導(dǎo)體存 儲器。如果存儲介質(zhì)是計算機(jī)可讀存儲介質(zhì)就已足夠。此外,用于實(shí)現(xiàn)每個實(shí)施例中的處理的程序可存儲在連接至網(wǎng)絡(luò)(例如因特網(wǎng)) 的服務(wù)器計算機(jī)中,并可經(jīng)由網(wǎng)絡(luò)從中下載至客戶端計算機(jī)。
權(quán)利要求
1.一種信息處理裝置,包括監(jiān)視單元,被配置為監(jiān)視由瀏覽器顯示的web頁面的轉(zhuǎn)換;確定單元,被配置為當(dāng)發(fā)生由瀏覽器顯示的web頁面的轉(zhuǎn)換時確定當(dāng)前web頁面是否 為特定類型的頁面;提取單元,被配置為當(dāng)所述當(dāng)前web頁面不是特定類型的頁面時從所述當(dāng)前web頁面 提取特征量;以及提供單元,被配置為使用所提取的特征量提供與所述當(dāng)前web頁面相關(guān)的補(bǔ)充服務(wù)。
2.如權(quán)利要求1所述的裝置,其中所述特定類型的頁面包括加密的web頁面。
3.如權(quán)利要求1所述的裝置,其中所述特定類型的頁面包括在訪問時需要密碼的web 頁面。
4.如權(quán)利要求1所述的裝置,其中所述特定類型的頁面包括從訪問時需要密碼的web 頁面轉(zhuǎn)換獲得的web頁面。
5.如權(quán)利要求1所述的裝置,其中所述特定類型的頁面包括經(jīng)由內(nèi)聯(lián)網(wǎng)獲取的web頁
6.如權(quán)利要求1所述的裝置,還包括存儲單元,被配置為存儲包括指定web頁面的白 列表,并且其中所述確定單元還確定所述當(dāng)前web頁面是否為所述指定web頁面,當(dāng)所述當(dāng) 前web頁面是所述指定web頁面時,所述提取單元從所述當(dāng)前web頁面提取特征量。
7.一種信息處理裝置,包括確定單元,被配置為當(dāng)接收數(shù)據(jù)是web頁面時確定所述接收數(shù)據(jù)是否為特定類型的頁解析器,被配置為當(dāng)所述接收數(shù)據(jù)是web頁面并且不是特定類型的頁面時分析所述接 收數(shù)據(jù)并生成當(dāng)前web頁面;以及提取單元,被配置為從所述當(dāng)前web頁面提取特征量;以及 提供單元,被配置為使用所提取的特征量提供與所述當(dāng)前web頁面相關(guān)的補(bǔ)充服務(wù)。
8.如權(quán)利要求7所述的裝置,其中所述特定類型的頁面包括加密的web頁面。
9.如權(quán)利要求7所述的裝置,其中所述特定類型的頁面包括在訪問時需要密碼的web 頁面。
10.如權(quán)利要求7所述的裝置,其中所述特定類型的頁面包括從訪問時需要密碼的web 頁面轉(zhuǎn)換獲得的web頁面。
11.如權(quán)利要求7所述的裝置,其中所述特定類型的頁面包括經(jīng)由內(nèi)聯(lián)網(wǎng)獲取的web頁
12.如權(quán)利要求7所述的裝置,還包括存儲單元,被配置為存儲包括指定web頁面的 白列表,并且其中所述確定單元還確定所述接收數(shù)據(jù)是否為所述指定web頁面,當(dāng)所述接 收數(shù)據(jù)是所述指定web頁面時,所述解析器分析所述接收數(shù)據(jù),并生成所述當(dāng)前web頁面。
13.一種信息處理裝置,包括 獲取單元,被配置為獲取web頁面;確定單元,被配置為確定所獲取的web頁面是否為特定類型的頁面; 提取單元,被配置為當(dāng)所獲取的web頁面不是特定類型的頁面時從所獲取的web頁面 提取關(guān)鍵字;以及生成單元,被配置為基于所述關(guān)鍵字生成搜索查詢。
14.如權(quán)利要求13所述的裝置,其中所述特定類型的頁面包括加密的web頁面。
15.如權(quán)利要求13所述的裝置,其中所述特定類型的頁面包括在訪問時需要密碼的 web頁面。
16.如權(quán)利要求13所述的裝置,其中所述特定類型的頁面包括從訪問時需要密碼的 web頁面轉(zhuǎn)換獲得的web頁面。
17.如權(quán)利要求13所述的裝置,其中所述特定類型的頁面包括經(jīng)由內(nèi)聯(lián)網(wǎng)獲取的web 頁面。
18.如權(quán)利要求13所述的裝置,還包括存儲單元,被配置為存儲包括指定web頁面的 白列表,并且其中所述確定單元還確定所獲取的web頁面是否為所述指定web頁面,當(dāng)所獲 取的web頁面是所述指定web頁面時,所述提取單元從所獲取的web頁面提取關(guān)鍵字。
全文摘要
一種信息處理裝置,包括監(jiān)視單元,被配置為監(jiān)視由瀏覽器顯示的web頁面的轉(zhuǎn)換;確定單元,被配置為當(dāng)發(fā)生由瀏覽器顯示的web頁面的轉(zhuǎn)換時確定當(dāng)前web頁面是否為特定類型的頁面;提取單元,被配置為當(dāng)所述當(dāng)前web頁面不是特定類型的頁面時從所述當(dāng)前web頁面提取特征量;以及提供單元,被配置為使用所提取的特征量提供與所述當(dāng)前web頁面相關(guān)的補(bǔ)充服務(wù)。
文檔編號G06F17/30GK102081639SQ201010135690
公開日2011年6月1日 申請日期2010年3月10日 優(yōu)先權(quán)日2009年11月30日
發(fā)明者小倉牧人 申請人:富士通東芝移動通信株式會社