欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

將圖像的縮略圖鏈接到網(wǎng)頁的制作方法

文檔序號:11450478閱讀:511來源:國知局
將圖像的縮略圖鏈接到網(wǎng)頁的制造方法與工藝

相關(guān)申請的交叉參考

本申請主張2015年4月17日遞交的標(biāo)題為“圖像到網(wǎng)頁的鏈接”的第62/062,715號美國臨時專利申請以及標(biāo)題為“圖像到網(wǎng)頁的鏈接縮略圖”的第14/690,163號美國專利申請的優(yōu)先權(quán),所述專利申請的全部內(nèi)容以引用的方式并入本文中。

本發(fā)明大體上涉及圖像處理,且更確切地說涉及處理在電子裝置中包含文本對象的圖像。



背景技術(shù):

近年來,例如智能電話、可佩帶計算機(jī)、平板計算機(jī)等電子裝置的使用已變得普遍。此類電子裝置通常配備有可以由用戶使用以捕獲并且存儲多種類型的場景和對象的照片的相機(jī)或相機(jī)模塊。一旦照片已經(jīng)被捕獲和存儲,則此類電子裝置可以允許用戶根據(jù)他或她的偏好查看和編輯照片。

常規(guī)的電子裝置還可以提供通過有線或無線通信網(wǎng)絡(luò)與外部服務(wù)器或裝置通信的功能。舉例來說,用戶可以操作此類電子裝置以為了信息而瀏覽互聯(lián)網(wǎng)并且在電子裝置上顯示信息。在顯示此類信息時,用戶可以捕獲所顯示的信息的圖像并且在電子裝置中存儲圖像。另外,用戶可以使用此類電子裝置以通過通信網(wǎng)絡(luò)從外部裝置或服務(wù)器中接收可包含文本的多個圖像(例如,照片)以用于存儲。

在存儲此類圖像之后,用戶可以隨后在電子裝置上選擇和查看圖像。在查看圖像之后,用戶可能為了與圖像相關(guān)的信息而想要搜索互聯(lián)網(wǎng)。然而,在此類情況下,用戶通常需要通過使用來自圖像的信息在互聯(lián)網(wǎng)上手動地執(zhí)行搜索操作來獲得信息。手動地執(zhí)行此類搜索操作對用戶來說可能是不方便的且費(fèi)時的。



技術(shù)實現(xiàn)要素:

本發(fā)明涉及鏈接圖像的縮略圖與具有與圖像內(nèi)容相似的內(nèi)容的至少一個網(wǎng)頁。

根據(jù)本發(fā)明的一個方面,公開了由用于鏈接圖像的縮略圖與至少一個網(wǎng)頁的電子裝置來執(zhí)行的方法。在此方法中,可以在存儲單元中存取包括至少一個文本區(qū)域的圖像。至少一個文本區(qū)域可以在圖像中被檢測到,且可以識別在至少一個文本區(qū)域中的至少一個字符串。基于至少一個字符串,隨后可搜索多個網(wǎng)頁??梢詮亩鄠€網(wǎng)頁中選擇至少一個網(wǎng)頁,且可以鏈接圖像的縮略圖與至少一個網(wǎng)頁。本發(fā)明還描述與此方法有關(guān)的設(shè)備、裝置、裝置的組合以及計算機(jī)可讀媒體。

根據(jù)本發(fā)明的另一方面,公開了用于鏈接圖像的縮略圖與至少一個網(wǎng)頁的電子裝置。電子裝置包括文本區(qū)域檢測單元、文本識別單元、網(wǎng)頁搜索單元、網(wǎng)頁選擇單元和圖像鏈接單元。文本區(qū)域檢測單元可經(jīng)配置以在存儲單元中存取包含至少一個文本區(qū)域的圖像并且檢測圖像中的至少一個文本區(qū)域。另外,文本識別單元可經(jīng)配置以在至少一個文本區(qū)域中識別至少一個字符串。網(wǎng)頁搜索單元可經(jīng)配置以基于至少一個字符串搜索多個網(wǎng)頁,并且網(wǎng)頁選擇單元可經(jīng)配置以從多個網(wǎng)頁中選擇至少一個網(wǎng)頁。圖像鏈接單元可經(jīng)配置以鏈接圖像的縮略圖與至少一個網(wǎng)頁。

附圖說明

在結(jié)合附圖閱讀時將參考以下詳細(xì)描述理解本發(fā)明的實施例。

圖1說明根據(jù)本發(fā)明的一個實施例的可經(jīng)配置以存儲和存取多個圖像的電子裝置。

圖2描繪了根據(jù)本發(fā)明的一個實施例在電子裝置中從相應(yīng)地與多個圖像相關(guān)聯(lián)的多個縮略圖中選擇縮略圖并且訪問與所選擇的縮略圖相關(guān)聯(lián)的網(wǎng)頁的流程圖。

圖3是根據(jù)本發(fā)明的一個實施例經(jīng)配置以鏈接圖像的縮略圖與具有與圖像內(nèi)容相似的內(nèi)容的至少一個網(wǎng)頁的電子裝置的框圖。

圖4說明根據(jù)本發(fā)明的一個實施例的由電子裝置來執(zhí)行的方法的流程圖,所述方法用于鏈接具有內(nèi)容的圖像的縮略圖與具有與圖像內(nèi)容相似的內(nèi)容的至少一個網(wǎng)頁。

圖5描述了根據(jù)本發(fā)明的一個實施例的網(wǎng)頁搜索單元的框圖,所述網(wǎng)頁搜索單元經(jīng)配置以從文本識別單元接收圖像的至少一個文本區(qū)域中的一或多個字符串,并且基于字符串搜索多個網(wǎng)頁。

圖6是根據(jù)本發(fā)明的一個實施例的網(wǎng)頁選擇單元的框圖,所述網(wǎng)頁選擇單元經(jīng)配置以接收與縮略圖相關(guān)聯(lián)的圖像中的內(nèi)容以及多個網(wǎng)頁的內(nèi)容,并且從多個網(wǎng)頁中選擇一或多個網(wǎng)頁。

圖7說明根據(jù)本發(fā)明的一些實施例的特征提取單元的框圖,所述特征提取單元經(jīng)配置以從圖像中提取第一特征,并且從已經(jīng)搜索的多個網(wǎng)頁中提取多個第二特征。

圖8是根據(jù)本發(fā)明的一個實施例的由電子裝置執(zhí)行的方法的流程圖,所述方法用于基于圖像的至少一個文本區(qū)域中的至少一個字符串搜索多個網(wǎng)頁并且從多個網(wǎng)頁中選擇至少一個網(wǎng)頁。

圖9描繪了根據(jù)本發(fā)明的一個實施例的電子裝置,所述電子裝置經(jīng)配置以訪問網(wǎng)頁并且捕獲網(wǎng)頁的圖像以用于將圖像的縮略圖鏈接到網(wǎng)頁。

圖10是根據(jù)本發(fā)明的一個實施例的由電子裝置執(zhí)行的方法的流程圖,所述方法用于捕獲網(wǎng)頁的圖像并且將圖像的縮略圖鏈接到網(wǎng)頁。

圖11說明了無線通信系統(tǒng)中的移動裝置的框圖,在所述無線通信系統(tǒng)中本發(fā)明的方法和設(shè)備可以根據(jù)一些實施例來實施,所述方法和設(shè)備用于鏈接圖像的縮略圖與針對圖像已經(jīng)搜索且選擇的至少一個網(wǎng)頁。

圖12是說明根據(jù)一些實施例來實施的服務(wù)器系統(tǒng)的框圖,所述服務(wù)器系統(tǒng)可以是先前描述的服務(wù)器中的任一個,用于搜索和提供包括一或多個對象、分類器數(shù)據(jù)庫、字符信息數(shù)據(jù)庫、詞典數(shù)據(jù)庫等的多個圖像。

具體實施方式

現(xiàn)在將對各種實施例詳細(xì)進(jìn)行參考,在附圖中說明所述實施例的實例。在以下詳細(xì)描述中,闡述眾多具體細(xì)節(jié)以便提供對本發(fā)明的透徹理解。然而,對于所屬領(lǐng)域的一般技術(shù)人員將顯而易見的是,可在無這些具體細(xì)節(jié)的情況下實踐本發(fā)明。在其它情況下,尚未詳細(xì)描述眾所周知的方法、程序、系統(tǒng)和組件,以便不會不必要地混淆各種實施例的各方面。

圖1說明根據(jù)本發(fā)明的一個實施例的可經(jīng)配置以存儲和存取多個圖像140、150和160的電子裝置120。圖像140、150和160可以由圖像傳感器捕獲并且存儲在電子裝置120的存儲單元中或者通過通信網(wǎng)絡(luò)從外部裝置接收。如本文中所說明,電子裝置120可為配備有有圖像處理能力的任何合適的裝置,例如,智能電話、數(shù)碼相機(jī)(例如,dslr相機(jī))、可佩帶計算機(jī)(例如,智能眼鏡、智能表等)、個人計算機(jī)、膝上型計算機(jī)、平板計算機(jī)、游戲裝置等。盡管電子裝置120被說明為包括圖像140、150和160,但是可以在電子裝置120的存儲單元中存儲任何合適數(shù)量的圖像或從外部裝置接收此類圖像。

圖像140、150和160可以包括例如文本對象(例如,包括文本的對象)和非文本對象(例如,并不包括文本的對象)的一或多個對象。在圖1中,圖像140、150和160中的每一個可以包括具有至少一個文本區(qū)域的文本對象(例如,文檔、網(wǎng)頁或文檔等)。舉例來說,圖像140可以包括具有多個文本區(qū)域142和144的文章,所述文本區(qū)域可以相應(yīng)地包括字符串“headline1”(例如,標(biāo)題、大標(biāo)題等)和“body1”(例如,正文、內(nèi)容、短語、句子、段落等)。類似地,圖像150可以包括具有多個文本區(qū)域152和154的文章,所述文本區(qū)域可以相應(yīng)地包括字符串“headline2”和“body2”。類似地,圖像160可以包括具有多個文本區(qū)域162和164的雜志的封面,所述文本區(qū)域可以相應(yīng)地包括字符串“magazine”和“author”。盡管圖像140、150和160被說明為例如文章和雜志的文檔,但是它們可以是包括或示出文本的任何對象或項目的圖像,例如,網(wǎng)頁或文檔、街道標(biāo)牌、地圖、菜單等等。

電子裝置120可經(jīng)配置以存取包括具有文本的至少一個對象的文本圖像140到160,并且在圖像140到160上執(zhí)行文本識別以識別圖像140到160中的每一個中的至少一個字符串。在一個實施例中,電子裝置120可以檢測圖像140到160中的每一個中的至少一個文本區(qū)域,并且識別在至少一個文本區(qū)域中的每一個中的至少一個字符串。舉例來說,電子裝置120可以檢測圖像140中的文本區(qū)域142和144,并且相應(yīng)地識別文本區(qū)域142和144中的字符串“headline1”和“body1”。

在識別圖像140到160中的每一個的至少一個字符串之后,電子裝置120可經(jīng)配置以基于至少一個所識別的字符串搜索多個網(wǎng)頁。在一個實施例中,電子裝置120可以通過從多個詞語中選擇至少一個詞語產(chǎn)生搜索查詢,所述詞語可以包含于圖像140到160中的每一個中的至少一個字符串中。舉例來說,電子裝置120可以使用任何合適的統(tǒng)計建模方法(例如,詞語n元語法、詞語直方圖或類似物)來確定在圖像140的至少一個字符串中所識別的詞語的出現(xiàn)的次數(shù),并且基于出現(xiàn)的次數(shù)從詞語中選擇至少一個詞語。在從圖像140中的至少一個字符串中選擇至少一個詞語之后,電子裝置120可以使用至少一個所選擇的詞語作為搜索查詢以使用任何合適的搜索引擎來搜索多個網(wǎng)頁,所述搜索引擎是由通信網(wǎng)絡(luò)內(nèi)部提供或外部提供的。如本文所使用,術(shù)語“網(wǎng)頁”可指代與地址(例如,url)相關(guān)聯(lián)的任何網(wǎng)絡(luò)文檔并且可以包括文本、圖像、地圖、視頻、或其任何組合,所述地址可使用瀏覽器應(yīng)用程序通過互聯(lián)網(wǎng)或內(nèi)聯(lián)網(wǎng)訪問?;谒阉?,電子裝置120可以檢索多個網(wǎng)頁,所述網(wǎng)頁中的每一個可以與圖像140、150和160中的每一個的搜索查詢中的一或多個詞語相關(guān)聯(lián)。

在針對圖像140到160中的每一個所檢索到的網(wǎng)頁中,電子裝置120可以從已經(jīng)產(chǎn)生的搜索查詢中選擇具有與圖像內(nèi)容相似的內(nèi)容的至少一個網(wǎng)頁。如本文所使用,術(shù)語“內(nèi)容”可指代任何包含于圖像或網(wǎng)頁中的數(shù)據(jù)或信息,并且也可以指示圖像或網(wǎng)頁中的對象(例如,文本對象、非文本對象等)的布局、特性或布置。舉例來說,圖像或網(wǎng)頁的內(nèi)容可以包括一或多個文本對象的詞語、字符大小、筆畫寬度、位置、類型等。術(shù)語“相似”或“相似度”可指代可預(yù)先確定的圖像與網(wǎng)頁的內(nèi)容之間的相似度的程度或值,所述程度或值超過相似度的特定程度或值。在一個實施例中,如參考圖7中的參考標(biāo)號720、730和740詳細(xì)描述的,圖像與網(wǎng)頁之間的相似度可以通過執(zhí)行自然語言處理來確定,例如,句法分析、詞匯分析和/或語義分析。舉例來說,電子裝置120可以搜索與圖像140中的字符串“headline1”相關(guān)聯(lián)的多個網(wǎng)頁,并且在網(wǎng)頁中選擇具有最高相似度的網(wǎng)頁。額外地或替代地,電子裝置120可以訪問多個網(wǎng)頁并且選擇具有超過閾值相似度值的相似度的程度或值的特定數(shù)量的網(wǎng)頁。

在針對圖像140到160中的每一個選擇至少一個網(wǎng)頁之后,電子裝置120可經(jīng)配置以鏈接圖像140到160中的每一個的縮略圖與至少一個網(wǎng)頁。在一個實施例中,電子裝置120可以產(chǎn)生原始圖像140、150和160的多個縮略圖,并且在電子裝置120的顯示屏上顯示縮略圖。如本文所使用,術(shù)語“縮略圖”可指代縮小尺寸的圖像或原始圖像的一部分。在一個實施例中,如果針對圖像已經(jīng)搜索和選擇的至少一個網(wǎng)頁的數(shù)量為一個,那么電子裝置120可以將圖像的縮略圖或例如所識別的字符串的縮略圖的一部分鏈接到網(wǎng)頁。在另一實施例中,如果已經(jīng)搜索和選擇了兩個或大于兩個網(wǎng)頁,那么電子裝置120可以產(chǎn)生所選擇的網(wǎng)頁的列表,所述網(wǎng)頁可隨后被鏈接到圖像的縮略圖或例如所識別的字符串的縮略圖的一部分。以此方式,圖1中的圖像140、150和160的每一個縮略圖或每一個縮略圖的一部分(例如,字符串)可以被鏈接到一或多個網(wǎng)頁。根據(jù)一些實施例,圖像的縮略圖或縮略圖中所識別的字符串可以通過以縮略圖的元數(shù)據(jù)形式將網(wǎng)頁的鏈接信息(例如,一或多個url或類似物)標(biāo)記到縮略圖而被鏈接到一或多個網(wǎng)頁。

一旦圖像的縮略圖或縮略圖中的一部分已經(jīng)被鏈接到一或多個網(wǎng)頁,則可以選擇縮略圖以訪問鏈接到縮略圖的一或多個網(wǎng)頁。圖2說明根據(jù)本發(fā)明的一個實施例在圖1中的電子裝置120中從相應(yīng)地與圖像140、150和160相關(guān)聯(lián)的多個縮略圖240、250和260中選擇縮略圖250,并且訪問與所選擇的縮略圖250相關(guān)聯(lián)的網(wǎng)頁220。首先,電子裝置120可以在電子裝置120的顯示屏210上顯示多個縮略圖240、250和260。在縮略圖240、250和260中,電子裝置120的用戶可以選擇包括多個文本區(qū)域252和254的縮略圖250。在一個實施例中,用戶可以在可以是觸敏屏的顯示屏210上選擇縮略圖250或縮略圖250的一部分(例如,在文本區(qū)域252或254中的字符串)。

在顯示屏210上選擇縮略圖250或縮略圖250的一部分之后,電子裝置120可以訪問已經(jīng)通過通信網(wǎng)絡(luò)鏈接到縮略圖250的網(wǎng)頁220,并且在顯示屏210上顯示網(wǎng)頁220。由于已經(jīng)基于與縮略圖250的相似度選擇且鏈接網(wǎng)頁220,所以網(wǎng)頁220的內(nèi)容可以基本上與縮略圖250的內(nèi)容相似并且包括縮略圖250的字符串“headline2”和“body2”。替代地,如果多個網(wǎng)頁被選擇且鏈接到縮略圖250,那么電子裝置120可以顯示與縮略圖250相關(guān)聯(lián)的網(wǎng)頁的列表。從網(wǎng)頁的列表中,用戶可以選擇網(wǎng)頁中的一個以訪問所選擇的網(wǎng)頁。

圖3是根據(jù)本發(fā)明的一個實施例經(jīng)配置以鏈接圖像的縮略圖與具有與圖像內(nèi)容相似的內(nèi)容的至少一個網(wǎng)頁的電子裝置120的框圖。電子裝置120可以包括圖像傳感器310、存儲單元320、i/o單元330、通信單元340和處理器350。處理器350可以包括縮略圖產(chǎn)生單元352、文本區(qū)域檢測單元354、文本識別單元356、網(wǎng)頁搜索單元358、網(wǎng)頁選擇單元360、網(wǎng)頁捕獲單元362和圖像鏈接單元364。電子裝置120可以經(jīng)由通信網(wǎng)絡(luò)370通過通信單元340與存儲一或多個圖像的多個外部裝置(例如,服務(wù)器或類似物)進(jìn)行通信。

圖像傳感器310可經(jīng)配置以捕獲例如文本對象或非文本對象的對象的圖像。圖像傳感器310可以為可用于捕獲、感測和/或檢測可包括文本的對象的圖像的任何合適的裝置。額外地或替代地,可以經(jīng)由i/o單元330從外部裝置中或經(jīng)由通信網(wǎng)絡(luò)370通過通信單元340接收包括文本的對象的圖像。

存儲單元320可經(jīng)配置以存儲包括文本的一或多個圖像、圖像的一或多個縮略圖以及圖像和縮略圖的元數(shù)據(jù)。圖像和縮略圖中的每一個可以包括一或多個文本區(qū)域,所述文本區(qū)域中的每一個包括文本,例如,至少一個字符串。如本文所使用,圖像或圖像的縮略圖的元數(shù)據(jù)可以指示描述圖像或縮略圖的數(shù)據(jù)或與圖像或縮略圖相關(guān)的數(shù)據(jù),并且包括圖像或縮略圖的大小信息、色深信息、分辨率信息、時間信息、配置信息等等。在一個實施例中,可以通過處理器350存取在存儲單元320中的包括文本的圖像和縮略圖以將圖像的縮略圖鏈接到與圖像中的文本相關(guān)聯(lián)的至少一個網(wǎng)頁。在此情況下,至少一個網(wǎng)頁的鏈接信息(例如,url或類似物)可以存儲為圖像或縮略圖的元數(shù)據(jù)。元數(shù)據(jù)可以允許用戶110響應(yīng)于縮略圖的選擇而訪問至少一個網(wǎng)頁。存儲單元320可以為遠(yuǎn)程或本地存儲裝置,且可以使用任何合適的存儲裝置或存儲器裝置來實施,例如ram(隨機(jī)存取存儲器)、rom(只讀存儲器)、eeprom(電可擦除可編程只讀存儲器)、快閃存儲器或ssd(固態(tài)驅(qū)動器)。

存儲單元320還可以存儲分類器數(shù)據(jù)庫,所述分類器數(shù)據(jù)庫可以對文本和/或非文本進(jìn)行分類以用于識別場景的圖像中的一或多個文本區(qū)域。在一個實施例中,分類器數(shù)據(jù)庫可以包括用于多種語言(例如,英語、法語等等)的多個概率模型,所述概率模型可用于確定給定文本與所述語言中的一個相關(guān)聯(lián)的概率。另外,存儲單元320可以存儲可用于識別與多種語言相關(guān)聯(lián)的至少一個字符串的字符信息數(shù)據(jù)庫。對于每一種語言,字符信息數(shù)據(jù)庫可以包括在語言中使用的多個字符的圖案或幾何數(shù)據(jù)、表示語言中的多個字符的符號的圖像和/或與語言中的每一個體符號相關(guān)聯(lián)的至少一個特征。為了識別至少一個字符串(例如,詞語),存儲單元320還可以存儲可包括多個詞語的多種語言的詞典數(shù)據(jù)庫。另外,存儲單元320可以存儲多個預(yù)先確定類型的字符串,例如,電話號碼、公司名稱、個人名稱、地址、電子郵件等。

i/o單元330可經(jīng)配置以從電子裝置120的用戶中接收命令和/或為用戶輸出信息。在一個實施例中,i/o單元330可以從用戶110接收命令或輸入以選擇圖像的多個縮略圖中的一個,所述縮略圖可以在i/o單元330中的顯示屏210(圖2中所說明)上顯示。舉例來說,用戶110可以在可以是觸敏屏的顯示屏210上觸控包括文本的縮略圖的一部分以選擇縮略圖。一旦在顯示屏210上選擇縮略圖,則與所選擇縮略圖鏈接的網(wǎng)頁可以顯示在顯示屏210上。在一些實施例中,i/o單元330可以從用戶接收命令或輸入以捕獲網(wǎng)頁的圖像,所述網(wǎng)頁當(dāng)前正在顯示屏210上顯示。如本文中所說明,i/o單元330可以是能夠接收命令和/或輸出信息的任何合適的裝置。在一個實施例中,i/o單元330可以包括輸入單元(例如,觸摸屏、按鈕、小鍵盤、觸控板或類似物)和輸出單元(例如,顯示屏210、揚(yáng)聲器、振動器或類似物)。

處理器350可經(jīng)配置以將圖像鏈接到具有與圖像內(nèi)容相似的內(nèi)容的至少一個網(wǎng)頁以用于響應(yīng)于選擇圖像的縮略圖而訪問至少一個網(wǎng)頁。為了鏈接圖像與至少一個網(wǎng)頁,存儲單元320可以存儲圖像和/或映射到至少一個網(wǎng)頁的鏈接信息的圖像的縮略圖。舉例來說,至少一個網(wǎng)頁的鏈接信息可以與縮略圖相關(guān)聯(lián)且存儲為縮略圖的元數(shù)據(jù)。響應(yīng)于縮略圖的選擇,可以經(jīng)由i/o單元330輸出至少一個網(wǎng)頁。

處理器350中的縮略圖產(chǎn)生單元352可經(jīng)配置以從存儲單元320中接收包括至少一個文本區(qū)域的一或多個圖像,并且產(chǎn)生圖像的一或多個縮略圖。在一個實施例中,縮略圖產(chǎn)生單元352可以調(diào)整圖像大小以產(chǎn)生圖像的縮略圖。舉例來說,圖像的縮略圖可以通過減小圖像的大小來產(chǎn)生。替代地,縮略圖產(chǎn)生單元352可以裁剪圖像的一部分以產(chǎn)生圖像的縮略圖。圖像的所產(chǎn)生的縮略圖可隨后存儲在與圖像以及縮略圖和/或圖像的元數(shù)據(jù)相關(guān)聯(lián)的存儲單元320中。

處理器350中的文本區(qū)域檢測單元354可經(jīng)配置以從存儲單元320中接收包含至少一個文本區(qū)域的一或多個圖像,并且檢測每一個圖像中的至少一個文本區(qū)域。給定具有至少一個文本區(qū)域的圖像,可使用任何合適的文本候選提取方案(例如,斑點聚集方法、基于邊緣的方法、基于連接的組件的方法、基于紋理的方法或類似物)來檢測圖像中的一或多個候選文本區(qū)域。在一個實施例中,文本區(qū)域檢測單元354可以將所檢測的候選文本區(qū)域中的一或多個識別為圖像中的一或多個文本區(qū)域。

在一些實施例中,在檢測圖像中的候選文本區(qū)域之后,文本區(qū)域檢測單元354可以從每一個候選文本區(qū)域中提取特征的集合。文本區(qū)域檢測單元354可隨后基于來自存儲單元320的分類器數(shù)據(jù)庫產(chǎn)生與每一個候選文本區(qū)域相關(guān)聯(lián)的用于特征的集合的分類評分。替代地,可以經(jīng)由通信網(wǎng)絡(luò)370通過通信單元340從外部裝置接收分類器數(shù)據(jù)庫?;谂c候選文本區(qū)域相關(guān)聯(lián)的分類評分,文本區(qū)域檢測單元354可以識別圖像中的至少一個文本區(qū)域。舉例來說,如果圖像中用于候選文本區(qū)域的分類評分超過了預(yù)定閾值評分,那么候選文本區(qū)域可以被識別為圖像中的文本區(qū)域??梢蕴峁┤缢R別的圖像中的至少一個文本區(qū)域到處理器350中的文本識別單元356。

另外,在識別一或多個圖像中的至少一個文本區(qū)域之后,文本區(qū)域檢測單元354可以確定表征圖像中的至少一個文本區(qū)域的文本區(qū)域信息。在一個實施例中,通過確定至少一個文本區(qū)域的字符大小、筆畫寬度、布局(例如,位置)等,文本區(qū)域檢測單元354可以產(chǎn)生用于至少一個文本區(qū)域的文本區(qū)域信息??呻S后將文本區(qū)域信息提供到處理器350中的網(wǎng)頁搜索單元358和網(wǎng)頁選擇單元360中的每一個。

處理器350中的文本識別單元356可經(jīng)配置以從文本區(qū)域檢測單元354中接收包括至少一個字符串的至少一個文本區(qū)域,并且在至少一個文本區(qū)域上執(zhí)行文本識別以識別至少一個文本區(qū)域中的至少一個字符串。在一個實施例中,文本識別單元356可以訪問存儲單元320中的字符信息數(shù)據(jù)庫以用于識別至少一個字符串??苫谧址畔?shù)據(jù)庫使用任何合適的字符識別方案(例如,矩陣匹配、特征匹配等)來識別至少一個字符串。

在一個實施例中,文本識別單元356可以識別至少一個文本區(qū)域中的至少一個字符串,方法是將從至少一個文本區(qū)域中所識別的字符信息與字符信息數(shù)據(jù)庫進(jìn)行比較。舉例來說,文本識別單元356可以識別至少一個文本區(qū)域中的圖案或符號,并且將圖案或符號與來自字符信息數(shù)據(jù)庫的多個字符的圖案或幾何數(shù)據(jù)進(jìn)行比較。在此情況下,如果確定一或多個所識別的圖案或符號與特定字符的圖案或幾何數(shù)據(jù)之間的相似度值超過了預(yù)定閾值,那么圖案或符號可被識別為特定字符。所識別的字符可隨后被識別為至少一個文本區(qū)域中的至少一個字符串。

文本識別單元356可經(jīng)配置以從至少一個文本區(qū)域中的所識別的至少一個字符串中檢測一或多個詞語。在一些實施例中,文本識別單元356可以檢測字符串作為至少一個文本區(qū)域中的詞語,方法是檢測任何合適的字符、符號或可在腳本中分隔或區(qū)分詞語的空格。舉例來說,當(dāng)字符串以空格結(jié)尾時可以檢測到文本區(qū)域中的詞語。可以將至少一個文本區(qū)域中的詞語與詞典數(shù)據(jù)庫進(jìn)行比較,所述詞典數(shù)據(jù)庫包括可以從存儲單元320中存取的多個詞語。如果在文本區(qū)域中所檢測到的詞語與詞典數(shù)據(jù)庫中的詞語中的一個相同或與詞典數(shù)據(jù)庫中的詞語中的一個相似,那么詞語可隨后被確定為至少一個文本區(qū)域中的至少一個字符串中的詞語。

網(wǎng)頁搜索單元358可經(jīng)配置以從文本識別單元356中接收圖像中的至少一個字符串并且基于至少一個字符串搜索多個網(wǎng)頁。在此過程中,網(wǎng)頁搜索單元358可以從至少一個字符串中產(chǎn)生搜索查詢,并且基于搜索查詢接收網(wǎng)頁。根據(jù)一個實施例,網(wǎng)頁搜索單元358可以從文本區(qū)域檢測單元354中接收圖像中的至少一個文本區(qū)域的文本區(qū)域信息,并且基于文本區(qū)域信息(例如,至少一個文本區(qū)域的字符大小、筆畫寬度、位置等)從至少一個字符串中產(chǎn)生搜索查詢。舉例來說,搜索查詢可以基于文本區(qū)域信息通過從可包括多個詞語的至少一個字符串中選擇至少一個詞語來產(chǎn)生。

在一些實施例中,為了產(chǎn)生搜索查詢,網(wǎng)頁搜索單元358可以基于圖像中每一個詞語出現(xiàn)的次數(shù)使用任何合適的統(tǒng)計建模方法(例如,詞語n元語法、詞語直方圖等)從可包含于至少一個字符串中的多個詞語中選擇至少一個詞語。額外地或替代地,網(wǎng)頁搜索單元358可以確定多個詞語是否指示預(yù)先確定類型的字符串,例如,電話號碼、公司名稱、個人名稱、地址、電子郵件等。如果一或多個詞語對應(yīng)于預(yù)先確定類型的字符串,那么可以選擇此類詞語并且用作搜索查詢。使用搜索查詢,網(wǎng)頁搜索單元358可以訪問和接收與圖像相關(guān)聯(lián)的網(wǎng)頁,所述網(wǎng)頁可以通過由通信網(wǎng)絡(luò)370內(nèi)部提供或外部提供的任何合適的搜索引擎搜索和/或可以存儲在存儲單元320中。

網(wǎng)頁選擇單元360可經(jīng)配置以接收與圖像中的至少一個字符串相關(guān)聯(lián)的網(wǎng)頁并且從網(wǎng)頁中選擇至少一個網(wǎng)頁。在一個實施例中,網(wǎng)頁選擇單元360可以確定圖像的內(nèi)容是否與網(wǎng)頁的內(nèi)容相似以從網(wǎng)頁中選擇至少一個網(wǎng)頁。舉例來說,網(wǎng)頁選擇單元360可以提取指示圖像中的至少一個文本區(qū)域的第一特征和指示網(wǎng)頁中的文本的多個第二特征。網(wǎng)頁選擇單元360可以將第一特征與每一個第二特征進(jìn)行比較以確定圖像與相關(guān)聯(lián)的網(wǎng)頁之間的相似度?;谙嗨贫?,可以選擇網(wǎng)頁中的至少一個以鏈接到圖像的縮略圖。

根據(jù)一個實施例,網(wǎng)頁選擇單元360可以基于圖像內(nèi)容中的至少一個字符串以及網(wǎng)頁內(nèi)容中的一或多個詞語來確定圖像與網(wǎng)頁之間的至少一個相似度。在此過程中,網(wǎng)頁選擇單元360可以解析每一個網(wǎng)頁中的詞語以及包含于圖像中的至少一個字符串中的一或多個詞語。如參考圖7中的參考標(biāo)號720、730和740詳細(xì)描述的,圖像中的詞語和網(wǎng)頁可用于基于自然語言處理(例如,句法分析、詞匯分析和/或語義分析)來確定至少一個相似度。額外地或替代地,網(wǎng)頁選擇單元360可以基于圖像中的至少一個文本區(qū)域的文本區(qū)域信息與網(wǎng)頁的文本區(qū)域信息(例如,布局、筆畫寬度、字符大小等)確定至少一個相似度。在此情況下,網(wǎng)頁選擇單元360可以從文本區(qū)域檢測單元354中接收至少一個文本區(qū)域的文本區(qū)域信息,并且確定每一個網(wǎng)頁中的文本的文本區(qū)域信息以比較與每一個網(wǎng)頁相關(guān)聯(lián)的文本區(qū)域信息以及與圖像相關(guān)聯(lián)的文本區(qū)域信息。

在一些實施例中,網(wǎng)頁選擇單元360可以基于圖像內(nèi)容與網(wǎng)頁內(nèi)容之間的至少一個相似度將至少一個排名分配到網(wǎng)頁。可隨后基于至少一個排名選擇至少一個網(wǎng)頁。舉例來說,可以按與網(wǎng)頁相關(guān)聯(lián)的至少一個相似度的順序?qū)W(wǎng)頁進(jìn)行排序。網(wǎng)頁選擇單元360可以將與針對圖像所選擇的至少一個網(wǎng)頁相關(guān)聯(lián)的鏈接信息(例如,至少一個url)提供到處理器350中的圖像鏈接單元364。此外,網(wǎng)頁選擇單元360可以從存儲單元320中檢索圖像的縮略圖并且將它提供到圖像鏈接單元364。

網(wǎng)頁捕獲單元362可經(jīng)配置以捕獲在i/o單元330的顯示屏210上顯示的網(wǎng)頁的圖像,并且獲取與網(wǎng)頁相關(guān)聯(lián)的鏈接信息(例如,url)。在一個實施例中,電子裝置120的用戶可以通過任何合適的搜索引擎訪問且顯示一或多個網(wǎng)頁,并且經(jīng)由i/o單元330提供命令以將當(dāng)前正在顯示屏210上顯示的網(wǎng)頁捕獲為圖像。在接收捕獲圖像的命令之后,網(wǎng)頁捕獲單元362可以基于所顯示的網(wǎng)頁獲取網(wǎng)頁的鏈接信息。在此情況下,鏈接信息可以包括指示網(wǎng)頁的地址(例如,url地址)。此外,可以將所捕獲的圖像提供到縮略圖產(chǎn)生單元352以用于產(chǎn)生圖像的縮略圖。隨后,可將圖像和/或縮略圖以及網(wǎng)頁的鏈接信息提供到圖像鏈接單元364。

圖像鏈接單元364可經(jīng)配置以從網(wǎng)頁選擇單元360中接收圖像的縮略圖以及與圖像鏈接的至少一個網(wǎng)頁的鏈接信息以用于將縮略圖鏈接到至少一個網(wǎng)頁。替代地,如果圖像和至少一個網(wǎng)頁是從網(wǎng)頁選擇單元360中接收的,那么圖像鏈接單元364可以從存儲單元320中檢索圖像的縮略圖。至少一個網(wǎng)頁的鏈接信息可以存儲為縮略圖的元數(shù)據(jù)以用于響應(yīng)于縮略圖的選擇而訪問至少一個網(wǎng)頁。如果針對圖像接收了多個網(wǎng)頁的鏈接信息,那么圖像鏈接單元364可以產(chǎn)生包括鏈接信息(例如,每一個網(wǎng)頁的url地址)的網(wǎng)頁的列表。在此情況下,可以響應(yīng)于縮略圖的選擇而顯示網(wǎng)頁的列表。當(dāng)網(wǎng)頁的列表顯示在顯示屏210上時,用戶可以從列表中選擇網(wǎng)頁中的一個以訪問所選擇的網(wǎng)頁。

在一些實施例中,圖像鏈接單元364可以將與圖像相關(guān)聯(lián)的至少一個網(wǎng)頁鏈接到圖像的一部分。舉例來說,圖像的一部分可以包括與搜索查詢相關(guān)聯(lián)的至少一個字符串,所述搜索查詢是為了針對圖像搜索網(wǎng)頁的列表而產(chǎn)生的。額外地或替代地,圖像鏈接單元364可以將針對圖像可以被搜索和選擇的網(wǎng)頁的一部分鏈接到圖像的縮略圖。在此情況下,網(wǎng)頁的一部分可以包括與圖像中的內(nèi)容相似的內(nèi)容。

根據(jù)另一實施例,圖像鏈接單元364可以從網(wǎng)頁捕獲單元362中接收網(wǎng)頁的所捕獲的圖像和/或圖像的縮略圖以及網(wǎng)頁的鏈接信息(例如,url)。網(wǎng)頁的鏈接信息可以元數(shù)據(jù)的形式標(biāo)記到圖像的縮略圖,并且所標(biāo)記的圖像可以存儲在存儲單元320中。在此情況下,可以響應(yīng)于選擇用網(wǎng)頁的鏈接信息標(biāo)記的縮略圖而訪問網(wǎng)頁。

圖4說明根據(jù)本發(fā)明的一個實施例的由電子裝置120來執(zhí)行的方法400的流程圖,所述方法用于鏈接具有內(nèi)容的圖像的縮略圖與具有與圖像內(nèi)容相似的內(nèi)容的至少一個網(wǎng)頁。最初,在410處,電子裝置120中的處理器350可以從存儲單元320或外部存儲器裝置中存取包括至少一個文本區(qū)域的圖像,所述文本區(qū)域包括至少一個字符串。在420處,處理器350中的文本區(qū)域檢測單元354可以使用任何合適的文本提取方案(例如,斑點聚集方法、基于邊緣的方法、基于連接的組件的方法、基于紋理的方法或類似物)來檢測圖像中的至少一個文本區(qū)域。

在430處,處理器350中的文本識別單元356可以使用任何合適的字符識別方案(例如,矩陣匹配、特征匹配等)來識別至少一個文本區(qū)域中的至少一個字符串。在440處,處理器350中的網(wǎng)頁搜索單元358可以從文本識別單元356中接收至少一個字符串并且基于至少一個字符串搜索多個網(wǎng)頁。在一個實施例中,可以基于可從至少一個字符串中產(chǎn)生的搜索查詢搜索多個網(wǎng)頁。

網(wǎng)頁搜索單元358可以將多個網(wǎng)頁提供到網(wǎng)頁選擇單元360。在450處,作為響應(yīng),網(wǎng)頁選擇單元360可以從多個網(wǎng)頁中選擇至少一個網(wǎng)頁。在一個實施例中,網(wǎng)頁選擇單元360可以確定圖像的內(nèi)容是否與網(wǎng)頁的內(nèi)容相似以從網(wǎng)頁中選擇至少一個網(wǎng)頁。在460處,處理器350中的圖像鏈接單元364可以鏈接圖像的縮略圖與所選擇的至少一個網(wǎng)頁。舉例來說,至少一個網(wǎng)頁的鏈接信息可以存儲為圖像的縮略圖的元數(shù)據(jù)以用于響應(yīng)于縮略圖的選擇而訪問至少一個網(wǎng)頁。

圖5說明根據(jù)本發(fā)明的一個實施例的網(wǎng)頁搜索單元358的框圖,所述網(wǎng)頁搜索單元經(jīng)配置以從文本識別單元356中接收圖像的至少一個文本區(qū)域中的一或多個字符串并且基于字符串搜索多個網(wǎng)頁。每一個網(wǎng)頁可指代與經(jīng)由互聯(lián)網(wǎng)或內(nèi)聯(lián)網(wǎng)訪問的url地址相關(guān)聯(lián)的任何網(wǎng)絡(luò)文檔,并且可以包括文本、圖像、地圖、視頻、音頻或其組合。在所說明的實施例中,網(wǎng)頁搜索單元358可以包括詞語分析單元510、查詢產(chǎn)生單元520和網(wǎng)頁提取單元530。

在網(wǎng)頁搜索單元358中,詞語分析單元510可以解析可包含于至少一個字符串中的多個詞語。根據(jù)一個實施例,詞語分析單元510可以對每一個詞語出現(xiàn)的次數(shù)進(jìn)行計數(shù)。舉例來說,可以通過使用任何合適的統(tǒng)計建模方法(例如,詞語n元語法、詞語直方圖等)來計算每個詞語出現(xiàn)的次數(shù)。在此過程中,詞語分析單元510可以確定圖像中的兩個或大于兩個詞語是否為相似詞語或等效詞語(例如,同義詞、相似詞語等),所述相似詞語或等效詞語作為單個詞語來計數(shù)以用于確定出現(xiàn)的次數(shù)。額外地或替代地,詞語分析單元510可以確定圖像中的詞語的一或多個類型(例如,電話號碼、公司名稱、個人名稱、地址、電子郵件等)??呻S后將圖像中的詞語的出現(xiàn)的次數(shù)和/或類型提供到網(wǎng)頁搜索單元358中的查詢產(chǎn)生單元520。

在接收圖像中的詞語的出現(xiàn)的次數(shù)和/或類型之后,查詢產(chǎn)生單元520可以通過從詞語中選擇至少一個詞語來產(chǎn)生一或多個搜索查詢。在一個實施例中,查詢產(chǎn)生單元520可以在多個詞語之中選擇至少一個詞語,所述詞語出現(xiàn)的比預(yù)先確定的出現(xiàn)次數(shù)多。根據(jù)另一實施例,可以選擇具有預(yù)先確定的最高出現(xiàn)次數(shù)的詞語并且將其用作一或多個搜索查詢。在一些情況下,如果圖像中的每個詞語的類型被確定為對應(yīng)于預(yù)先確定的類型(例如,電話號碼、公司名稱、個人名稱、地址、電子郵件地址或類似物),那么可以選擇此類詞語并且將此類詞語包含于一或多個搜索查詢中。

根據(jù)一些實施例,查詢產(chǎn)生單元520還可以從文本區(qū)域檢測單元354中接收圖像中的至少一個文本區(qū)域(例如,至少一個文本區(qū)域中的字符大小、筆畫寬度、位置或類似物)的文本區(qū)域信息,并且基于文本區(qū)域信息從圖像中的詞語中選擇至少一個詞語作為一或多個搜索查詢。舉例來說,如果文本區(qū)域中的一或多個詞語中的每一個的字符大小大于預(yù)先確定的大小,那么可以選擇詞語以用于產(chǎn)生一或多個搜索查詢。可以將針對圖像產(chǎn)生的搜索查詢提供到網(wǎng)頁搜索單元358中的網(wǎng)頁提取單元530。

在從查詢產(chǎn)生單元520中接收圖像的搜索查詢之后,網(wǎng)頁提取單元530可以搜索與搜索查詢相關(guān)聯(lián)的多個網(wǎng)頁。對于每一個搜索查詢,網(wǎng)頁提取單元530可以使用任何合適的引擎來搜索一或多個網(wǎng)頁,所述引擎可以是通過通信網(wǎng)絡(luò)370內(nèi)部提供或外部提供的。額外地或替代地,多個網(wǎng)頁可以存儲在存儲單元320中,所述網(wǎng)頁可通過網(wǎng)頁提取單元530存取和搜索。盡管網(wǎng)頁搜索單元358被說明為基于一或多個搜索查詢搜索多個網(wǎng)頁,但是網(wǎng)頁搜索單元358可以基于一或多個搜索查詢來僅搜索一個網(wǎng)頁。

圖6說明了根據(jù)本發(fā)明的一個實施例的網(wǎng)頁選擇單元360的框圖,所述網(wǎng)頁選擇單元經(jīng)配置以接收與縮略圖相關(guān)聯(lián)的圖像中的內(nèi)容以及多個網(wǎng)頁的內(nèi)容,并且從多個網(wǎng)頁中選擇一或多個網(wǎng)頁。圖像的內(nèi)容可以包括圖像中的至少一個文本區(qū)域的可從文本區(qū)域檢測單元354中接收的文本區(qū)域信息和至少一個文本區(qū)域中的可從文本識別單元356中接收的一或多個字符串。在所說明的實施例中,網(wǎng)頁選擇單元360可以包括特征提取單元610、相似度確定單元620、排名分配單元630和網(wǎng)頁輸出單元640。網(wǎng)頁選擇單元360可以從網(wǎng)頁搜索單元358中接收多個網(wǎng)頁,并且選擇可以被鏈接到圖像的縮略圖的一或多個網(wǎng)頁。可隨后將所選擇的網(wǎng)頁提供到圖像鏈接單元364以用于鏈接圖像的縮略圖與所選擇的網(wǎng)頁。

特征提取單元610可經(jīng)配置以從文本區(qū)域檢測單元354中接收圖像中的至少一個文本區(qū)域的文本區(qū)域信息并且從文本識別單元356中接收至少一個文本區(qū)域中的一或多個字符串。另外,特征提取單元610可以接收已經(jīng)從網(wǎng)頁搜索單元358中被搜索出的多個網(wǎng)頁?;谖谋緟^(qū)域信息或字符串中的至少一者,特征提取單元610可以提取指示圖像中的至少一個文本區(qū)域的第一特征。此外,可以提取指示每一個所接收到的網(wǎng)頁中的文本的第二特征。可將與圖像相關(guān)聯(lián)的第一特征和與所接收到的網(wǎng)頁相關(guān)聯(lián)的第二特征提供到相似度確定單元620。在一個實施例中,可基于圖像和網(wǎng)頁中的文本區(qū)域信息和/或字符串相應(yīng)地產(chǎn)生第一特征和第二特征。舉例來說,第一特征可以表示為包括指示圖像的文本區(qū)域信息和/或字符串的多個值的特征向量。類似地,第二特征可以表示為包括指示網(wǎng)頁的文本區(qū)域信息和/或字符串的多個值的特征向量。

在接收與圖像相關(guān)聯(lián)的第一特征和與網(wǎng)頁相關(guān)聯(lián)的第二特征之后,相似度確定單元620可以確定第一特征與每一個第二特征之間的相似度。在一個實施例中,相似度確定單元620可以確定第一特征與每一個第二特征之間的相似度,方法是確定第一特征與第二特征之間的距離(例如,歐幾里得距離)。可隨后將網(wǎng)頁的第二特征與圖像的第一特征的相似度提供到排名分配單元630。

排名分配單元630可以從相似度確定單元620中接收網(wǎng)頁和與圖像的第一特征的相關(guān)聯(lián)的相似度。在一個實施例中,可以根據(jù)與網(wǎng)頁相關(guān)聯(lián)的相似度將排名分配到每一個網(wǎng)頁。舉例來說,排名分配單元630可以為了圖像訪問特定數(shù)量的網(wǎng)頁并且基于圖像與每一個網(wǎng)頁之間的相似度將排名分配到每一個網(wǎng)頁。在此情況下,可以選擇多個最高排名網(wǎng)頁(例如,第一到第五最高排名網(wǎng)頁)并且將網(wǎng)頁與相關(guān)聯(lián)的排名一起提供到網(wǎng)頁選擇單元360中的網(wǎng)頁輸出單元640。盡管排名分配單元630被描述為訪問特定數(shù)量的網(wǎng)頁并且選擇多個最高排名網(wǎng)頁,但是它可以訪問任何合適數(shù)量的網(wǎng)頁并且選擇任何合適數(shù)量的最高排名網(wǎng)頁。

網(wǎng)頁輸出單元640可以從排名分配單元630中接收已經(jīng)基于網(wǎng)頁的排名選擇的網(wǎng)頁以及相關(guān)聯(lián)的排名。在一個實施例中,網(wǎng)頁輸出單元640可以在所接收到的網(wǎng)頁之中選擇特定數(shù)量的最高排名網(wǎng)頁。替代地,網(wǎng)頁輸出單元640可以從相似度確定單元620中接收已經(jīng)針對圖像搜索的網(wǎng)頁與圖像之間的相似度,并且選擇具有超過閾值相似度(其可以是預(yù)先確定的)的相似度的一或多個網(wǎng)頁??呻S后將所選擇的網(wǎng)頁提供到處理器350中的圖像鏈接單元364。在一些實施例中,網(wǎng)頁輸出單元640還可以將與所選擇的網(wǎng)頁相關(guān)聯(lián)的排名提供到圖像鏈接單元364。

圖7說明了根據(jù)本發(fā)明的一個實施例的特征提取單元610的框圖,所述特征提取單元經(jīng)配置以從圖像中提取第一特征并且從已經(jīng)搜索的多個網(wǎng)頁中提取多個第二特征。特征提取單元610可以從文本識別單元356中接收圖像中的至少一個文本區(qū)域中的一或多個字符串并且從網(wǎng)頁搜索單元358中接收多個網(wǎng)頁。此外,可以從文本區(qū)域檢測單元354中接收圖像的文本區(qū)域信息。特征提取單元610可以包括句法分析單元720、詞匯分析單元730、語義分析單元740、文本區(qū)域分析單元710和特征產(chǎn)生單元750。

文本區(qū)域分析單元710可經(jīng)配置以檢測來自從網(wǎng)頁搜索單元358中接收的網(wǎng)頁的一或多個文本區(qū)域并且識別文本區(qū)域中的一或多個字符串。此外,文本區(qū)域分析單元710可以確定來自網(wǎng)頁中的所檢測到的文本區(qū)域的文本區(qū)域信息。舉例來說,文本區(qū)域信息可以包括網(wǎng)頁中的所檢測到的文本區(qū)域的字符大小、筆畫寬度、布局(例如,位置)等??梢詫⒕W(wǎng)頁的文本區(qū)域中的字符串提供到句法分析單元720、詞匯分析單元730和語義分析單元740。另外,可以將網(wǎng)頁的文本區(qū)域的文本區(qū)域信息提供到特征產(chǎn)生單元750以用于產(chǎn)生網(wǎng)頁的第二特征。

句法分析單元720可經(jīng)配置以接收且解析網(wǎng)頁的字符串和圖像的字符串。在一個實施例中,句法分析單元720可以識別圖像的字符串中的多個詞語和網(wǎng)頁的字符串中的多個詞語。替代地,可以從文本識別單元356中接收圖像的字符串中的多個詞語?;趫D像中的所識別的詞語,句法分析單元720可以確定圖像中的所識別的詞語的總長度(例如,字符、音素或音節(jié)的總數(shù))。此外,可以確定每一個網(wǎng)頁中的所識別的詞語的總長度(例如,字符、音素或音節(jié)的總數(shù))。額外地或替代地,句法分析單元720可以確定圖像中的一或多個特定詞語是否包含于每一個網(wǎng)頁的詞語中??梢詫⒔馕鼋Y(jié)果提供到特征產(chǎn)生單元750,所述解析結(jié)果包括詞語的總長度、特定詞語是否包含于每一個網(wǎng)頁中,或類似物。

詞匯分析單元730可經(jīng)配置以接收圖像的字符串和網(wǎng)頁的字符串,并且確定來自圖像和網(wǎng)頁的字符串的符記(例如,字符的有意義的集合)的多個次序。在一個實施例中,詞匯分析單元730可以確定從圖像的符記中提取的一或多個詞匯群組是否對應(yīng)于從每一個網(wǎng)頁的符記中提取的一或多個詞匯群組。舉例來說,詞匯群組可以指示特定句子結(jié)構(gòu)(例如,形成有意義的句子的詞語的排布)、特定詞語的集合等??梢詫⒃~匯分析結(jié)果提供到特征產(chǎn)生單元750,所述詞匯分析結(jié)果包括圖像中的符記的詞匯群組是否對應(yīng)于每一個網(wǎng)頁中的符記的詞匯群組,或類似物。

語義分析單元740可經(jīng)配置以接收圖像的字符串和網(wǎng)頁的字符串,并且在圖像的字符串和每一個網(wǎng)頁的字符串上執(zhí)行語義分析。在此過程中,語義分析單元740可以識別圖像的字符串中的多個詞語和每一個網(wǎng)頁的字符串中的多個詞語。在識別詞語之后,語義分析單元740可以通過使用任何合適的統(tǒng)計建模方法(例如,詞語n元語法、詞語直方圖、詞語出現(xiàn)矩陣等)來確定圖像中的每一個詞語出現(xiàn)的次數(shù)和每一個網(wǎng)頁中的每一個詞語出現(xiàn)的次數(shù)。額外地或替代地,語義分析單元740可以確定圖像和網(wǎng)頁中的所識別的詞語是否指示預(yù)先確定的類型的字符串,例如,電話號碼、公司名稱、個人名稱、地址、電子郵件或類似物??梢詫⒄Z義分析結(jié)果提供到特征產(chǎn)生單元750,所述語義分析結(jié)果包括圖像和網(wǎng)頁中的每一個詞語出現(xiàn)的次數(shù)、圖像和網(wǎng)頁中的詞語是否指示預(yù)先確定的類型的字符串,或類似物。

特征產(chǎn)生單元750可經(jīng)配置以從句法分析單元720、詞匯分析單元730和語義分析單元740中相應(yīng)地接收解析結(jié)果、詞匯分析結(jié)果和語義分析結(jié)果。另外,特征產(chǎn)生單元750還可以從文本區(qū)域檢測單元354中接收圖像的文本區(qū)域信息并且從文本區(qū)域分析單元710中接收網(wǎng)頁的文本區(qū)域信息。在一個實施例中,基于圖像的解析結(jié)果、詞匯分析結(jié)果、語義分析結(jié)果和文本區(qū)域信息中的至少一者,可以從圖像中產(chǎn)生第一特征。類似地,基于網(wǎng)頁的解析結(jié)果、詞匯分析結(jié)果、語義分析結(jié)果和文本區(qū)域信息中的至少一者,可以從網(wǎng)頁中產(chǎn)生第二特征。在此過程中,基于圖像和網(wǎng)頁中的一或多個對應(yīng)的分析結(jié)果和/或文本區(qū)域信息,可以產(chǎn)生第一特征和第二特征。特征提取單元610可以將第一特征和第二特征提供到相似度確定單元620以用于確定第一特征與每一個第二特征之間的相似度。盡管特征提取單元610包括句法分析單元720、詞匯分析單元730、語義分析單元740和文本區(qū)域分析單元710,但是可以使用此類分析單元中的任一者或組合或任何其它合適的分析方法。

圖8說明了根據(jù)本發(fā)明的一個實施例的通過電子裝置120執(zhí)行的方法800的流程圖,所述方法用于基于圖像的至少一個文本區(qū)域中的至少一個字符串搜索多個網(wǎng)頁并且從多個網(wǎng)頁中選擇至少一個網(wǎng)頁。最初,在810處,網(wǎng)頁搜索單元358可以從文本識別單元356中接收圖像的至少一個字符串。在820處,可以基于可從圖像的至少一個字符串中產(chǎn)生的一或多個搜索查詢搜索多個網(wǎng)頁。

在830處,網(wǎng)頁選擇單元360可以確定圖像的內(nèi)容與每一個所搜索的網(wǎng)頁的內(nèi)容之間的相似度。在此情況下,圖像的內(nèi)容可以包括圖像中的至少一個文本區(qū)域的可從文本區(qū)域檢測單元354中接收的文本區(qū)域信息和至少一個文本區(qū)域中的可從文本識別單元356中接收的至少一個字符串。此外,網(wǎng)頁選擇單元360可以確定每一個網(wǎng)頁的一或多個文本區(qū)域中的一或多個字符串和相關(guān)聯(lián)的網(wǎng)頁的文本區(qū)域的文本區(qū)域信息。每一個網(wǎng)頁的字符串和相關(guān)聯(lián)的網(wǎng)頁的文本區(qū)域信息可以包含于網(wǎng)頁的內(nèi)容中。

在840處,方法800可以確定圖像與每一個網(wǎng)頁之間的相似度是否大于或等于可以預(yù)先確定的閾值相似度。對于每一個網(wǎng)頁,如果確定圖像與網(wǎng)頁之間的相似度大于或等于閾值相似度(即,在850處的“是”),那么方法可以進(jìn)行到850以產(chǎn)生包括網(wǎng)頁的網(wǎng)頁的列表。否則的話(即,在840處的“否”),則在860處網(wǎng)頁選擇單元360可以將網(wǎng)頁過濾掉。

圖9說明了根據(jù)本發(fā)明的一個實施例的電子裝置120,所述電子裝置經(jīng)配置以訪問網(wǎng)頁并且捕獲網(wǎng)頁的圖像以用于將圖像的縮略圖鏈接到網(wǎng)頁。用戶910可以運(yùn)行電子裝置120以經(jīng)由通信網(wǎng)絡(luò)370使用任何合適的搜索引擎訪問一或多個網(wǎng)頁。如圖所示,可以經(jīng)由通信網(wǎng)絡(luò)370訪問包括文本的網(wǎng)頁920并且在顯示屏210上顯示網(wǎng)頁920。舉例來說,網(wǎng)頁920可以包括具有多個文本區(qū)域930、940和950的文章,所述文本區(qū)域可以相應(yīng)地包括指示網(wǎng)頁920的地址(例如,url地址等)的字符串“www.bcdnews.com/456”、字符串“headline”(例如,標(biāo)題、大標(biāo)題等)和字符串“body”(例如,正文、內(nèi)容等)。

在一個實施例中,用戶910可以運(yùn)行電子裝置120以在電子裝置120中捕獲且存儲網(wǎng)頁920的圖像。舉例來說,所捕獲的圖像可以包括文本區(qū)域930、940和950中的至少一者。在此情況下,網(wǎng)頁捕獲單元362可以從網(wǎng)頁920的元數(shù)據(jù)(例如,html標(biāo)簽等)中獲取url地址“www.bcdnews.com/456”。替代地,可以通過文本區(qū)域檢測單元354檢測包括url地址的文本區(qū)域930,并且可以通過文本識別單元356識別文本區(qū)域930中的url地址。另外,電子裝置120中的縮略圖產(chǎn)生單元352可以產(chǎn)生網(wǎng)頁920的圖像的縮略圖。

電子裝置120可經(jīng)配置以將網(wǎng)頁的所捕獲的圖像的縮略圖鏈接到網(wǎng)頁。在一個實施例中,網(wǎng)頁的url地址可以被標(biāo)記到圖像的縮略圖且被存儲為縮略圖的元數(shù)據(jù)。在所說明的實施例中,網(wǎng)頁920的url地址“www.bcdnews.com/456”可以存儲為網(wǎng)頁920的圖像的縮略圖的元數(shù)據(jù)。在存儲網(wǎng)頁圖像的縮略圖的元數(shù)據(jù)之后,電子裝置120可以響應(yīng)于接收輸入以選擇圖像的縮略圖而在顯示屏210上顯示網(wǎng)頁920。

圖10是根據(jù)本發(fā)明的一個實施例的通過電子裝置120執(zhí)行的方法1000的流程圖,所述方法用于捕獲網(wǎng)頁的圖像并且將圖像的縮略圖鏈接到網(wǎng)頁。最初,在1010處,處理器350中的網(wǎng)頁捕獲單元362可以捕獲網(wǎng)頁的圖像,所述網(wǎng)頁可以在顯示屏210上顯示。在1020處,處理器350中的縮略圖產(chǎn)生單元352可以產(chǎn)生網(wǎng)頁圖像的縮略圖且將網(wǎng)頁圖像的縮略圖存儲在存儲單元320中。

在1030處,網(wǎng)頁捕獲單元362可以從網(wǎng)頁的元數(shù)據(jù)(例如,html標(biāo)簽等)中獲取與網(wǎng)頁相關(guān)聯(lián)的地址(例如,url地址)。在1040處,與網(wǎng)頁相關(guān)聯(lián)的地址可以被標(biāo)記到網(wǎng)頁圖像的所產(chǎn)生的縮略圖。在此情況下,與網(wǎng)頁相關(guān)聯(lián)的地址可以存儲為縮略圖的元數(shù)據(jù)。替代地,處理器350中的圖像鏈接單元364可以將與網(wǎng)頁相關(guān)聯(lián)的地址存儲為網(wǎng)頁的圖像的元數(shù)據(jù),而不是在1020處產(chǎn)生網(wǎng)頁的縮略圖。在存儲網(wǎng)頁的圖像、網(wǎng)頁圖像的縮略圖和包括網(wǎng)頁的url地址的縮略圖的元數(shù)據(jù)之后,在1050處,電子裝置120可以接收輸入以訪問和選擇網(wǎng)頁圖像的縮略圖使得可以將網(wǎng)頁輸出到電子裝置120。盡管方法1000被說明為在1030處獲得與網(wǎng)頁相關(guān)聯(lián)的url地址之前在1020處產(chǎn)生圖像的縮略圖,但是可以在獲得與網(wǎng)頁相關(guān)聯(lián)的url地址時或在獲得與網(wǎng)頁相關(guān)聯(lián)的url地址之后產(chǎn)生圖像的縮略圖。

圖11說明了在無線通信系統(tǒng)中的移動裝置1100的框圖,在所述無線通信系統(tǒng)中本發(fā)明的方法和設(shè)備可以根據(jù)一些實施例來實施,所述方法和設(shè)備用于鏈接圖像的縮略圖與為了圖像而已經(jīng)搜索且選擇的至少一個網(wǎng)頁。移動裝置1100可為蜂窩式電話、智能電話、可佩帶計算機(jī)、智能表、智能眼鏡、平板個人計算機(jī)、終端、手持機(jī)、個人數(shù)字助理(pda)、無線調(diào)制解調(diào)器、無繩電話、平板計算機(jī)等等。無線通信系統(tǒng)可為cdma系統(tǒng)、gsm系統(tǒng)、w-cdma系統(tǒng)、lte系統(tǒng)、lte高級系統(tǒng)等等。

移動裝置1100可能能夠經(jīng)由接收路徑和發(fā)射路徑提供雙向通信。在接收路徑上,基站發(fā)射的信號可被天線1112接收,并且被提供給接收器(rcvr)1114。接收器1114可調(diào)節(jié)并數(shù)字化所接收的信號,并將經(jīng)調(diào)節(jié)且經(jīng)數(shù)字化的數(shù)字信號提供到數(shù)字區(qū)段以供進(jìn)一步處理。在發(fā)射路徑上,發(fā)射器(tmtr)1116可從數(shù)字區(qū)段1120接收待發(fā)射的數(shù)據(jù),處理并調(diào)節(jié)所述數(shù)據(jù),且產(chǎn)生經(jīng)調(diào)制信號,所述經(jīng)調(diào)制信號經(jīng)由天線1112發(fā)射到基站。接收器1114和發(fā)射器1116可為可支持cdma、gsm、w-cdma、、lte、高級lte等等收發(fā)器的部分。

數(shù)字區(qū)段1120可以包括各種處理、接口和存儲器單元,例如,舉例來說,調(diào)制解調(diào)器處理器1122、精簡指令集計算機(jī)/數(shù)字信號處理器(risc/dsp)1124、控制器/處理器1126、內(nèi)部存儲器1128、通用音頻/視頻編碼器1132、通用音頻解碼器1134、圖形/顯示處理器1136和外部總線接口(ebi)1138。調(diào)制解調(diào)器處理器1122可執(zhí)行用于數(shù)據(jù)發(fā)射和接收的處理,例如,編碼、調(diào)制、解調(diào)和解碼。risc/dsp1124可執(zhí)行移動裝置1100的通用和專門處理??刂破?處理器1126可執(zhí)行數(shù)字區(qū)段1120內(nèi)的各種處理和接口單元的操作。內(nèi)部存儲器1128可存儲用于數(shù)字區(qū)段1120內(nèi)的各種單元的數(shù)據(jù)和/或指令。

通用音頻/視頻編碼器1132可對來自音頻/視頻源1142、麥克風(fēng)1144、圖像傳感器1146等的輸入信號執(zhí)行編碼。通用音頻解碼器1134可執(zhí)行對經(jīng)譯碼音頻數(shù)據(jù)的解碼,且可將輸出信號提供到揚(yáng)聲器/頭戴式耳機(jī)1148。圖形/顯示處理器1136可執(zhí)行對可呈現(xiàn)到顯示單元1150的圖形、視頻、圖像和文本的處理。ebi1138可促進(jìn)數(shù)據(jù)在數(shù)字區(qū)段1120與主存儲器1152之間的傳送。

數(shù)字區(qū)段1120可用一或多個處理器、dsp、微處理器、risc等來實施。還可在一或多個專用集成電路(asic)和/或一些其它類型的集成電路(ic)上制造數(shù)字區(qū)段1120。

圖12是說明根據(jù)一些實施例來實施的服務(wù)器系統(tǒng)1200的框圖,所述服務(wù)器系統(tǒng)可以是先前描述的服務(wù)器中的任一個,用于搜索和提供包括一或多個對象、分類器數(shù)據(jù)庫、字符信息數(shù)據(jù)庫、詞典數(shù)據(jù)庫等的多個圖像。服務(wù)器系統(tǒng)1200可以包括一或多個處理單元(例如,cpu)1202、一或多個網(wǎng)絡(luò)或其它通信網(wǎng)接口、存儲器1212,以及用于互連這些組件的一或多個通信總線1214。服務(wù)器系統(tǒng)1200還可包含具有顯示裝置和鍵盤的用戶接口(未示出)。

存儲器1212可為任何合適的存儲器,例如,高速隨機(jī)存取存儲器,(例如,dram、sram、ddrram或其它隨機(jī)存取固態(tài)存儲器裝置)。存儲器1212可包含或可替代地為非易失性存儲器(例如,一或多個磁盤存儲裝置、光盤存儲裝置、快閃存儲器裝置,或其它非易失性固態(tài)存儲裝置)。在一些實施例中,存儲器1212可以包括離cpu1202遠(yuǎn)程定位和/或遠(yuǎn)程定位于多處的一或多個存儲裝置。

由存儲器1212表示的上述存儲器裝置中的任一者可存儲對應(yīng)于用于執(zhí)行和/或?qū)嵭邢惹懊枋龅倪^程、操作和方法中的任一者的一組指令的任何數(shù)量的模組或程序。舉例來說,存儲器1212可以包括操作系統(tǒng)1216,其經(jīng)配置以存儲包括用于處置各種基本系統(tǒng)服務(wù)且用于執(zhí)行硬件相關(guān)任務(wù)的程序的指令。存儲器1212的網(wǎng)絡(luò)通信模塊1218可用于經(jīng)由一或多個通信網(wǎng)絡(luò)接口1210(有線或無線)和一或多個通信網(wǎng)絡(luò)(例如,因特網(wǎng)、其它廣域網(wǎng)、局域網(wǎng)、城域網(wǎng)等)將服務(wù)器系統(tǒng)1200連接到其它計算機(jī)。

存儲器1212還可包括數(shù)據(jù)庫1220,所述數(shù)據(jù)庫經(jīng)配置以包括具有一或多個對象(例如,文本對象和非文本對象)的多個圖像的圖像數(shù)據(jù)庫、分類器數(shù)據(jù)庫、字符信息數(shù)據(jù)庫、詞典數(shù)據(jù)庫等。操作系統(tǒng)1216可以通過不同圖像更新圖像數(shù)據(jù)庫,所述圖像可以通過網(wǎng)絡(luò)通信模塊1218來接收和/或捕獲。操作系統(tǒng)1216還可以經(jīng)由網(wǎng)絡(luò)通信模塊1218將圖像提供到多個電子裝置。此外,分類器數(shù)據(jù)庫、字符信息數(shù)據(jù)庫、詞典數(shù)據(jù)庫可以提供到多個電子裝置以用于檢測圖像的至少一個文本區(qū)域和/或識別至少一個文本區(qū)域中的一或多個字符串。

一般來說,本文中所描述的任何裝置可表示各種類型的裝置,例如,無線電話、蜂窩式電話、膝上型計算機(jī)、無線多媒體裝置、無線通信個人計算機(jī)(pc)卡、pda、外部或內(nèi)置調(diào)制解調(diào)器、通過無線通道通信的裝置等。裝置可具有各種名稱,例如,存取終端(at)、存取單元、訂戶單元、移動臺、移動裝置、移動單元、移動電話、移動設(shè)備、遠(yuǎn)程站、遠(yuǎn)程終端、遠(yuǎn)程單元、用戶裝置、用戶設(shè)備、手持式裝置等。本文中描述的任何裝置均可具有用于存儲指令和數(shù)據(jù)的存儲器以及硬件、軟件、固件或其組合。

本文中描述的技術(shù)可通過各種裝置來實施。舉例來說,這些技術(shù)可以在硬件、固件、軟件或其組合中實施。所屬領(lǐng)域的一般技術(shù)人員將進(jìn)一步了解,結(jié)合本文中的揭示內(nèi)容描述的各種說明性邏輯塊、模塊、電路和算法步驟可實施為電子硬件、計算機(jī)軟件或兩者的組合。為清楚說明硬件與軟件的此可互換性,上文已大體上關(guān)于其功能性而描述了各種說明性組件、塊、模塊、電路及步驟。此類功能性是實施為硬件還是軟件取決于具體應(yīng)用及施加于整個系統(tǒng)的設(shè)計約束。所屬領(lǐng)域的技術(shù)人員可針對每一特定應(yīng)用以不同方式實施所描述的功能性,但此類實施決策不應(yīng)被解釋為引起偏離本發(fā)明的范圍。

對于硬件實施方案,用以執(zhí)行所述技術(shù)的處理單元可實施在以下各者內(nèi):一或多個asic、dsp、數(shù)字信號處理裝置(dspd)、可編程邏輯裝置(pld)、現(xiàn)場可編程門陣列(fpga)、處理器、控制器、微控制器、微處理器、電子裝置、經(jīng)設(shè)計以執(zhí)行本文中所描述的功能的其它電子單元、計算機(jī)或其組合。

因此,結(jié)合本文中的揭示內(nèi)容描述的各種說明性邏輯塊、模塊和電路可以用通用處理器、dsp、asic、fpga或經(jīng)設(shè)計以執(zhí)行本文中描述的功能的其它可編程邏輯裝置、離散門或晶體管邏輯、離散硬件組件或其任何組合來實施或執(zhí)行。通用處理器可以是微處理器,但在替代方案中,處理器可以是任何處理器、控制器、微控制器或狀態(tài)機(jī)。處理器也可以實施為計算裝置的組合,例如,dsp與微處理器的組合、多個微處理器、結(jié)合dsp核心的一或多個微處理器,或任何其它此類配置。

如果在軟件中實施,那么功能可以存儲在計算機(jī)可讀媒體處。計算機(jī)可讀媒體包括計算機(jī)存儲媒體與通信媒體兩者,所述通信媒體包括促進(jìn)將計算機(jī)程序從一個位置傳遞到另一個位置的任何媒體。存儲媒體可以是可以由計算機(jī)存取的任何可供使用的媒體。借助于實例而非限制,此類計算機(jī)可讀媒體可包括ram、rom、eeprom、cd-rom或其它光盤存儲裝置、磁盤存儲裝置或其它磁性存儲裝置,或可用于攜載或存儲呈指令或數(shù)據(jù)結(jié)構(gòu)形式的所需程序代碼且可由計算機(jī)存取的任何其它媒體。如本文所使用,磁盤和光盤包括壓縮光盤(cd)、激光光盤、光學(xué)光盤、數(shù)字多功能光盤(dvd)、軟盤和藍(lán)光光盤,其中磁盤通常以磁性方式再現(xiàn)數(shù)據(jù),而光盤用激光以光學(xué)方式再現(xiàn)數(shù)據(jù)。上述的組合應(yīng)包含于計算機(jī)可讀媒體的范圍內(nèi)。舉例來說,計算機(jī)可讀存儲媒體可以是包括可由處理器執(zhí)行的指令的非暫時性計算機(jī)可讀存儲裝置。因此,計算機(jī)可讀存儲媒體可能不是信號。

提供本發(fā)明的先前描述以使得所屬領(lǐng)域的技術(shù)人員能夠制造或使用本發(fā)明。所屬領(lǐng)域的技術(shù)人員將易于明白對本發(fā)明的各種修改,且本文中定義的一般原理在不脫離本發(fā)明的范圍的情況下適用于其它變體。因此,本發(fā)明并非意圖限于本文中所描述的實例,而應(yīng)符合與本文中所揭示的原理及新穎特征相一致的最廣泛范圍。

盡管利用在一或多個獨(dú)立計算機(jī)系統(tǒng)的情形下的目前揭示的標(biāo)的物的方面來提及示例性實施方案,但所述標(biāo)的物不受如此限制,而是實際上可結(jié)合任何計算環(huán)境(例如,網(wǎng)絡(luò)或分布式計算環(huán)境)來實施。此外,當(dāng)前揭示的標(biāo)的物的方面可在多個處理芯片或裝置中實施或跨越多個處理芯片或裝置實施,且可類似地跨越多個裝置影響存儲。此類裝置可以包括pc、網(wǎng)絡(luò)服務(wù)器和手持式裝置。

盡管已經(jīng)以特定地針對結(jié)構(gòu)特征和/或方法動作的語言來描述標(biāo)的物,但應(yīng)理解,所附權(quán)利要求書中所定義的標(biāo)的物未必限于上文描述的具體特征或動作。實際上,上文描述的具體特征和動作是被揭示作為實施權(quán)利要求書的實例形式。

應(yīng)了解,不必將上述所識別模塊或程序(即,指令集)實施為單獨(dú)軟件程序、程序或模塊,且因此可在各種實施例中組合或以其它方式重新布置這些模塊的各種子集。另外,存儲器1212可存儲上文未描述的額外的模塊和數(shù)據(jù)結(jié)構(gòu)。

<本發(fā)明的方面>

在下文中,將另外陳述本發(fā)明的一些方面。

(實例1)根據(jù)本發(fā)明的一方面,提供一種用于鏈接圖像的縮略圖與至少一個網(wǎng)頁的方法,所述方法包括:存取存儲單元中的圖像,其中所述圖像包括至少一個文本區(qū)域;檢測圖像中的至少一個文本區(qū)域;識別至少一個文本區(qū)域中的至少一個字符串;基于所述至少一個字符串搜索多個網(wǎng)頁;從多個網(wǎng)頁中選擇至少一個網(wǎng)頁;以及鏈接圖像的縮略圖和至少一個網(wǎng)頁。

(實例2)實例1的方法進(jìn)一步包括:接收指示縮略圖的選擇的輸入;訪問與所述縮略圖鏈接的至少一個網(wǎng)頁;以及在電子裝置上輸出所述至少一個網(wǎng)頁。

(實例3)在實例1或2的方法中,訪問所述至少一個網(wǎng)頁包括訪問存儲在電子裝置中或經(jīng)由網(wǎng)絡(luò)搜索的至少一個網(wǎng)頁。

(實例4)在實例1到3中的任一個的方法中,搜索多個網(wǎng)頁包括從至少一個字符串中產(chǎn)生搜索查詢;以及基于所述搜索查詢接收多個網(wǎng)頁。

(實例5)在實例1到4中的任一個的方法中,所述至少一個字符串包括多個詞語。在此實例中,從至少一個字符串中產(chǎn)生搜索查詢包括基于圖像中多個詞語的字符大小、筆畫寬度、位置、類型和出現(xiàn)的次數(shù)中的至少一者從多個詞語中選擇至少一個詞語。

(實例6)在實例1到5中的任一個的方法中,鏈接縮略圖和至少一個網(wǎng)頁包括鏈接至少一個網(wǎng)頁以及與縮略圖中的至少一個文本區(qū)域相關(guān)聯(lián)的至少一部分。

(實例7)在實例1到6中的任一個的方法中,從多個網(wǎng)頁中選擇至少一個網(wǎng)頁包括從多個網(wǎng)頁中選擇具有與圖像的內(nèi)容相似的內(nèi)容的至少一個網(wǎng)頁。

(實例8)在實例1到7中的任一個的方法中,選擇具有與圖像的內(nèi)容相似的內(nèi)容的至少一個網(wǎng)頁包括:基于圖像的內(nèi)容與多個網(wǎng)頁的內(nèi)容之間的相似度將至少一個排名分配到多個網(wǎng)頁;以及基于所述至少一個排名選擇至少一個網(wǎng)頁。

(實例9)在實例1到8中的任一個的方法中,選擇具有與圖像的內(nèi)容相似的內(nèi)容的至少一個網(wǎng)頁包括:提取指示圖像中的至少一個文本區(qū)域的第一特征以及指示多個網(wǎng)頁中的文本的多個第二特征;以及基于第一特征和多個第二特征選擇至少一個網(wǎng)頁。

(實例10)在實例1到9中的任一個的方法中,鏈接圖像的縮略圖和至少一個網(wǎng)頁包括鏈接至少一個網(wǎng)頁的一部分到圖像的縮略圖。在此實例中,至少一個網(wǎng)頁的一部分中的內(nèi)容與圖像中的內(nèi)容相似。

(實例11)根據(jù)本發(fā)明的另一方面,提供一種用于鏈接圖像的縮略圖和至少一個網(wǎng)頁的電子裝置,所述電子裝置包括:文本區(qū)域檢測單元,其經(jīng)配置以存取存儲單元中的圖像,其中所述圖像包括至少一個文本區(qū)域,并且檢測圖像中的至少一個文本區(qū)域;文本識別單元,其經(jīng)配置以識別至少一個文本區(qū)域中的至少一個字符串;網(wǎng)頁搜索單元,其經(jīng)配置以基于至少一個字符串搜索多個網(wǎng)頁;網(wǎng)頁選擇單元,其經(jīng)配置以從多個網(wǎng)頁中選擇至少一個網(wǎng)頁;以及圖像鏈接單元,其經(jīng)配置以鏈接圖像的縮略圖和至少一個網(wǎng)頁。

(實例12)實例11的電子裝置進(jìn)一步包括i/o單元,所述i/o單元經(jīng)配置以接收指示縮略圖的選擇的輸入并且在電子裝置上輸出至少一個網(wǎng)頁。在此實例中,通過電子裝置訪問與縮略圖鏈接的至少一個網(wǎng)頁。

(實例13)在實例11或12的電子裝置中,所述電子裝置經(jīng)配置以訪問存儲在電子裝置中或經(jīng)由網(wǎng)絡(luò)搜索的至少一個網(wǎng)頁。

(實例14)在實例11到13中的任一個的電子裝置中,網(wǎng)頁搜索單元包括:查詢產(chǎn)生單元,其經(jīng)配置以從至少一個字符串中產(chǎn)生搜索查詢;以及網(wǎng)頁提取單元,其經(jīng)配置以基于搜索查詢接收多個網(wǎng)頁。

(實例15)在實例11到14中的任一個的電子裝置中,至少一個字符串包括多個詞語。在此實例中,查詢產(chǎn)生單元經(jīng)配置以基于圖像中多個詞語的字符大小、筆畫寬度、位置、類型和出現(xiàn)的次數(shù)中的至少一者從多個詞語中選擇至少一個詞語。

(實例16)在實例11到15中的任一個的電子裝置中,圖像鏈接單元經(jīng)配置以鏈接至少一個網(wǎng)頁以及與縮略圖中的至少一個文本區(qū)域相關(guān)聯(lián)的至少一部分。

(實例17)在實例11到16中的任一個的電子裝置中,網(wǎng)頁選擇單元經(jīng)配置以從多個網(wǎng)頁中選擇具有與圖像的內(nèi)容相似的內(nèi)容的至少一個網(wǎng)頁。

(實例18)在實例11到17中的任一個的電子裝置中,網(wǎng)頁選擇單元包括:排名分配單元,其經(jīng)配置以基于圖像的內(nèi)容與多個網(wǎng)頁的內(nèi)容之間的相似度將至少一個排名分配到多個網(wǎng)頁;以及網(wǎng)頁輸出單元,其經(jīng)配置以基于所述至少一個排名選擇至少一個網(wǎng)頁。

(實例19)在實例11到18中的任一個的電子裝置中,網(wǎng)頁選擇單元包括:特征提取單元,其經(jīng)配置以提取指示圖像中的至少一個文本區(qū)域的第一特征以及指示多個網(wǎng)頁中的文本的多個第二特征;以及網(wǎng)頁輸出單元,其經(jīng)配置以基于第一特征和多個第二特征選擇至少一個網(wǎng)頁。

(實例20)在實例11到19中的任一個的電子裝置中,圖像鏈接單元經(jīng)配置以將至少一個網(wǎng)頁的一部分鏈接到圖像的縮略圖。在此實例中,至少一個網(wǎng)頁的一部分中的內(nèi)容與圖像中的內(nèi)容相似。

(實例21)根據(jù)本發(fā)明的再一方面,提供一種用于將圖像的縮略圖鏈接到網(wǎng)頁的電子裝置,所述電子裝置包括:用于存取存儲單元中的圖像的裝置,其中所述圖像包括至少一個文本區(qū)域;用于檢測圖像中的至少一個文本區(qū)域的裝置;用于識別至少一個文本區(qū)域中的至少一個字符串的裝置;用于基于至少一個字符串搜索多個網(wǎng)頁的裝置;用于從多個網(wǎng)頁中選擇至少一個網(wǎng)頁的裝置;以及用于鏈接圖像的縮略圖和至少一個網(wǎng)頁的裝置。

(實例22)在實例21的電子裝置中,所述用于搜索多個網(wǎng)頁的裝置包括:用于從至少一個字符串中產(chǎn)生搜索查詢的裝置;以及用于基于搜索查詢接收多個網(wǎng)頁的裝置。

(實例23)在實例21或22的電子裝置中,所述至少一個字符串包括多個詞語。在此實例中,用于從至少一個字符串中產(chǎn)生搜索查詢的裝置包括用于基于圖像中多個詞語的字符大小、筆畫寬度、位置、類型和出現(xiàn)的次數(shù)中的至少一者從多個詞語中選擇至少一個詞語的裝置。

(實例24)在實例21到23中的任一個的電子裝置中,用于從多個網(wǎng)頁中選擇至少一個網(wǎng)頁的裝置包括用于從多個網(wǎng)頁中選擇具有與圖像的內(nèi)容相似的內(nèi)容的至少一個網(wǎng)頁。

(實例25)在實例21到24中的任一個的電子裝置中,用于選擇具有與圖像的內(nèi)容相似的內(nèi)容的至少一個網(wǎng)頁的裝置包括用于基于圖像的內(nèi)容與多個網(wǎng)頁的內(nèi)容之間的相似度將至少一個排名分配到多個網(wǎng)頁的裝置;以及用于基于所述至少一個排名選擇至少一個網(wǎng)頁的裝置。

(實例26)根據(jù)本發(fā)明的又一方面,提供一種非暫時性計算機(jī)可讀儲存媒體,所述非暫時性計算機(jī)可讀儲存媒體包括指令,所述指令使得電子裝置的至少一個處理器執(zhí)行包括以下項的操作:存取存儲單元中的圖像,其中所述圖像包括至少一個文本區(qū)域;檢測圖像中的至少一個文本區(qū)域;識別至少一個文本區(qū)域中的至少一個字符串;基于至少一個字符串搜索多個網(wǎng)頁;從多個網(wǎng)頁中選擇至少一個網(wǎng)頁;以及鏈接圖像的縮略圖和至少一個網(wǎng)頁。

(實例27)實例26的非暫時性計算機(jī)可讀儲存媒體進(jìn)一步包括指令,所述指令使得所述電子裝置的至少所述處理器執(zhí)行包括以下項的操作:從至少一個字符串中產(chǎn)生搜索查詢;以及基于搜索查詢接收多個網(wǎng)頁。

(實例28)在實例26或27的非暫時性計算機(jī)可讀儲存媒體中,至少一個字符串包括多個詞語,并且從至少一個字符串中產(chǎn)生搜索查詢包括基于圖像中多個詞語的字符大小、筆畫寬度、位置、類型和出現(xiàn)的次數(shù)中的至少一者從多個詞語中選擇至少一個詞語。

(實例29)在實例26到28中的任一個的非暫時性計算機(jī)可讀儲存媒體中,從多個網(wǎng)頁中選擇至少一個網(wǎng)頁包括從多個網(wǎng)頁中選擇具有與圖像的內(nèi)容相似的內(nèi)容的至少一個網(wǎng)頁。

(實例30)在實例26到29中的任一個的非暫時性計算機(jī)可讀儲存媒體中,選擇具有與圖像的內(nèi)容相似的內(nèi)容的至少一個網(wǎng)頁包括基于圖像的內(nèi)容與多個網(wǎng)頁的內(nèi)容之間的相似度將至少一個排名分配到多個網(wǎng)頁;以及基于所述至少一個排名選擇至少一個網(wǎng)頁。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
赫章县| 钟山县| 沁水县| 织金县| 客服| 濉溪县| 衡阳县| 香港 | 炉霍县| 乌拉特中旗| 兰溪市| 桃园县| 友谊县| 盐源县| 乌拉特后旗| 靖边县| 郑州市| 大名县| 禹城市| 灵丘县| 临城县| 吉林市| 遂平县| 绥德县| 万源市| 霍州市| 邢台县| 灵石县| 乐业县| 隆昌县| 钟祥市| 来凤县| 泉州市| 鄂温| 奉节县| 麦盖提县| 明星| 阜城县| 石河子市| 吴堡县| 阿城市|