欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于基于上下文的電子文件搜索的活動推薦的制作方法

文檔序號:6505233閱讀:227來源:國知局
基于基于上下文的電子文件搜索的活動推薦的制作方法
【專利摘要】本發(fā)明涉及基于基于上下文的電子文件搜索的活動推薦。一種計(jì)算機(jī)硬件實(shí)現(xiàn)的方法、系統(tǒng)和/或計(jì)算機(jī)程序產(chǎn)品基于電子文件中的識別的非合成事件元素產(chǎn)生活動推薦。執(zhí)行電子文件的數(shù)據(jù)庫的基于上下文的搜索以識別所有的電子文件中的共同合成事件,其中合成事件是一組上下文相關(guān)因素的不可執(zhí)行描述符。包含共同合成事件的每個電子文件是相關(guān)電子文件。針對每個相關(guān)電子文件搜索至少一個非合成事件元素,其中非合成事件元素是不存在于合成事件中的事件元素?;谧R別的非合成事件元素產(chǎn)生推薦。然后把一組二進(jìn)制數(shù)據(jù)發(fā)送給客戶端,該組二進(jìn)制數(shù)據(jù)包括合成事件、相關(guān)電子文件、非合成事件元素和所述推薦。
【專利說明】基于基于上下文的電子文件搜索的活動推薦
【技術(shù)領(lǐng)域】
[0001]本公開涉及計(jì)算機(jī)的領(lǐng)域,具體地講,涉及當(dāng)搜索文檔時的計(jì)算機(jī)的使用。更具體地講,本公開涉及在通過使用基于上下文的搜索來搜索文檔時的計(jì)算機(jī)的使用。
【背景技術(shù)】
[0002]文檔(諸如,技術(shù)文章、研究論文、學(xué)術(shù)論文、網(wǎng)頁、博客等)提供關(guān)于廣泛的范圍的主題的信息。信息的這種多樣性使得文檔對于許多不同類型的項(xiàng)目而言有價(jià)值。然而,當(dāng)前文檔搜索技術(shù)僅識別解決特定問題/主題的文檔,從而能夠回答特定問題和/或能夠確認(rèn)已知信息。

【發(fā)明內(nèi)容】

[0003]一種計(jì)算機(jī)硬件實(shí)現(xiàn)的方法、系統(tǒng)和/或計(jì)算機(jī)程序產(chǎn)品基于電子文件中的識別的非合成事件元素產(chǎn)生活動推薦。執(zhí)行電子文件的數(shù)據(jù)庫的基于上下文的搜索以識別所有的電子文件中的共同合成事件,其中合成事件是一組上下文相關(guān)因素的不可執(zhí)行描述符,并且其中在執(zhí)行電子文件的數(shù)據(jù)庫的基于上下文的搜索之前,共同合成事件的定義是未知的。包含共同合成事件的每個電子文件是相關(guān)電子文件。針對每個相關(guān)電子文件搜索至少一個非合成事件元素,其中非合成事件元素是不存在于合成事件中的事件元素。基于識別的非合成事件元素產(chǎn)生推薦。然后把一組二進(jìn)制數(shù)據(jù)被發(fā)送給客戶端,所述一組二進(jìn)制數(shù)據(jù)包括合成事件、相關(guān)電子文件、非合成事件元素和推薦。
【專利附圖】

【附圖說明】
[0004]圖1描述可實(shí)現(xiàn)本公開的示例性系統(tǒng)和網(wǎng)絡(luò);以及
[0005]圖2是為了基于電子文件中的識別的非合成事件元素產(chǎn)生活動推薦而由處理器執(zhí)行的一個或多個示例性步驟的高級流程圖。
【具體實(shí)施方式】
[0006]所屬【技術(shù)領(lǐng)域】的技術(shù)人員知道,本發(fā)明的各個方面可以實(shí)現(xiàn)為系統(tǒng)、方法或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明的各個方面可以具體實(shí)現(xiàn)為以下形式,即:完全的硬件實(shí)施方式、完全的軟件實(shí)施方式(包括固件、駐留軟件、微代碼等),或硬件和軟件方面結(jié)合的實(shí)施方式,這里可以統(tǒng)稱為“電路”、“模塊”或“系統(tǒng)”。此外,在一些實(shí)施例中,本發(fā)明的各個方面還可以實(shí)現(xiàn)為在一個或多個計(jì)算機(jī)可讀介質(zhì)中的計(jì)算機(jī)程序產(chǎn)品的形式,該計(jì)算機(jī)可讀介質(zhì)中包含計(jì)算機(jī)可讀的程序代碼。
[0007]可以采用一個或多個計(jì)算機(jī)可讀介質(zhì)的任意組合。計(jì)算機(jī)可讀介質(zhì)可以是計(jì)算機(jī)可讀信號介質(zhì)或者計(jì)算機(jī)可讀存儲介質(zhì)。計(jì)算機(jī)可讀存儲介質(zhì)例如可以是一但不限于一電、磁、光、電磁、紅外線、或半導(dǎo)體的系統(tǒng)、裝置或器件,或者任意以上的組合。計(jì)算機(jī)可讀存儲介質(zhì)的更具體的例子(非窮舉的列表)包括:具有一個或多個導(dǎo)線的電連接、便攜式計(jì)算機(jī)盤、硬盤、隨機(jī)存取存儲器(RAM)、只讀存儲器(ROM)、可擦式可編程只讀存儲器(EPR0M或閃存)、光纖、便攜式緊湊盤只讀存儲器(CD-ROM)、光存儲器件、磁存儲器件、或者上述的任意合適的組合。在本文件中,計(jì)算機(jī)可讀存儲介質(zhì)可以是任何包含或存儲程序的有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。
[0008]計(jì)算機(jī)可讀的信號介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號,其中承載了計(jì)算機(jī)可讀的程序代碼。這種傳播的數(shù)據(jù)信號可以采用多種形式,包括一但不限于一電磁信號、光信號或上述的任意合適的組合。計(jì)算機(jī)可讀的信號介質(zhì)還可以是計(jì)算機(jī)可讀存儲介質(zhì)以外的任何計(jì)算機(jī)可讀介質(zhì),該計(jì)算機(jī)可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。
[0009]計(jì)算機(jī)可讀介質(zhì)上包含的程序代碼可以用任何適當(dāng)?shù)慕橘|(zhì)傳輸,包括一但不限于一無線、有線、光纜、RF等等,或者上述的任意合適的組合。
[0010]可以以一種或多種程序設(shè)計(jì)語言的任意組合來編寫用于執(zhí)行本發(fā)明操作的計(jì)算機(jī)程序代碼,所述程序設(shè)計(jì)語言包括面向?qū)ο蟮某绦蛟O(shè)計(jì)語言一諸如Java、Smalltalk、C++等,還包括常規(guī)的過程式程序設(shè)計(jì)語言一諸如“C”語言或類似的程序設(shè)計(jì)語言。程序代碼可以完全地在用戶計(jì)算機(jī)上執(zhí)行、部分地在用戶計(jì)算機(jī)上執(zhí)行、作為一個獨(dú)立的軟件包執(zhí)行、部分在用戶計(jì)算機(jī)上部分在遠(yuǎn)程計(jì)算機(jī)上執(zhí)行、或者完全在遠(yuǎn)程計(jì)算機(jī)或服務(wù)器上執(zhí)行。在涉及遠(yuǎn)程計(jì)算機(jī)的情形中,遠(yuǎn)程計(jì)算機(jī)可以通過任意種類的網(wǎng)絡(luò)一包括局域網(wǎng)(LAN)或廣域網(wǎng)(WAN)—連接到用戶計(jì)算機(jī),或者,可以連接到外部計(jì)算機(jī)(例如利用因特網(wǎng)服務(wù)提供商來通過因特網(wǎng)連接)。
[0011]下面將參照根據(jù)本發(fā)明實(shí)施例的方法、裝置(系統(tǒng))和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或框圖描述本發(fā)明。應(yīng)當(dāng)理解,流程圖和/或框圖的每個方框以及流程圖和/或框圖中各方框的組合,都可以由計(jì)算機(jī)程序指令實(shí)現(xiàn)。這些計(jì)算機(jī)程序指令可以提供給通用計(jì)算機(jī)、專用計(jì)算機(jī)或其它可編程數(shù)據(jù)處理裝置的處理器,從而生產(chǎn)出一種機(jī)器,使得這些計(jì)算機(jī)程序指令在通過計(jì)算機(jī)或其它可編程數(shù)據(jù)處理裝置的處理器執(zhí)行時,產(chǎn)生了實(shí)現(xiàn)流程圖和/或框圖中的一個或多個方框中規(guī)定的功能/動作的裝置。
[0012]也可以把這些計(jì)算機(jī)程序指令存儲在計(jì)算機(jī)可讀介質(zhì)中,這些指令使得計(jì)算機(jī)、其它可編程數(shù)據(jù)處理裝置、或其他設(shè)備以特定方式工作,從而,存儲在計(jì)算機(jī)可讀介質(zhì)中的指令就產(chǎn)生出包括實(shí)現(xiàn)流程圖和/或框圖中的一個或多個方框中規(guī)定的功能/動作的指令的制造品(article of manufacture)0
[0013]也可以把計(jì)算機(jī)程序指令加載到計(jì)算機(jī)、其它可編程數(shù)據(jù)處理裝置、或其它設(shè)備上,使得在計(jì)算機(jī)、其它可編程數(shù)據(jù)處理裝置或其它設(shè)備上執(zhí)行一系列操作步驟,以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而使得在計(jì)算機(jī)或其它可編程裝置上執(zhí)行的指令提供實(shí)現(xiàn)流程圖和/或框圖中的方框中規(guī)定的功能/操作的處理。
[0014]現(xiàn)在參照附圖,并且具體地參照圖1,描述可由本發(fā)明的實(shí)現(xiàn)方式使用并且在本發(fā)明的實(shí)現(xiàn)方式中使用的示例性系統(tǒng)和網(wǎng)絡(luò)的方框圖。要注意的是,針對計(jì)算機(jī)102以及在計(jì)算機(jī)102內(nèi)顯示的示例性架構(gòu)(包括描述的硬件和軟件)中的一些或全部可由軟件部署服務(wù)器150、電子文件服務(wù)計(jì)算機(jī)152和/或客戶計(jì)算機(jī)154使用。
[0015]示例性計(jì)算機(jī)102包括處理器104,處理器104耦接到系統(tǒng)總線106。處理器104可使用一個或多個處理器,所述一個或多個處理器中的每一個具有一個或多個處理器核。驅(qū)動/支持顯示器110的視頻適配器108也耦接到系統(tǒng)總線106。系統(tǒng)總線106經(jīng)由總線橋112耦接到輸入/輸出(I/O)總線114。I/O接口 116耦接到I/O總線114。I/O接口116承擔(dān)與各種I/O裝置(包括鍵盤118、鼠標(biāo)120、介質(zhì)托盤122 (介質(zhì)托盤122可包括諸如⑶-ROM驅(qū)動器的存儲裝置、多媒體接口等)、打印機(jī)124和外部USB端口 126)的通信。盡管連接到I/O接口 116的端口的格式可以是對于計(jì)算機(jī)架構(gòu)領(lǐng)域技術(shù)人員而言已知的任何格式,但在一個實(shí)施例中,這些端口中的一些或全部是通用串行總線(USB)端口。
[0016]如上所述,計(jì)算機(jī)102能夠使用網(wǎng)絡(luò)接口 130與軟件部署服務(wù)器150以及電子文件服務(wù)計(jì)算機(jī)152和客戶計(jì)算機(jī)154通信。網(wǎng)絡(luò)接口 130是硬件網(wǎng)絡(luò)接口,諸如網(wǎng)絡(luò)接口卡(NIC)等。網(wǎng)絡(luò)128可以是外部網(wǎng)絡(luò)(諸如,互聯(lián)網(wǎng))或內(nèi)部網(wǎng)絡(luò)(諸如,以太網(wǎng)或虛擬專用網(wǎng)絡(luò)(VPN))。
[0017]硬盤驅(qū)動器接口 132也耦接到系統(tǒng)總線106。硬盤驅(qū)動器接口 132與硬盤驅(qū)動器134對接。在一個實(shí)施例中,硬盤驅(qū)動器134位于系統(tǒng)存儲器136中,系統(tǒng)存儲器136也耦接到系統(tǒng)總線106。系統(tǒng)存儲器被定義為計(jì)算機(jī)102中的最低級別的易失性存儲器。該易失性存儲器包括另外的較高級的易失性存儲器(未示出),包括但不限于,高速緩沖存儲器、寄存器和緩沖器。位于系統(tǒng)存儲器136中的數(shù)據(jù)包括計(jì)算機(jī)102的操作系統(tǒng)(OS) 138和應(yīng)用程序144。
[0018]0S138包括用于提供對資源(諸如,應(yīng)用程序144)的透明用戶訪問的殼(shell)140。通常,殼140是提供解釋器以及用戶和操作系統(tǒng)之間的界面的程序。更具體地講,殼140執(zhí)行被輸入到命令行用戶界面中的命令或者來自文件的命令。因此,殼140(也被稱為命令處理器)通常是操作系統(tǒng)軟件層級的最高級別,并用作命令解釋器。殼提供系統(tǒng)提示,解釋通過鍵盤、鼠標(biāo)或其它用戶輸入介質(zhì)輸入的命令,并把解釋的命令發(fā)送給操作系統(tǒng)的合適的更低級別(例如,內(nèi)核142)以用于處理。要注意的是,盡管殼140是基于文本、面向行的用戶界面,但本發(fā)明將會同樣很好地支持其它用戶界面模式,諸如圖形、語音、手勢等。
[0019]如上所述,0S138還包括內(nèi)核142,內(nèi)核142包括0S138的更低級別的功能,包括提供0S138的其它部分和應(yīng)用程序144所需的必要服務(wù),包括存儲器管理、進(jìn)程和任務(wù)管理、盤管理以及鼠標(biāo)和鍵盤管理。
[0020]應(yīng)用程序144包括以示例性方式顯示為瀏覽器146的渲染器。瀏覽器146包括能夠使萬維網(wǎng)(WWW)客戶端(例如,計(jì)算機(jī)102)使用超文本傳輸協(xié)議(HTTP)消息向互聯(lián)網(wǎng)發(fā)送網(wǎng)絡(luò)消息以及接收網(wǎng)絡(luò)消息的程序模塊和指令,由此能夠?qū)崿F(xiàn)與軟件部署服務(wù)器150和其它計(jì)算機(jī)系統(tǒng)的通信。
[0021]計(jì)算機(jī)102的系統(tǒng)存儲器(以及軟件部署服務(wù)器150的系統(tǒng)存儲器)中的應(yīng)用程序144還包括活動推薦產(chǎn)生邏輯(ARGL) 148。ARGL148包括用于實(shí)現(xiàn)以下描述的處理(包括圖2中描述的處理)的代碼。在一個實(shí)施例中,計(jì)算機(jī)102能夠從軟件部署服務(wù)器150下載ARGL148(包括按照需求),其中直至需要執(zhí)行ARGL148的代碼時才下載該代碼。還要注意的是,在本發(fā)明的一個實(shí)施例中,軟件部署服務(wù)器150執(zhí)行與本發(fā)明關(guān)聯(lián)的所有功能(包括ARGL148的執(zhí)行),由此使計(jì)算機(jī)102不必使用它自己的內(nèi)部計(jì)算資源執(zhí)行ARGL148。
[0022]要注意的是,在計(jì)算機(jī)102中描述的硬件元件不是窮舉性的,而是代表性的,以突出本發(fā)明所需的必要部件。例如,計(jì)算機(jī)102可包括替代的存儲器存儲裝置,諸如磁帶、數(shù)字通用盤(DVD)、Bernoul Ii盒等。這些和其它變型應(yīng)該落在本發(fā)明的精神和范圍內(nèi)。[0023]現(xiàn)在參照圖2,提供為了基于電子文件中的識別的非合成事件元素產(chǎn)生活動推薦而由處理器執(zhí)行的一個或多個示例性步驟的高級流程圖。在啟動塊202之后,執(zhí)行電子文件的數(shù)據(jù)庫的基于上下文的搜索以識別所有的電子文件中的共同合成事件,其中合成事件是一組上下文相關(guān)因素的不可執(zhí)行描述符(塊204)。也就是說,對所有的電子文件進(jìn)行上下文搜索以識別在所有的電子文件中包含的共享的(即,相同的)合成事件。這些電子文件由電子文件服務(wù)計(jì)算機(jī)(諸如,圖1中描述的電子文件服務(wù)計(jì)算機(jī)152)提供。
[0024]合成事件被定義為一組上下文相關(guān)因素的不可執(zhí)行描述符。例如,合成事件可以是單個文檔中(即,位于同一文檔內(nèi)是“上下文”)的一組詞A、B和C的出現(xiàn)(即,所有三個單詞的出現(xiàn)是該“因素”)。
[0025]合成事件的另一例子可以是在正在針對該病人診斷(由原發(fā)病引起的)繼發(fā)病(“上下文”)時的關(guān)于病人的事實(shí)的組合,諸如病人的年齡、當(dāng)前折磨該病人的原發(fā)病的醫(yī)療診斷、以及該病人正在服用的藥物的列表(“因素”)。
[0026]合成事件的另一例子可以是在正在研究特定疾病時正在科學(xué)實(shí)驗(yàn)室中檢查的一組特征。也就是說,在這個例子中,“上下文”將會是導(dǎo)向理解特定疾病的病源(基礎(chǔ)原因)的研究項(xiàng)目,并且“因素”是具有這種特定疾病的人共有的表現(xiàn)型(物理外觀)、基因型(基因組成)和環(huán)境(例如,暴露于某些化學(xué)品等)。
[0027]術(shù)語“基于上下文的搜索”被定義為針對合成事件具有預(yù)定上下文關(guān)系的電子文件的搜索。例如,假設(shè):在進(jìn)行特定領(lǐng)域(例如,腫瘤學(xué))的醫(yī)學(xué)研究的同時產(chǎn)生合成事件,從而電子文件和合成事件位于同一上下文內(nèi)。在這個例子中,活動類型(研究)定義上下文的范圍,并因此定義基于上下文的搜索的范圍,從而僅搜索直接與腫瘤學(xué)研究相關(guān)的文件。
[0028]如這里所使用的,電子文件被定義為任何文件或數(shù)據(jù)的集合。這種文件/數(shù)據(jù)集合的例子包括但不限于基于文本的文檔、圖像文件和音頻文件?;谖谋镜奈臋n的例子包括但不限于文本文件、博客、推特、電子郵件消息、網(wǎng)頁、即時消息等。圖像文件的例子包括但不限于用于電影的MPEG(運(yùn)動圖像專家組)文件、用于靜止照片的JPEG(聯(lián)合圖像專家組)文件、用于掃描文檔的TIFF(標(biāo)記圖像文件格式)和HF(便攜式文檔格式)文件、用于醫(yī)學(xué)圖像的DIC0M(醫(yī)學(xué)數(shù)字成像與通信)文件、用于天文學(xué)圖像的FITS (靈活圖像傳輸系統(tǒng))文件等。音頻文件的例子包括但不限于從麥克風(fēng)或其它聲音捕捉裝置產(chǎn)生的音頻記錄(例如,WAV文件、MP3文件、VOX文件等)。
[0029]當(dāng)搜索包含特定詞/短語的基于文本的文檔時,對文件數(shù)據(jù)庫中的每個文檔(電子文件)(例如,互聯(lián)網(wǎng)上或本地?cái)?shù)據(jù)庫中的研究論文、雜志文章等)執(zhí)行簡單的詞搜索。然而,在執(zhí)行基于文本的文檔的這種詞搜索之前,首先確定這個基于文本的文檔是否與合成事件是上下文相關(guān)的(或替代地,與合成事件是上下文不相關(guān)的),從而電子文件的搜索是基于上下文的。例如,假設(shè):合成事件是“城市”具有“90度”的平均高溫。在確定電子文檔是否包含合成事件元素“90degrees (90度)”之前,首先確定電子文檔是否實(shí)際上與氣象學(xué)相關(guān)。通過針對許多文章搜索列出的“關(guān)鍵詞”能夠執(zhí)行這種確定。這些關(guān)鍵詞提供描述基于文本的文檔的上下文的詞(諸如,“氣象學(xué)”)。然而,如果不存在這種關(guān)鍵詞列表,則必須針對文檔檢查上下文。
[0030]例如,如果搜索在特定電子文件中識別諸如“畢業(yè)證書”和“課程”的詞,則"90degrees (90學(xué)位)”很可能在描述學(xué)院,并被略過。類似地,如果“直角”或“食物”或“病人”或“槽鋼”位于特定電子文件中,則在第一實(shí)施例中這些文件也被略過(“上下文對準(zhǔn)”),因?yàn)檫@種電子文件的內(nèi)容不是上下文相關(guān)的。也就是說,基于上下文的搜索對于以下事物不感興趣,并且因此忽略它們:關(guān)于提供90個不同學(xué)科的畢業(yè)證書(由學(xué)院提供的“90學(xué)位”)的學(xué)院的文章、關(guān)于直角(弧的“90度”)的數(shù)學(xué)出版物、關(guān)于食物制備(推薦將調(diào)味料保持在“90度”以上的溫度)的文章、關(guān)于具有低溫癥的病人(描述病人的核心體溫下降到“90度”)的文章或者關(guān)于結(jié)構(gòu)鋼的小冊子(廣告宣傳“90度”槽鋼)。
[0031]然而,如果諸如“天氣”或“干旱”的術(shù)語出現(xiàn)在電子文件中,則該電子文件可能與合成事件(“城市具有90度的平均高溫”)相關(guān),并且由此被識別為上下文相關(guān)(“上下文對準(zhǔn)”),因此被識別為相關(guān)電子文件。
[0032]要注意的是,在另一實(shí)施例中,在特定文檔/電子文件中識別合成事件元素之后,進(jìn)行搜索的基于文本的文檔的上下文的確定。例如,假設(shè):基于文本的文檔很短(少于預(yù)定數(shù)量的詞)并且不具有“關(guān)鍵詞”列表。在這種情況下,在文檔中針對術(shù)語“城市”和“90度”進(jìn)行搜索。如果在文檔中發(fā)現(xiàn)所述術(shù)語,則在該文檔中搜索合成事件之前,上下文評估(使用上下文確定方法,諸如這里描述的上下文確定方法)確定該文檔是否相關(guān)。
[0033]盡管能夠如上所述執(zhí)行基于文本的文檔的搜索,但在視頻文件中搜索合成事件需要另外的處理。首先,進(jìn)行查詢以確定描述合成事件的元數(shù)據(jù)以及描述正被搜索的圖像的元標(biāo)簽是否可用。如果可用,則與文本搜索一樣,簡單地搜索該元數(shù)據(jù)/元標(biāo)簽。然而,如果這種元數(shù)據(jù)不可用(或者至少未在識別合成事件所需的具體程度上可用),則必須執(zhí)行圖像匹配。也就是說,構(gòu)成視頻文件的合成事件(視網(wǎng)膜具有指示視網(wǎng)膜中的孔的亮斑)的一部分的特定圖像(例如,亮斑)被數(shù)字化為二進(jìn)制值。然后,在其它數(shù)字化的電子視頻文件中搜索這個二進(jìn)制值以及來自合成事件的其它數(shù)字化的圖像(即,描述視網(wǎng)膜的數(shù)字文件)。對于音頻文件執(zhí)行類似處理,其中,特定聲音(例如,作為汽車事故的“上下文”內(nèi)的“上下文相關(guān)因素”的尖叫的輪胎)被數(shù)字化為二進(jìn)制值,該二進(jìn)制值被用在數(shù)字化的電子音頻文件的搜索中。
[0034]在一個實(shí)施例中,被選擇用于搜索的電子文件基于它們的源的等級,其中所述等級基于源的公共聲譽(yù)。例如,假設(shè):特定電子文件來自于已知的、受信任的并且非常受尊敬的源(例如,享有聲望的研究期刊)。源的這種描述(“已知的、受信任的、非常受尊敬的”)導(dǎo)致對這個特定源的重視。例如,這個源可被給予“9”的權(quán)重(按照1-10的標(biāo)度)。然而,另一電子文件來自于僅被給予“2”的權(quán)重的源,因?yàn)樗鼇碜杂谖幢煌袑彶榈牟┛蜅l目并且作者是匿名的。在這個例子中,較高等級(“9”)源的權(quán)重高于較低等級(“2”)源。在一個實(shí)施例中,在較低等級源之前搜索較高等級源,直至某一預(yù)定基線。也就是說,可預(yù)先確定最初將僅針對9-10之間等級的源搜索相關(guān)電子文件。如果時間、計(jì)算機(jī)資源和/或金錢仍然可用,則將會搜索7-8之間等級的源。該處理繼續(xù),直至I)不再有時間、計(jì)算機(jī)資源、金錢等可用;2)所有可用的電子文件已被檢查(例如,本地?cái)?shù)據(jù)庫內(nèi));或3)僅高于某一預(yù)定數(shù)字的等級的可用電子文件(例如,其源的等級高于“7”的那些電子文件)已被預(yù)先確定為被授權(quán)用于檢查,并且所有這種等級的電子文件已被檢查。
[0035]在一個實(shí)施例中,電子文件的源的等級基于由合成事件的產(chǎn)生者對源的使用的歷史頻率。例如,假設(shè):特定用戶和/或計(jì)算機(jī)系統(tǒng)例行地針對特定數(shù)據(jù)庫檢查電子文件。在第一實(shí)施例中,頻繁使用的源被視為更值得信賴,因此具有較高的權(quán)重。然而,在第二實(shí)施例中,使用頻率較低的(因此,更加模糊的)源被視為更可能提供未在以前考慮過的非合成事件元素(下面描述),因此具有較高的權(quán)重。在任一實(shí)施例中,在較低等級源之前搜索較高等級源,直至某一預(yù)定基線,如上所述。
[0036]要注意的是,在塊204中,在執(zhí)行搜索之前,不知道合成事件。也就是說,搜索電子文件的處理識別兩個或更多的電子文件中的共同合成事件。因此,該搜索并不開始于搜索已知的合成事件。
[0037]現(xiàn)在參照塊206,隨后針對每個相關(guān)電子文件(即,位于同一上下文內(nèi)的那些文件)搜索非合成事件元素(即,不存在于合成事件中的事件元素)。例如,假設(shè):合成事件是單個文檔(例如,病人的文件)內(nèi)的詞/術(shù)語A、B和C的出現(xiàn)。進(jìn)一步假設(shè)在塊204中描述的搜索用于在同一出版物(電子文件)內(nèi)具有術(shù)語A、B和C的在線出版物,并且假設(shè)一個或多個相關(guān)出版物(即,在同一文檔內(nèi)具有全部術(shù)語A、B和C的出版物)已被識別。一旦定位了這種相關(guān)電子文件,對該電子文件執(zhí)行基于上下文的搜索,以識別該電子文件內(nèi)的非合成事件元素。非合成事件元素是在合成事件中找不到的事件元素。在簡單的詞搜索的情況下,非合成事件元素將是詞/術(shù)語D的存在,詞/術(shù)語D在該合成事件(具有詞/術(shù)語A、B和C)中找不到。當(dāng)然,一個或兩個文檔將會包含其它詞/術(shù)語,但這些已被預(yù)先確定為與這里描述的處理無關(guān)。
[0038]在另一例子中,假設(shè):合成事件是城市具有90度的平均高溫。進(jìn)一步假設(shè):識別的相關(guān)電子文件也包含城市的人口水平的描述,城市的人口水平與城市的天氣沒有關(guān)系,因此不存在于合成事件中。然而,如果很高百分比(例如,超過某預(yù)定百分比)的電子文件描述相同的人口水平,則這種相關(guān)可被視為對于改進(jìn)當(dāng)前研究、策略等是重要的。例如,如果很大百分比的電子文件描述城市具有90度的平均溫度和超過2百萬的人口,則非合成事件元素(“超過2百萬的人口”)可能暗示需要創(chuàng)建關(guān)于對于將可能在給定的一年遭受熱相關(guān)傷害的已知百分比(例如,2%)的城市居民而言將需要什么類型的衛(wèi)生保健資源的策略。
[0039]現(xiàn)在參照塊208,基于在識別的相關(guān)電子文件中發(fā)現(xiàn)的識別的非合成事件元素產(chǎn)生推薦。然而,在一個實(shí)施例中,軟件邏輯(例如,圖1中描述的ARGL148的一部分)基于識別的非合成事件元素產(chǎn)生推薦,該推薦可被發(fā)送給客戶計(jì)算機(jī)(例如,圖1中示出的客戶計(jì)算機(jī)154)。這種推薦可用于:1)執(zhí)行與導(dǎo)致合成事件的產(chǎn)生的用戶活動(即,合成事件描述與用戶活動相關(guān)的因素)無關(guān)的活動,或2)執(zhí)行與這個原始用戶活動相關(guān)的另外的步驟。
[0040]例如,假設(shè):用戶和/或計(jì)算機(jī)邏輯產(chǎn)生描述與用戶執(zhí)行的科學(xué)實(shí)驗(yàn)室研究相關(guān)的因素的合成事件。這個用戶活動可以是來自特定的一組病人的血液樣本的研究,所述特定的一組病人具有肝炎,年齡超過65歲,并且是雜食的人(統(tǒng)稱為“合成事件A”)。使用這里描述的處理的電子文件的搜索揭示包含合成事件A并且還包含非合成事件元素(例如,對特定運(yùn)動隊(duì)的提及)的一個或多個電子文件。
[0041]在識別的相關(guān)電子文件中或者在任何其它電子文件中可能不存在使合成事件A與這個特定運(yùn)動隊(duì)的粉絲相關(guān)的任何事物,因?yàn)檫@二者看起來無關(guān)。然而,基于上下文的計(jì)算機(jī)邏輯能夠推斷這二者是相關(guān)的,并且將因此為用戶產(chǎn)生推薦以研究它們的聯(lián)系。因此,推薦能夠是計(jì)算機(jī)產(chǎn)生的用以:1)研究與參加由這個特定運(yùn)動隊(duì)進(jìn)行的比賽關(guān)聯(lián)的健康危害。也就是說,能夠隨后進(jìn)行推薦來研究與該特定運(yùn)動隊(duì)相關(guān)的主題,這可導(dǎo)致由基于上下文的計(jì)算機(jī)邏輯識別的自動售貨機(jī)(vendor),或者它可導(dǎo)致以前未報(bào)告的因素(例如,這個特定運(yùn)動隊(duì)的體育場比賽地點(diǎn)的適當(dāng)家政/衛(wèi)生處理)。
[0042]在一個實(shí)施例中,識別出許多(超過某一預(yù)定數(shù)量/百分比)的電子文件既提及合成事件A又提及這個特定運(yùn)動隊(duì)的基于上下文的計(jì)算機(jī)邏輯可提示這樣的推斷:合成事件A和該特定運(yùn)動隊(duì)相關(guān)。
[0043]在另一實(shí)施例中,可由基于上下文的計(jì)算機(jī)邏輯提示合成事件A和該特定運(yùn)動隊(duì)相關(guān)的該推斷,所述基于上下文的計(jì)算機(jī)邏輯把這個特定運(yùn)動隊(duì)與特定比賽地點(diǎn)關(guān)聯(lián)(在一個電子文件中),把這個特定比賽地點(diǎn)與特定自動售貨機(jī)關(guān)聯(lián)(在另一電子文件中),并且把這個特定自動售貨機(jī)與衛(wèi)生法典違反引用關(guān)聯(lián)(在又一電子文件中),由此導(dǎo)致基于上下文的計(jì)算機(jī)邏輯識別合成事件A和該特定運(yùn)動隊(duì)之間的可能聯(lián)系。
[0044]替代地,能夠進(jìn)行推薦用以:2)對來自由合成事件A描述的特定的一組病人的血液樣本執(zhí)行另外的實(shí)驗(yàn)室測試。例如,假設(shè):導(dǎo)致合成事件A的產(chǎn)生的當(dāng)前科學(xué)實(shí)驗(yàn)室研究僅僅旨在進(jìn)行血液樣本的顯微鏡檢查?;谧R別的非合成事件元素,可進(jìn)行推薦以執(zhí)行血液樣本的基因研究,以確定是否存在與合成事件A和這個特定運(yùn)動隊(duì)都關(guān)聯(lián)的任何基因突變。這個提議可能最初看起來毫無根據(jù)。然而,基因組的完整性的檢查可能提供實(shí)際支持該提議的線索/信息,或者至少提供新的研究方向的引導(dǎo)。
[0045]在本發(fā)明的另一實(shí)施例中,假設(shè):合成事件描述與診斷醫(yī)學(xué)病人相關(guān)的因素。也就是說,假設(shè)合成事件是:特定病人具有高血壓,年齡超過65歲,并且是雜食的人(統(tǒng)稱為“合成事件B”)。然而,衛(wèi)生保健提供者不能基于這些因素和病人的慢性疲勞的抱怨診斷繼發(fā)病(由原發(fā)病高血壓引起的)。電子文件數(shù)據(jù)庫(例如,來自互聯(lián)網(wǎng))的搜索揭示包括合成事件B以及非合成事件元素(諸如,對本地發(fā)電廠的提及)的一個或多個文檔(相關(guān)電子文件)。基于上述分析的類型,可產(chǎn)生推薦用以:1)執(zhí)行與導(dǎo)致該合成事件的產(chǎn)生的用戶活動無關(guān)的活動,或2)執(zhí)行與這個用戶活動相關(guān)的另外的步驟。也就是說,I)能夠進(jìn)行推薦以研究在識別的本地發(fā)電廠周圍的環(huán)境問題。替代地,2)能夠推薦衛(wèi)生保健提供者執(zhí)行該特定病人的基因研究。再一次,盡管這種研究將最初看起來是不必要的,但相關(guān)電子文件提供必要信息以提示這種另外的測試。
[0046]如塊210中所述,一組二進(jìn)制數(shù)據(jù)然后被發(fā)送給客戶計(jì)算機(jī)。這組二進(jìn)制數(shù)據(jù)包括:1)共享的合成事件;2)識別的相關(guān)電子文件(或至少它的位置);3)相關(guān)電子文件內(nèi)的識別的非合成事件元素的描述;以及4)推薦。也就是說,這組二進(jìn)制數(shù)據(jù)(能夠由處理器操縱)包括共享的合成事件自身(例如,上述合成事件A)。這組二進(jìn)制數(shù)據(jù)還包括相關(guān)電子文件自身或至少該相關(guān)電子文件到提供合成事件描述的計(jì)算機(jī)的位置描述符(例如,超鏈接、通用資源定位符(URL)、文件路徑等)。另外,這組二進(jìn)制數(shù)據(jù)包括非合成事件元素的描述。因此,在以上提供的氣象學(xué)例子中,合成事件將是城市具有90度的平均高溫,相關(guān)電子文件將是描述多少人居住在具有90度的平均高溫的同一城市(或替代地,另一城市)中的文檔,并且識別的非合成事件元素的描述是居住在同一城市(或替代地,另一城市)中的人的數(shù)量。最后,這組二進(jìn)制數(shù)據(jù)包括基于識別的非合成事件元素的推薦。
[0047]圖2中描述的處理結(jié)束于結(jié)束塊212。
[0048]附圖中的流程圖和框圖顯示了根據(jù)本發(fā)明的多個實(shí)施例的系統(tǒng)、方法和計(jì)算機(jī)程序產(chǎn)品的可能實(shí)現(xiàn)的體系架構(gòu)、功能和操作。在這點(diǎn)上,流程圖或框圖中的每個方框可以代表一個模塊、程序段或代碼的一部分,所述模塊、程序段或代碼的一部分包含一個或多個用于實(shí)現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為替換的實(shí)現(xiàn)中,方框中所標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個連續(xù)的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或動作的專用的基于硬件的系統(tǒng)來實(shí)現(xiàn),或者可以用專用硬件與計(jì)算機(jī)指令的組合來實(shí)現(xiàn)。
[0049]本文使用的術(shù)語僅用于描述具體實(shí)施例的目的,而非意圖限制本發(fā)明。本文使用的單數(shù)形式“a”、“an”和“the”意圖也包括復(fù)數(shù)形式,除非上下文清楚地另有指示。還將會理解,當(dāng)在本說明書中使用時,術(shù)語“包括”和/或“包含”指定存在陳述的特征、整數(shù)、步驟、操作、元件和/或部件,但不排除存在或增加一個或多個其它特征、整數(shù)、步驟、操作、元件、部件和/或它們的組合。
[0050]以下的權(quán)利要求中的所有裝置或步驟加功能元素的對應(yīng)結(jié)構(gòu)、材料、動作和等同物旨在包括用于結(jié)合具體要求保護(hù)的其它要求保護(hù)的要素執(zhí)行功能的任何結(jié)構(gòu)、材料或動作。為了說明和描述的目的提供本發(fā)明的各種實(shí)施例的描述,但并非是窮盡的或者把本發(fā)明局限于公開的形式。在不脫離本發(fā)明的范圍和精神的情況下,許多修改和變化對于本領(lǐng)域普通技術(shù)人員而言將會是清楚的。選擇并描述實(shí)施例,以便最好地解釋本發(fā)明的原理和實(shí)際應(yīng)用,并且使本領(lǐng)域其他普通技術(shù)人員能夠針對具有適合設(shè)想的具體用途的各種變化的各種實(shí)施例理解本發(fā)明。
[0051]還需要注意的是,在本公開中描述的任何方法可通過使用VHDL(VHSIC硬件描述語言)程序和VHDL芯片來實(shí)現(xiàn)。VHDL是用于現(xiàn)場可編程門陣列(FPGA)、專用集成電路(ASIC)和其它類似電子裝置的示例性設(shè)計(jì)輸入語言。因此,這里描述的任何軟件實(shí)現(xiàn)的方法可由基于硬件的VHDL語言仿真,VHDL語言隨后被應(yīng)用于VHDL芯片,諸如FPGA。
[0052]如此已通過參照本發(fā)明的說明性實(shí)施例詳細(xì)描述了本申請的本發(fā)明的實(shí)施例,將會清楚的是,在不脫離在所附權(quán)利要求中定義的本發(fā)明的范圍的情況下,可以實(shí)現(xiàn)修改和變化是顯而易見的。
【權(quán)利要求】
1.一種基于電子文件中的識別的非合成事件元素產(chǎn)生活動推薦的計(jì)算機(jī)硬件實(shí)現(xiàn)的方法,所述計(jì)算機(jī)硬件實(shí)現(xiàn)的方法包括:執(zhí)行電子文件的數(shù)據(jù)庫的基于上下文的搜索以識別所有的電子文件中的共同合成事件,其中合成事件是一組上下文相關(guān)因素的不可執(zhí)行描述符,其中在執(zhí)行電子文件的數(shù)據(jù)庫的基于上下文的搜索之前共同合成事件的定義是未知的,并且其中均包含共同合成事件的電子文件是相關(guān)電子文件;針對每個相關(guān)電子文件搜索至少一個非合成事件元素,其中非合成事件元素不存在于合成事件中;基于識別的非合成事件元素產(chǎn)生推薦;以及把一組二進(jìn)制數(shù)據(jù)發(fā)送給客戶計(jì)算機(jī),其中所述一組二進(jìn)制數(shù)據(jù)包含合成事件、相關(guān)電子文件、所述至少一個非合成事件元素以及所述推薦。
2.如權(quán)利要求1所述的計(jì)算機(jī)硬件實(shí)現(xiàn)的方法,其中,所述推薦推薦執(zhí)行與導(dǎo)致合成事件的產(chǎn)生的用戶活動相關(guān)的另外的步驟。
3.如權(quán)利要求1所述的計(jì)算機(jī)硬件實(shí)現(xiàn)的方法,其中所述合成事件描述與用戶活動相關(guān)的因素,其中用戶活動是科學(xué)實(shí)驗(yàn)室研究,并且其中所述計(jì)算機(jī)硬件實(shí)現(xiàn)的方法還包括:產(chǎn)生推薦以對與識別的非合成事件元素相關(guān)的主題執(zhí)行另外的科學(xué)實(shí)驗(yàn)室研究。
4.如權(quán)利要求1所述的計(jì)算機(jī)硬件實(shí)現(xiàn)的方法,其中所述合成事件描述與用戶活動相關(guān)的因素,其中用戶活動是診斷醫(yī)學(xué)病人,并且其中所述計(jì)算機(jī)硬件實(shí)現(xiàn)的方法還包括:產(chǎn)生推薦以對醫(yī)學(xué)病人執(zhí)行與識別的非合成事件元素相關(guān)的另外的醫(yī)學(xué)測試。`
5.如權(quán)利要求1所述的計(jì)算機(jī)硬件實(shí)現(xiàn)的方法,其中所述合成事件描述用戶活動,并且其中所述計(jì)算機(jī)硬件實(shí)現(xiàn)的方法還包括:基于用戶活動的活動類型確定基于上下文的搜索的上下文。
6.如權(quán)利要求1所述的計(jì)算機(jī)硬件實(shí)現(xiàn)的方法,還包括:對相關(guān)電子文件的源進(jìn)行評級,其中所述評級基于源的公共聲譽(yù);以及基于所述評級對識別的非合成事件元素進(jìn)行加權(quán)。
7.如權(quán)利要求1所述的計(jì)算機(jī)硬件實(shí)現(xiàn)的方法,還包括:對相關(guān)電子文件的源進(jìn)行評級,其中所述評級基于由合成事件的產(chǎn)生者對源的使用的歷史頻率;以及基于所述評級對識別的非合成事件元素進(jìn)行加權(quán)。
8.一種用于識別電子文件中的非合成事件元素的系統(tǒng),包括:構(gòu)造為執(zhí)行電子文件的數(shù)據(jù)庫的基于上下文的搜索以識別所有的電子文件中的共同合成事件的設(shè)備,其中合成事件是一組上下文相關(guān)因素的不可執(zhí)行描述符,其中在執(zhí)行電子文件的數(shù)據(jù)庫的基于上下文的搜索之前共同合成事件是未知的,并且其中均包含共同合成事件的電子文件是相關(guān)電子文件;構(gòu)造為針對每個相關(guān)電子文件搜索至少一個非合成事件元素的設(shè)備,其中非合成事件元素不存在于合成事件中;構(gòu)造為基于識別的非合成事件元素產(chǎn)生推薦的設(shè)備;以及構(gòu)造為把一組二進(jìn)制數(shù)據(jù)發(fā)送給客戶計(jì)算機(jī)的設(shè)備,其中所述一組二進(jìn)制數(shù)據(jù)包含合成事件、相關(guān)電子文件、所述至少一個非合成事件元素和所述推薦。
9.如權(quán)利要求8所述的系統(tǒng),其中所述推薦推薦執(zhí)行與導(dǎo)致合成事件的產(chǎn)生的用戶活動相關(guān)的另外的步驟。
10.如權(quán)利要求8所述的系統(tǒng),其中所述合成事件描述與用戶活動相關(guān)的因素,其中用戶活動是科學(xué)實(shí)驗(yàn)室研究,并且其中所述系統(tǒng)還包括:構(gòu)造為產(chǎn)生推薦以研究與識別的非合成事件元素相關(guān)的主題的設(shè)備。
11.如權(quán)利要求8所述的系統(tǒng),其中所述合成事件描述與用戶活動相關(guān)的因素,其中用戶活動是診斷醫(yī)學(xué)病人,并且其中所述系統(tǒng)還包括:構(gòu)造為產(chǎn)生推薦以對醫(yī)學(xué)病人執(zhí)行與識別的非合成事件元素相關(guān)的另外的醫(yī)學(xué)測試的設(shè)備。
12.如權(quán)利要求8所述的系統(tǒng),其中所述合成事件描述用戶活動,并且其中所述系統(tǒng)還包括:構(gòu)造為基于用戶活動的活動類型確定基于上下文的搜索的上下文的設(shè)備。
13.如權(quán)利要求8所述的系統(tǒng),還包括:構(gòu)造為對相關(guān)電子文件的源進(jìn)行評級的設(shè)備,其中所述評級基于源的公共聲譽(yù);以及構(gòu)造為基于所述評級對識別 的非合成事件元素進(jìn)行加權(quán)的設(shè)備。
14.如權(quán)利要求8所述的系統(tǒng),還包括:構(gòu)造為對相關(guān)電子文件的源進(jìn)行評級的設(shè)備,其中所述評級基于由合成事件的產(chǎn)生者對源的使用的歷史頻率;以及構(gòu)造為基于所述評級對識別的非合成事件元素進(jìn)行加權(quán)的設(shè)備。
【文檔編號】G06F17/30GK103530308SQ201310272570
【公開日】2014年1月22日 申請日期:2013年7月2日 優(yōu)先權(quán)日:2012年7月2日
【發(fā)明者】R·R·弗萊德朗得, J·R·可里默, J·西羅伯爾西科 申請人:國際商業(yè)機(jī)器公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
托克托县| 德昌县| 水城县| 教育| 五指山市| 厦门市| 叙永县| 安岳县| 杂多县| 台湾省| 慈利县| 广水市| 新建县| 台东市| 且末县| 长泰县| 阿瓦提县| 巴南区| 绥芬河市| 渝北区| 安仁县| 蒲江县| 班玛县| 扶风县| 榆树市| 水城县| 崇阳县| 介休市| 义马市| 田林县| 淳安县| 玉山县| 游戏| 江西省| 丰顺县| 中西区| 大荔县| 衡南县| 中方县| 闸北区| 满城县|