欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于文字搜尋的系統(tǒng)與方法

文檔序號:6651031閱讀:221來源:國知局
專利名稱:用于文字搜尋的系統(tǒng)與方法
技術領域
本發(fā)明是有關于數據庫搜尋引擎,特別是有關于使用加權的關鍵字或加權的句子來執(zhí)行文字搜尋的系統(tǒng)與方法。
背景技術
數據庫搜尋引擎(Search Engine)可以透過關鍵字的搜尋,針對多個文件進行搜尋比對。傳統(tǒng)使用搜尋引擎的方式,使用者必須依據搜尋引擎設定的格式,輸入至少一關鍵字(Keyword),以進行搜尋。大部分搜尋引擎所提供的搜尋服務,是基于布爾邏輯來執(zhí)行的。
在一布林搜尋詢問中,會加入布爾運算符來設定關鍵字之間的邏輯關系。其中,一般常用的布爾運算符包括“與(and)”、“或(or)”、“非(not)”等。就傳統(tǒng)的搜尋引擎而言,其對于每一個關鍵字都一致看待,而無法區(qū)分對于使用者的搜尋目的而言具有不同重要性的關鍵字。
這種無法區(qū)分具有不同重要性的搜尋引擎,其傳回的數據是為包含一長串超鏈接信息的列表數據,其中包含了與搜尋目的相關以及不相關的數據,使用者必須從中篩選出適當的數據。使用者常常必須實際瀏覽某一超鏈接對應的網頁信息,才能判斷該網頁信息是否合于需要。此種搜尋方式不準確,且使用者需耗費時間與精力,在為數眾多的搜尋結果中尋找符合需要的數據。

發(fā)明內容
本發(fā)明是有關于數據庫搜尋引擎,特別是有關于使用加權的關鍵字或加權的句子來執(zhí)行文字搜尋的系統(tǒng)與方法。
本發(fā)明提供一種用于文字搜尋的系統(tǒng)。該系統(tǒng)包含接口、搜尋模塊、及加權模塊。該接口,其接收一搜尋查詢數據,其包含至少一關鍵字及與該關鍵字對應的加權系數。該搜尋模塊,其是依據該關鍵字執(zhí)行一搜尋程序,以產生一搜尋結果數據,其中該搜尋結果數據是包含一符合項目列表。該加權模塊,其使用該加權系數計算該符合項目列表中各項目的分數,并依據該分數組織該符合項目列表。
本發(fā)明所述的用于文字搜尋的系統(tǒng),該搜尋查詢數據進一步包含一布爾運算符(Boolean operator),其是設定該至少一關鍵字之間的邏輯關系。
本發(fā)明所述的用于文字搜尋的系統(tǒng),該搜尋查詢數據包含一句子。
本發(fā)明所述的用于文字搜尋的系統(tǒng),進一步包含一前處理模塊,其是用以將包含于一搜尋查詢數據中的該句子分解為多個關鍵字。
本發(fā)明所述的用于文字搜尋的系統(tǒng),該加權系數是依據預設值決定的。
本發(fā)明所述的用于文字搜尋的系統(tǒng),該加權系數是依據先前使用過的設定值決定的。
本發(fā)明所述的用于文字搜尋的系統(tǒng),該加權系數是依據多筆先前使用過的設定值的統(tǒng)計運算結果決定的。
本發(fā)明所述的用于文字搜尋的系統(tǒng),該搜尋查詢數據包含至少二關鍵字及對應的至少二不相等的加權系數,其中該不相等的加權系數是用以設定其對應的關鍵字的不同重要程度。
本發(fā)明所述的用于文字搜尋的系統(tǒng),該接口包含一工具,其是用以標示該至少一關鍵字,使得能夠指定特定的加權系數給該標示的關鍵字。
本發(fā)明并提供一種用于文字搜尋的方法。該方法首先接收一搜尋查詢數據,其包含至少一關鍵字及與該關鍵字對應的加權系數。并依據該關鍵字執(zhí)行一搜尋程序,以產生一搜尋結果數據,其中該搜尋結果數據是包含一符合項目列表。繼之,使用該加權系數計算該符合項目列表中各項目的分數,并依據該分數組織該符合項目列表。
上述方法是可以通過將儲存于計算機可讀取儲存介質的計算機程序載入計算機系統(tǒng)中而實現。
本發(fā)明所述用于文字搜尋的系統(tǒng)與方法可實現快速、準確的文字搜索與排序。


圖1顯示依據本發(fā)明實施例的計算機系統(tǒng)的示意圖;圖2顯示依據本發(fā)明實施例搜尋服務系統(tǒng)的示意圖;圖3顯示依據本發(fā)明實施例搜尋服務方法的流程圖;圖4顯示依據本發(fā)明實施例的瀏覽器窗口示意圖。
具體實施例方式
為了讓本發(fā)明的目的、特征及優(yōu)點能更明顯易懂,下文特舉較佳實施例,并配合所附圖示圖1至圖4,做詳細的說明。本發(fā)明說明書提供不同的實施例來說明本發(fā)明不同實施方式的技術特征。其中,實施例中的各元件的配置是為說明之用,并非用以限制本發(fā)明。且實施例中圖式標號的部分重復,是為了簡化說明,并非意指不同實施例之間的關聯性。
圖1是為顯示依據本發(fā)明實施例的計算機系統(tǒng)的示意圖。依據本發(fā)明實施例,本發(fā)明是以一計算機可執(zhí)行程序模塊的型態(tài)為之,其包含可以于類似如個人計算機(PC)的環(huán)境執(zhí)行的指令。上述程序模塊可以包含用以執(zhí)行特定程序的程序碼、數據結構、及對象等。本發(fā)明的實施環(huán)境并不以本實施例的個人計算機為限,而可以實施于類似如可攜式裝置、微處理器為基礎的可程序電子裝置、或其他電子裝置等。
個人計算機10包含一處理裝置11、一存儲裝置13、及一系統(tǒng)總線19。其中系統(tǒng)總線19將存儲裝置13和其他系統(tǒng)元件與處理裝置11連結。系統(tǒng)總線19可以包含類似如存儲器總線、周邊總線、或局部總線等結構不同的總線。存儲裝置13包含一只讀存儲器(ROM)131及隨機存取存儲器(RAM)133。只讀存儲器131包含一基本輸入輸出系統(tǒng)(BIOS),其包含用以將信息在個人計算機10中的各元件間傳遞的基本指令。個人計算機10進一步包含硬盤驅動器(圖未顯示),其是用以將數據寫入一硬盤17,及將數據從該硬盤中擷取出來。該驅動器及其可計算機讀取的儲存介質,提供可用于計算機可讀取的指令、數據、程序模塊及個人計算機10所需使用的數據等的非易失性儲存。本發(fā)明的應用不以上述硬盤為限,其也可以應用其他種類的計算機可讀取儲存介質。程序模塊可以儲存于硬盤、只讀存儲器131、及/或隨機存取存儲器133。程序模塊可以包含操作系統(tǒng)程序171、至少一應用程序173、其他程序模塊175、以及程序數據177。使用者可以通過輸入裝置15將指令及信息輸入個人計算機10。輸入裝置15可以為類似如鍵盤、鼠標、麥克風等裝置。屏幕12或其他顯示裝置通過類似如影像轉接器121的裝置,與系統(tǒng)總線19連結。
個人計算機10可以通過網絡等方式,和一遠端計算機14連結遠端計算機14可以為另一臺個人計算機、服務器、路由器、網絡節(jié)點,或其他裝置。遠端計算機與一儲存裝置16連結。儲存裝置16是用以儲存一搜尋引擎程序18,其是可以提供個人計算機10一以網絡為基礎的搜尋服務。遠端計算機14通過一區(qū)域網絡(LAN)或廣域網絡(WAN)和個人計算機10連結。個人計算機10通過一網絡接口(圖未顯示)連結一區(qū)域網絡,并通過該區(qū)域網絡和遠端計算機14連結。當個人計算機10通過廣域網絡(例如因特網)和遠端計算機14連結時,其包含一類似如數據機的裝置來和廣域網絡連結。在上述網絡環(huán)境中,圖式中安裝于個人計算機10的程序模塊,其一部分也可以安裝于遠端儲存裝置16中。上述網絡以及計算機裝置的配置,是為例示,本發(fā)明的實施并不以上述為限。
個人計算機10中的應用程序173包含類似如瀏覽器程序或其他可用于瀏覽顯示網頁信息的應用程序。使用者可以利用如上述的瀏覽器程序來應用本發(fā)明所提供的方法及系統(tǒng)。
參見圖2,其顯示本發(fā)明文實施例搜尋服務系統(tǒng)的示意圖。在圖2中,顯示設于一般因特網兩臺計算機,其可以實施本實施例所揭示的接取搜尋服務的系統(tǒng)。
客戶端20是與因特網27連結,且其安裝有可用于瀏覽網頁的瀏覽器應用程序。在此所謂的網頁信息,是可以包含任何種類的內容,其儲存于一計算機裝置中,而可以供客戶端計算機下載瀏覽。在此所謂的因特網,也不限于任何特定結構的網絡。依據本發(fā)明實施例,在客戶端20的處理器210執(zhí)行的應用軟件可以包含瀏覽器21及查詢編輯器23。其中,瀏覽器21用于顯示圖形及文字。其中,查詢編輯器23是與瀏覽器21連結,其利用從瀏覽器21傳來的數據產生一對應的搜尋查詢數據。瀏覽器21接收該搜尋查詢數據,并通過因特網27將該搜尋查詢數據傳送至內容服務器29,同時將該搜尋查詢數據儲存于儲存裝置25中的詢問記錄251中保存之。該搜尋查詢數據包含至少一關鍵字。若該搜尋查詢數據包含兩個以上的關鍵字時,該兩個以上的關鍵字之間是包含布爾運算符,其中該布爾運算符是用以設定該關鍵字之間的邏輯關系。并且,在該搜尋查詢數據中的每一個關鍵字,都設有一個加權系數,其是用以設定上述每一個關鍵字在一特定搜尋程序中的攸關程度。該關鍵字對應的該加權系數是可以為使用者設定或依據預設值決定的。該搜尋查詢數據除了可以用布爾邏輯式的方式表示之外,還可以使用單一句子或多個句子來表示,以使得使用上更佳方便。當使用句子構成的搜尋詢問時,使用者可以利用一輸入裝置(圖未顯示)來指定該句子中各個文字的加權系數,其可以針對該句子中單一文字、部分文字、或所有文字指定其對應的加權系數。
客戶端20通過因特網27和內容服務器29連結。內容服務器29包含一搜尋引擎291,其提供針對數據庫295中儲存數據的內容的搜尋服務。數據庫295其能夠提供可搜尋的數據內容,其可以為一單純的數據儲存裝置,或任何形式的數據庫。使用者通過客戶端20輸入信息,以向搜尋引擎291下達搜尋指令。搜尋引擎291接收到上述搜尋指令后,執(zhí)行該搜尋指令,并擷取對應于該搜尋指令的數據。
搜尋引擎291包含一接口292、一搜尋模塊293、一加權模塊294。搜尋引擎291也可以包含一前處理模塊296。接口292接收從客戶端20傳送來的該搜尋查詢數據。其中,若該搜尋查詢數據為一關鍵字搜尋查詢數據,則其包含多個關鍵字、至少一布爾運算符、及加權系數。其中該布爾運算符是用以設定該關鍵字之間的邏輯關系。其中該加權系數是用以設定上述每一個關鍵字在一特定搜尋程序中的攸關程度。搜尋模塊293利用該關鍵字,執(zhí)行一搜尋程序,并產生一搜尋結果。其中該搜尋結果通常包含一符合項目列表,其中每一項目對應于一文件,而該文件中包含有符合使用者輸入關鍵字或其他搜尋條件的內容。該搜尋結果數據也可以包含該符合項目列表中各項目對應的文件的各種相關數據,例如文章標題、文件識別號碼、代表段落等。上述搜尋程序可以為精確關鍵字符合搜尋、進階關鍵字搜尋、或概念搜尋等。當該搜尋查詢數據包含單一句子或多個句子時,則由前處理模塊296將該單一句子或多個句子解析為多個關鍵字,并依據一預設的字匯設定,將攸關性低的文字略去。若該搜尋程序為一般的或進階的關鍵字搜尋,則由前處理模塊296針對上述解析得出的多個關鍵字,指定其對應的預設的布爾運算符。該預設的布爾運算符包括“與(and)”、“或(or)”、“非(not)”等。當該搜尋程序為概念搜尋時,前處理模塊296可以不必針對所有的關鍵字指定其對應的布爾運算符(在此例中關鍵字為表達概念的文字)。上述多個關鍵字以及不同關鍵字之間通過布爾運算符所設定的布林運算關系,或者上述用以表達概念的關鍵字,是由前處理模塊296傳送到搜尋模塊293,使得搜尋模塊293能夠依據上述方法執(zhí)行該搜尋程序。
當符合項目列表產生時,或在符合項目列表產生后,加權模塊294使用該加權系數計算該符合項目列表中各項目的分數,并依據該分數組織該符合項目列表。當該搜尋程序為概念搜尋時,并無指定布爾邏輯運算,而該搜尋結果的列表數據是可以包含整個數據庫或是預設的一部分數據庫。加權模塊294重新調整上述搜尋結果的符合項目列表中各項目的排序。
搜尋指令執(zhí)行完畢后,搜尋引擎291將搜尋結果傳送至客戶端20。上述搜尋結果瀏覽器21將該搜尋結果顯示于一瀏覽窗口中。
圖3顯示依據本發(fā)明實施例搜尋服務方法的流程圖。
該方法首先接收使用者輸入的至少一關鍵字,作為搜尋引擎291執(zhí)行網絡基礎的搜尋服務的搜尋條件。該搜尋條件可以包含搜尋查詢數據,若該搜尋查詢數據為一關鍵字搜尋查詢數據則其包含多個關鍵字、至少一布爾運算符、及加權系數。其中該布爾運算符是用以設定該關鍵字之間的邏輯關系。其中該加權系數是用以設定上述每一個關鍵字在一特定搜尋程序中的攸關程度。該搜尋查詢數據也可以包含單一句子或多個句子。
在步驟S31中,使用者輸入第一文字數據,其可以包含關鍵字以及各關鍵字之間的布爾運算符。或者,使用者可以將一文章的摘要或其他一段文字,直接復制剪貼到畫面40的編輯框41中,參見圖4。上述文字數據可以包含任何長度的任何文字信息。如果有需要的話,使用者也可以在文字框41中輸入第二文字數據,如步驟S 32所示,并使用布爾運算符來設定該第一文字數據和該第二文字數據之間的邏輯關系,如步驟S33所示。該布爾運算符可以包括“與(and)”、“或(or)”、“非(not)”等一般的邏輯運算符,也可以包含其他用以設計不同關系的運算符,例如括號及“鄰近(near)”等。使用者可以從剛才輸入的該第一文字數據和該第二文字數據中選取一或數個文字,并利用不同的標示方法來標示選取的上述文字,如步驟S34所示。其中,每一種不同的標示方式對應于一預設的具有特定值的加權系數。上述標示選取文字的方式可以依據實際需要及使用方便等考量而設計。例如,上述標示可以利用不同顏色、字體、下標線等方式來表示。依據本發(fā)明實施例,使用分別與加權系數10、5、及3對應的3種標示。其中,沒有被選取及標示的文字,其加權系數一律指定為1。上述加權系數的數值,是可以各種不同方式,依據實際實施狀況訂定之。例如該加權系數可以通過使用者設定、依據預設值、依據多筆先前使用過的設定值的統(tǒng)計運算結果來決定、或依據先前使用過的設定值來決定。
依據本發(fā)明實施例,客戶端20的查詢編輯器23依據使用者輸入的數據,產生一搜尋查詢數據,如步驟S35所示。該搜尋查詢數據包含使用者所指定的多個關鍵字、與關鍵字對應的加權系數以及布爾運算符。在某些情況下,使用者輸入關于搜尋條件的數據,也可能不經過進一步的編輯等處理,直接傳送到接口292。
接口292透過因特網27,接收從客戶端20傳送來的使用者輸入的搜尋查詢數據,如步驟S 36所示。如果有需要,前處理模塊296于步驟S370中先執(zhí)行前處理程序。搜尋模塊293執(zhí)行一搜尋程序,以尋找符合全部或部分搜尋詢問條件的檔案,如步驟S371所示。搜尋模塊293執(zhí)行該搜尋程序所得到的搜尋結果,包含一符合項目列表。其中該符合項目列表中每一項目對應一文件檔案,而該文件檔案中包含有符合使用者輸入關鍵字或其他搜尋條件的內容。依據本發(fā)明實施例,在一初始階段中,經搜尋找到的上述符合搜尋條件的文件檔案,是依據其檔案內容中所包含關鍵字出現次數進行評比與排列,如步驟S372所示。某一特定文件檔案中該關鍵字的出現次數,進一步依據該關鍵字對應的加權系數加以調整,如步驟S373所示。繼之,依據該調整過的出現次數,重新決定該文件檔案的評比排序,如步驟S374所示。上述步驟S372~S374是可以即時回饋調整的方式進行,而不一定要如上所述的依序進行。上述文件檔案的評比與排序,除了可以使用如上所述的關鍵字出現次數來進行外,亦可以同時參照其他參考值進行,例如關鍵字使用比例、關鍵字出現處之間的距離、關鍵字之間的叢集關系等。
經過上述調整過的搜尋結果,是包含一依據上述調整過的評比排序而重新組織過的評比排序列表。該調整過的評比排序列表并被傳送到客戶端20,如步驟S38所示。
上述調整過的評比排序列表可以包含上述文件檔案的網絡超鏈接數據,并將該調整過的評比排序列表中的網絡超鏈接數據顯示在客戶端20的瀏覽器窗口中。
上述搜尋結果的調整過的評比排序列表包含符合搜尋條件的文件檔案的儲存地址,且上述搜尋結果被顯示于第一瀏覽窗口中,呈現給使用者端20,如步驟S39所示。該第一瀏覽窗口是如圖4所示。使用者查看顯示于第一瀏覽窗口中的搜尋結果,并點選搜尋結果中的超鏈接數據,來確認搜尋程序所找到的文件檔案是否確為其所需要。若使用者認為搜尋結果不符合其所需,則使用者可以重新指定及/或調整該關鍵字及加權系數等,以重新執(zhí)行一搜尋程序。
圖4顯示依據本發(fā)明實施例的瀏覽器窗口示意圖。網頁產生模塊提供類似如超文本標記語言或其他標簽基礎的語言的數據給安裝有瀏覽器21的客戶端20,使得其用以產生畫面40。畫面40包含一標準操作系統(tǒng)指令行44及瀏覽器指令鈕42。畫面40包含多個視框,提供不同種類的超鏈接信息以及其他信息。上述多個視框以及畫面40中各種內容的實際配置,是可以依據實際需要而設計。視框43為搜尋服務視框,其提供一般的搜尋功能組件,例如用以輸入搜尋條件及編輯搜尋條件的文字框等。設于畫面左下角的視框47則是用以呈現多個功能按鈕,用以啟動在查詢編輯器23中的各個功能,例如前述的編輯搜尋條件功能、指定布爾運算符功能、以及設定加權系數功能等。當使用者輸入一或數個關鍵字時,包含至少一超鏈接信息的列表的搜尋結果會顯示在視框45。
雖然本發(fā)明已通過較佳實施例說明如上,但該較佳實施例并非用以限定本發(fā)明。本領域的技術人員,在不脫離本發(fā)明的精神和范圍內,應有能力對該較佳實施例做出各種更改和補充,因此本發(fā)明的保護范圍以權利要求書的范圍為準。
附圖中符號的簡單說明如下個人計算機10處理裝置11存儲裝置13系統(tǒng)總線19ROM131
RAM133硬盤17操作系統(tǒng)程序171應用程序173其他程序模塊175程序數據177輸入裝置15影像轉接器121屏幕12遠端計算機14儲存裝置16搜尋引擎程序18客戶端20因特網27處理器210瀏覽器21查詢編輯器23內容服務器29儲存裝置25詢問記錄251搜尋引擎291數據庫295接口292搜尋模塊293加權模塊294前處理模塊296畫面40
標準操作系統(tǒng)指令行44瀏覽器指令鈕42視框43~4權利要求
1.一種用于文字搜尋的系統(tǒng),所述用于文字搜尋的系統(tǒng)包括一接口,其接收一搜尋查詢數據,其包含至少一關鍵字及與該關鍵字對應的加權系數;一搜尋模塊,其是依據該關鍵字執(zhí)行一搜尋程序,以產生一搜尋結果數據,其中該搜尋結果數據是包含一符合項目列表;以及一加權模塊,其使用該加權系數計算該符合項目列表中各項目的分數,并依據該分數組織該符合項目列表。
2.根據權利要求1所述的用于文字搜尋的系統(tǒng),其特征在于,該搜尋查詢數據進一步包含一布爾運算符,其是設定該至少一關鍵字之間的邏輯關系。
3.根據權利要求1所述的用于文字搜尋的系統(tǒng),其特征在于,該搜尋查詢數據包含一句子。
4.根據權利要求3所述的用于文字搜尋的系統(tǒng),其特征在于,進一步包含一前處理模塊,其是用以將包含于一搜尋查詢數據中的該句子分解為多個關鍵字。
5.根據權利要求1所述的用于文字搜尋的系統(tǒng),其特征在于,該加權系數是依據預設值決定的。
6.根據權利要求1所述的用于文字搜尋的系統(tǒng),其特征在于,該加權系數是依據先前使用過的設定值決定的。
7.根據權利要求6所述的用于文字搜尋的系統(tǒng),其特征在于,該加權系數是依據多筆先前使用過的設定值的統(tǒng)計運算結果決定的。
8.根據權利要求1所述的用于文字搜尋的系統(tǒng),其特征在于,該搜尋查詢數據包含至少二關鍵字及對應的至少二不相等的加權系數,其中該不相等的加權系數是用以設定其對應的關鍵字的不同重要程度。
9.根據權利要求1所述的用于文字搜尋的系統(tǒng),其特征在于,該接口包含一工具,其是用以標示該至少一關鍵字,使得能夠指定特定的加權系數給該標示的關鍵字。
10.一種用于文字搜尋的方法,所述用于文字搜尋的方法包括接收一搜尋查詢數據,其包含至少一關鍵字及與該關鍵字對應的加權系數;依據該關鍵字執(zhí)行一搜尋程序,以產生一搜尋結果數據,其中該搜尋結果數據是包含一符合項目列表;以及使用該加權系數計算該符合項目列表中各項目的分數,并依據該分數組織該符合項目列表。
全文摘要
本發(fā)明提供一種用于文字搜尋的系統(tǒng)與方法,所述用于文字搜尋的系統(tǒng)包含接口、搜尋模塊、及加權模塊。該接口,其接收一搜尋查詢數據,其包含至少一關鍵字及與該關鍵字對應的加權系數。該搜尋模塊,其是依據該關鍵字執(zhí)行一搜尋程序,以產生一搜尋結果數據,其中該搜尋結果數據是包含一符合項目列表。該加權模塊,其使用該加權系數計算該符合項目列表中各項目的分數,并依據該分數組織該符合項目列表。本發(fā)明所述用于文字搜尋的系統(tǒng)與方法可實現快速、準確的文字搜索與排序。
文檔編號G06F17/30GK1783089SQ20051012613
公開日2006年6月7日 申請日期2005年11月30日 優(yōu)先權日2004年12月2日
發(fā)明者林大器 申請人:臺灣積體電路制造股份有限公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
黑水县| 登封市| 象州县| 电白县| 黑龙江省| 油尖旺区| 宜黄县| 临武县| 淮阳县| 报价| 靖西县| 阿克苏市| 青河县| 万州区| 石屏县| 奎屯市| 江油市| 阿坝| 宁河县| 泾川县| 垫江县| 左贡县| 邹平县| 三原县| 启东市| 江达县| 老河口市| 平乡县| 都昌县| 灵璧县| 津南区| 洛宁县| 富川| 特克斯县| 张北县| 阜新市| 正阳县| 外汇| 南投市| 莆田市| 时尚|