用于網絡中的可搜索數(shù)據(jù)的索引配置的制作方法
【專利說明】用于網絡中的可搜索數(shù)據(jù)的索引配置
【背景技術】
[0001] 計算裝置常常用來通過網絡如因特網通信。由服務提供商提供的基于網絡的服務 變得更加普遍。計算裝置被經常用來連接到基于網絡的服務,所述基于網絡的服務可提供 服務,如存儲將要由計算裝置使用/檢索的可搜索數(shù)據(jù)或將額外的處理功率提供到計算裝 置。關于可搜索數(shù)據(jù)的基于網絡的存儲,計算裝置的用戶通常需要為其數(shù)據(jù)選擇配置和/ 或格式,使得其數(shù)據(jù)可由基于網絡的服務索引且存儲。常規(guī)方法通常需要用戶確定用于其 數(shù)據(jù)的適合配置。常規(guī)方法還可能需要用戶的數(shù)據(jù)必須符合的格式,進而要求用戶將其數(shù) 據(jù)轉換成所述格式。這對于想要使用基于網絡的服務來存儲和搜索的用戶可能是不方便、 麻煩或困難的,進而減少整體用戶體驗。
【附圖說明】
[0002] 將參照附圖描述根據(jù)本公開的各個實施方案,在附圖中:
[0003] 圖1示出可利用各個實施方案的方面的示例性環(huán)境;
[0004] 圖2示出用于聯(lián)網環(huán)境中的可搜索數(shù)據(jù)的索引配置的示例性系統(tǒng)實施方案;
[0005] 圖3示出可利用用于聯(lián)網環(huán)境中的可搜索數(shù)據(jù)的索引配置的示例性網頁瀏覽環(huán) 境;
[0006] 圖4示出可根據(jù)各個實施方案產生的示例性搜索索引;
[0007] 圖5示出用于聯(lián)網環(huán)境中的可搜索數(shù)據(jù)的索引配置的示例性方法實施方案;
[0008] 圖6示出可用來實現(xiàn)各個實施方案的方面的示例性裝置;
[0009] 圖7示出客戶端裝置如圖6中所示出的所述裝置的示例性部件;以及
[0010] 圖8示出可實現(xiàn)各個實施方案的環(huán)境。
【具體實施方式】
[0011] 描述產生索引配置的系統(tǒng)和方法,所述索引配置可用來產生用于通過至少一個網 絡接收的數(shù)據(jù)的搜索索引。至少一些實施方案允許計算裝置通過網絡(例如,因特網)將 數(shù)據(jù)上傳到由網絡服務(即,網絡服務提供商)所提供的存儲分配上。網絡服務可分析所 上傳數(shù)據(jù)以確定多個數(shù)據(jù)字段中的每個數(shù)據(jù)字段的數(shù)據(jù)字段的類型(即,數(shù)據(jù)字段類型)。 網絡服務可分析所上傳數(shù)據(jù)以確定是否允許用于多個數(shù)據(jù)字段中的每個數(shù)據(jù)字段的一個 或多個搜索選項被包括在所上傳數(shù)據(jù)中。
[0012] 至少一些實施方案允許計算裝置通過網絡(例如,因特網)將數(shù)據(jù)上傳到由網絡 服務(即,網絡服務提供商、基于網絡的服務等)所提供的存儲分配上。一個或多個用戶/ 實體(例如,使用一個或多個計算裝置)可利用搜索索引通過網絡來搜索所上傳的數(shù)據(jù),所 述搜索索引可由網絡服務提供。
[0013] 在一些實施方案中,所上傳的數(shù)據(jù)可包括多個數(shù)據(jù)字段。網絡服務可分析所上傳 數(shù)據(jù)以確定多個數(shù)據(jù)字段中的每個數(shù)據(jù)字段的數(shù)據(jù)字段的類型(即,數(shù)據(jù)字段類型)。例 如,每個數(shù)據(jù)字段可以具有包括整型、文本類型或文字類型的類型。
[0014] 此外,網絡服務可分析所上傳數(shù)據(jù)以確定是否允許用于多個數(shù)據(jù)字段中的每個數(shù) 據(jù)字段的一個或多個搜索選項被包括在所上傳數(shù)據(jù)中。例如,網絡服務可確定針對每個相 應數(shù)據(jù)字段,是否允許將相應數(shù)據(jù)字段包括在將要產生的搜索索引中的選項。網絡服務還 可確定針對每個相應數(shù)據(jù)字段,是否允許將計算相應數(shù)據(jù)字段的面數(shù)的選項。此外,網絡服 務可確定針對每個相應數(shù)據(jù)字段,是否允許將響應于搜索查詢而返回/提供與相應數(shù)據(jù)字 段相關聯(lián)的值的選項。
[0015] 在一些實施方案中,網絡服務可產生用于至少部分基于所確定的數(shù)據(jù)字段類型和 將要允許的搜索選項的數(shù)據(jù)的索引配置(即,搜索索引配置、模式、索引設置等)。網絡服務 可至少部分基于索引配置產生用于數(shù)據(jù)的搜索索引。
[0016] 如可根據(jù)各個實施方案提供,下文描述且提出各種其它功能和優(yōu)點。
[0017] 圖1示出可利用各個實施方案中的方面的示例性環(huán)境100。示例性環(huán)境100可包 括至少一個計算裝置102、網絡104(例如,因特網、內聯(lián)網、本地網絡、局域網等)和網絡服 務106 (即,網絡服務提供商、基于網絡的服務等)。至少一個計算裝置102可通過網絡104 來通信地連接到網絡服務106。在一些實施方案中,計算裝置102可在沒有網絡104如因特 網的情況下傳送網絡服務106。如圖1中所示,還可存在至少一個計算裝置102的用戶108 或其他實體(例如,個人、公司、組織、團體等)108。用戶或實體108可通過網絡104將數(shù)據(jù) 110從至少一個計算裝置102傳送到網絡服務106 (且反之亦然)。
[0018] 在一些實施方案中,網絡服務106可包括和/或利用連接到網絡104的一個或多 個主機或服務器。例如,網絡服務106可將存儲空間租用給客戶,如裝置102的用戶或另一 個實體(例如,公司、組織、群體、個人等)108。因此,計算裝置102的用戶/實體108可使 用網絡104將來自裝置102的數(shù)據(jù)存儲到網絡服務106上。換句話說,用戶/實體108和 /或裝置102可經由網絡服務106利用基于網絡的計算存儲。
[0019] 在一個實例中,計算裝置102可通過網絡104傳輸將要被存儲在網路服務106上 的數(shù)據(jù)110,如圖1中所示。數(shù)據(jù)110可以是用于基于網絡的計算的任何數(shù)據(jù),如用于搜索、 數(shù)據(jù)庫存儲、運行應用程序、運行虛擬機、運行操作系統(tǒng)等的數(shù)據(jù)。計算裝置102可傳輸將 要存儲在由服務106提供的存儲分配上的數(shù)據(jù)110。例如,用戶/實體108可購買或租用服 務106上的存儲空間,并且存儲分配可被分配和指派到用戶/實體108。在一些實施方案 中,用戶/實體108在服務106上可具有特定賬戶和/或存儲分配;被分配到實體108的存 儲空間(例如,存儲分配)可與實體108的賬戶相關聯(lián)。
[0020] 實體108還可能希望網絡服務106提供用于數(shù)據(jù)110的搜索索弓丨。常規(guī)方法通常 需要實體108首先為將要被索引的數(shù)據(jù)110提供配置(即,索引配置、模式、索引設置等), 或常規(guī)方法可能需要實體數(shù)據(jù)110必須符合的配置/格式(例如,搜索數(shù)據(jù)格式(SDF)),因 此要求實體110將其數(shù)據(jù)110轉換成所需的配置。然而,這對于實體108來說是不方便、麻 煩或困難的。
[0021] 在一些實施方案中,實體108可將數(shù)據(jù)110傳輸?shù)骄W絡服務106,并且網絡服務 106可自動(例如,無需來自實體108的指令或請求)分析數(shù)據(jù)110且產生用于數(shù)據(jù)110 的索引配置(例如,搜索索引配置、搜索索引模式等)。例如,在一些實施方案中,網絡服務 106可通過確定包括在數(shù)據(jù)110中的一個或多個數(shù)據(jù)字段的數(shù)據(jù)字段類型112以及確定將 要允許的用于包括在數(shù)據(jù)110中的一個或多個數(shù)據(jù)字段的搜索選項114來分析數(shù)據(jù)110。
[0022] 關于確定數(shù)據(jù)字段的類型112,可存在可與數(shù)據(jù)110 (例如,文檔、文件等)相關聯(lián) 的多種數(shù)據(jù)字段類型,如整型的數(shù)據(jù)字段、文字類型的數(shù)據(jù)字段或文本類型的數(shù)據(jù)字段等 等。在一些實施方案中,數(shù)據(jù)110可包括多個數(shù)據(jù)字段,每個數(shù)據(jù)字段包括值(例如,數(shù)據(jù) 字段"名稱"可具有"ABCD-品牌襯衫"的值;數(shù)據(jù)字段"價格"可具有"$20'的值等)。網 絡服務106可分析包括在數(shù)據(jù)110中的多個數(shù)據(jù)字段,以便確定多個數(shù)據(jù)字段中的每個數(shù) 據(jù)字段的數(shù)據(jù)字段的類型。
[0023] 例如,對于每個數(shù)據(jù)字段而言,網絡服務106可確定每個相應數(shù)據(jù)字段的值是否 包括超過指定的整數(shù)數(shù)量閾值(例如,數(shù)據(jù)字段"價格"的值全是整數(shù))的整數(shù)數(shù)量;如果 是這樣,那么可以確定那個相應數(shù)據(jù)字段是整數(shù)數(shù)據(jù)字段類型。網絡服務106還可通過例 如確定以下的至少一個來確定數(shù)據(jù)字段是否是文字數(shù)據(jù)字段類型:與數(shù)據(jù)字段相關聯(lián)的值 具有超過指定的文字數(shù)量下限值但低于指定的文字數(shù)量上限值的字母字符數(shù)量;與數(shù)據(jù)字 段相關聯(lián)的不同值的數(shù)目低于指定的文字不同數(shù)量閾值;不同值的百分比低于指定的文字 不同百分比閾值;或值的長度低于指定的文字長度閾值。在一些實施方案中,網絡服務106 可例如考慮數(shù)據(jù)字段值的長度和數(shù)據(jù)字段值中的不同值的頻率和/或百分比以將數(shù)據(jù)字 段識別為文本類型;如果數(shù)據(jù)字段值中存在許多不同值并且數(shù)據(jù)字段值很長(例如,具有 超過閾值的字母字符數(shù)目),那么數(shù)據(jù)字段很可能是文本類型。在一些實施方案中,如果數(shù) 據(jù)字段不是整數(shù)類型或文字類型,那么數(shù)據(jù)字段可以是文本類型。
[0024] 關于確定搜索選項114,網絡服務106可確定將要允許的用于數(shù)據(jù)110 (的數(shù)據(jù)字 段)的一個或多個搜索選項114。例如,在