欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

智能自動填充的制作方法

文檔序號:6550496閱讀:273來源:國知局

專利名稱::智能自動填充的制作方法
技術(shù)領(lǐng)域
:本發(fā)明一般涉及學(xué)習(xí)用戶信息,特別涉及將基于用戶的輸入映射到基于web的表格的一個或多個字段,以便于用戶信息地自動輸入。
背景技術(shù)
:因特網(wǎng)上的通信和交易業(yè)務(wù)對于工作職業(yè)人員(workingprofessional)以及購買人群(buyingpublic)來說已變得每天都要經(jīng)歷到。例如在購買產(chǎn)品時、請求信息時、或提交問題時,因特網(wǎng)用戶通常被要求填寫許多表格(其中的一些表格可能或可能不相類似)。用戶必須在各種不同的表格上重復(fù)地輸入相同的信息,包括它們的姓名、家庭住址、工作地址、電子郵件地址、和/或電話號碼。不幸的是,試圖解決這些問題的傳統(tǒng)方法是有問題的。例如,在某些技術(shù)中,僅當(dāng)表格與先前的表格相同時,先前的輸入項才能被記憶出??紤]到因特網(wǎng)上范圍巨大的網(wǎng)站和大量的網(wǎng)站所有者和操作者,這可能不是一種在因特網(wǎng)上用于降低對用戶時間的浪費和提高用戶效率的合理方法。其它傳統(tǒng)的方法可提供某些數(shù)據(jù)的自動輸入,然而,這些方法仍然是不完善的,因此,不能滿足當(dāng)今的因特網(wǎng)用戶的眾多需求。
發(fā)明內(nèi)容下面給出了本發(fā)明的簡要概述,以便提供對本發(fā)明的某些方面的基本理解。該概述并非本發(fā)明的大范圍的概述。并不意圖標(biāo)識本發(fā)明的關(guān)鍵/決定性的元件,或描繪本發(fā)明的范圍。其唯一目的是以簡單的形式給出本發(fā)明的某些概念,作為后述的更為詳細(xì)的描述的前序。本發(fā)明涉及一種改進(jìn)的數(shù)據(jù)輸入技術(shù),由瀏覽器使用于各種不同的web表格中,使得用戶的努力最小化。更為具體地來說,本發(fā)明提供了一種能夠采用機(jī)器學(xué)習(xí)技術(shù)跨各種不同的web表格自動填充一個或多個字段的系統(tǒng)和/或方法。通過使用機(jī)器學(xué)習(xí)技術(shù),瀏覽器或其它工具化工具能夠?qū)W習(xí)哪些數(shù)據(jù)或哪些類型的數(shù)據(jù)與哪些字段或哪些類型的字段相關(guān)。也可學(xué)習(xí)其它類型的相關(guān),例如,特定輸入輸入到某一特定web頁面上的某些特定字段中。例如,與明確的編程相比,本發(fā)明的機(jī)器學(xué)習(xí)技術(shù)能夠提高數(shù)據(jù)自動填充能力。根據(jù)一個方法,該系統(tǒng)和方法能夠利用關(guān)于用戶的信息的一個或多個數(shù)據(jù)庫,學(xué)習(xí)哪些字段映射到哪些數(shù)據(jù)庫輸入項(或項目)。特別地,可部分地通過經(jīng)工具化工具護(hù)工具欄來觀察和收集用戶輸入來生成字段信息的數(shù)據(jù)庫。也可學(xué)習(xí)確定什么表格字段(基于web的表格上的字段)應(yīng)用哪些數(shù)據(jù)庫字段(來自數(shù)據(jù)庫的字段)填充。例如,可學(xué)習(xí)在標(biāo)記為FIRST的表格字段中,用戶可能從他們的數(shù)據(jù)庫輸入“firstname”(名)信息。當(dāng)用戶來到一新的web表格時,例如瀏覽器需要確定該表格是否包含瀏覽器能夠填充的輸入項,如果包含,則確定哪些輸入項對應(yīng)于數(shù)據(jù)庫的哪些部分。此外,如果存在多個數(shù)據(jù)庫輸入項,則應(yīng)該進(jìn)行確定哪個數(shù)據(jù)庫輸入項用于給定的表格。獲得訓(xùn)練數(shù)據(jù)來進(jìn)行上述確定中的任一個是至關(guān)緊要的任務(wù)。幸運的是,訓(xùn)練無需是用戶特定的。在本發(fā)明的一個方面中,可以某種方式收集包含輸入和輸出特征的訓(xùn)練數(shù)據(jù)。例如,工具欄可為某些用戶收集和聚集他把哪些數(shù)據(jù)庫輸入項輸入到哪些字段,以及那些字段的特征是什么。該信息然后可被送回中央儲存庫。中央儲存庫中的數(shù)據(jù)可用作訓(xùn)練算法的輸入,來學(xué)習(xí)哪些數(shù)據(jù)庫字段對應(yīng)于哪些表格字段。例如,可學(xué)習(xí)到標(biāo)記為“firstname”的數(shù)據(jù)庫字段對應(yīng)于標(biāo)記為“FIRST”的表格字段。如果用戶在標(biāo)記為FIRST的表格字段中輸入“Joshua”,并且該用戶具有標(biāo)記為“firstname”的數(shù)據(jù)庫字段,則信息FIRST和“firstname”可被送回。從而,不需要將個人可識別信息包含在內(nèi)來執(zhí)行本發(fā)明的該方面。如上所述,數(shù)據(jù)庫字段以及從中得出的各種特征可用于訓(xùn)練目的。例如,可利用表格字段的特性作為特征來區(qū)分不同類型的數(shù)據(jù)和不同類型的表格字段。特別地,每個表格字段具有諸如文本之類的輸入類型,文本可指示出文本框。表格字段是文本類型的字段的事實可能是有用的信息,因為它可促進(jìn)導(dǎo)出什么數(shù)據(jù)包含于該字段中。也就是說,如果存在除了文本字段之外的其它字段,例如組合框,則它將不包含姓名或地址。特征可基于表格字段名、表格字段的字符大小或?qū)挾?、表格字段周圍的文本、?或表格字段相對于可能或可能不已知或識別出的其它表格字段的位置。檢查HTML表也能促進(jìn)確定什么單詞或數(shù)據(jù)位于某一表格字段的上面、下面、左面或右面。此外,使用附近的文本或可能或可能不與該附近文本等同的附近文本的子串,可提供額外的信息。在本發(fā)明的另一方面中,至少部分地根據(jù)一個或多個約束,可將數(shù)據(jù)庫字段賦值到表格字段或值。約束可控制在許多情況下數(shù)據(jù)庫字段/輸入項到表格值的賦值。例如,當(dāng)web表格明顯具有相沖突的輸出類型或者明顯驗證出數(shù)據(jù)庫輸入項能或不能在單個web表格內(nèi)被重用時,可采用約束。在某些情況下,諸如當(dāng)面對新的web表格時,可能希望數(shù)據(jù)庫輸入項到表格字段的最佳賦值??刹糠值馗鶕?jù)一個或多個約束的最大化聯(lián)合概率來確定該最佳賦值。約束類型的例子可包括在沒有另一表格字段(例如地址行#1)時不允許某一表格字段(例如地址行#2)、減少重復(fù)使用輸入項的重復(fù)使用約束、處理相沖突的輸出類型的合成約束、和/或順序約束(例如區(qū)碼位于交換局的前面)。在本發(fā)明的又一個方面中,可將從數(shù)據(jù)庫字段到表格值的映射個人化。例如,可觀察到在某一web頁面上,用戶拒絕了所建議的自動輸入項,并手工地輸入數(shù)據(jù)。此數(shù)據(jù)的某些可能匹配數(shù)據(jù)庫中的輸入項。此后,對于該特定用戶,可學(xué)習(xí)到某些表格字段輸入項對應(yīng)于所觀察到的數(shù)據(jù)庫輸入項,這與經(jīng)學(xué)習(xí)的數(shù)據(jù)庫輸入項相反。因此,用戶可以用某些其它數(shù)據(jù)來覆蓋自動輸入項,系統(tǒng)或方法可學(xué)習(xí)該其它數(shù)據(jù)。可選地或除此之外,用戶的手工輸入(對于該用戶)可以是站點特定的——意味著這種輸入僅用于該特定web頁面或web站點。而且,可根據(jù)觀察響應(yīng)于自動填充操作的用戶輸入來修改自動輸入項。在本發(fā)明的又一方面中,在存在多組字段時,例如家庭地址和公司地址、或賬單地址和運輸?shù)刂?,可采用直觀推斷或?qū)W習(xí)。例如,在HTML表格中,這些地址通常出現(xiàn)在不同的表中。從而,可學(xué)習(xí)它們各自的位置或表,可以將它們分離成任何數(shù)量的子組。另一個方法可不使用數(shù)據(jù)庫,而是涉及觀察和/或跟蹤用戶的數(shù)據(jù)輸入,以學(xué)習(xí)什么數(shù)據(jù)輸入到哪些字段。特別地,可觀察和存儲用戶對多個表格字段的數(shù)據(jù)輸入,用于離線學(xué)習(xí),或者可通過在線學(xué)習(xí)來跟蹤和更新。在離線學(xué)習(xí)中,可存儲對包括某些敏感信息的字段輸入項的多個被觀察到的實例,然后稍候用作機(jī)器學(xué)習(xí)系統(tǒng)的輸入。在線系統(tǒng)采用在線學(xué)習(xí)算法,例如Bayes方法、梯度下降、簸選或感知器算法等等中之一,除了例如可包含某些個人可識別的信息的模型本身之外,不需要存儲任何信息。上面所討論的本發(fā)明的許多方面還可與該觀察輸入方法相組合。在某些情況下,并非所有的表格字段對于用于都是可見的;盡管如此,它們也可被填充。這僅僅對于用戶可能沒有意識到他所公開的信息這一事實造成許多安全性或私密性關(guān)注。響應(yīng)于這種關(guān)注,本發(fā)明的另一方面提供用戶界面上的顯示,能夠允許用戶看到頁面上的和/或自動填充的表格字段的列表。這對于自動填充的單選按鈕或復(fù)選框來說尤其有效,因為它們對于用戶來說可能不顯著,或者用戶可能沒有預(yù)期到它們被自動填充。表格字段的列表也可鏈接到web頁面上的實際表格字段。因此,對所列的表格字段的修改可能影響到實際的表格字段中的內(nèi)容。可選地,自動填充特征的使用可能在用戶計算機(jī)上的適當(dāng)位置束縛于安全措施。也就是說,自動填充特征可僅在受信任的站點或滿足用戶的安全等級的站點上可用。為了完成上述和相關(guān)的結(jié)尾,這里連同下面的描述和附圖給出了本發(fā)明的某些說明性的方面。然而,這些方面僅僅指示出可采用本發(fā)明的原理的各種方式的一小部分,本發(fā)明意圖包括所有這些方面和它們的等價物。通過下面的描述,連同附圖,本發(fā)明的其它優(yōu)點和新穎特征將變得顯而易見。圖1是根據(jù)本發(fā)明的一方面的利用機(jī)器學(xué)習(xí)的智能填充系統(tǒng)的高級框圖圖2是根據(jù)本發(fā)明的另一方面的將收集的數(shù)據(jù)饋入數(shù)據(jù)庫的智能填充系統(tǒng)的框圖,收集的數(shù)據(jù)在數(shù)據(jù)庫中可作為機(jī)器學(xué)習(xí)系統(tǒng)的輸入,用于學(xué)習(xí)哪些數(shù)據(jù)對應(yīng)于哪些字段。圖3是根據(jù)本發(fā)明的又一方面的部分地通過觀察用戶輸入來學(xué)習(xí)哪些數(shù)據(jù)對應(yīng)于哪些字段的智能填充系統(tǒng)的框圖。圖4是根據(jù)本發(fā)明的一方面的智能填充系統(tǒng)可適用以部分地根據(jù)學(xué)習(xí)的數(shù)據(jù)有效地填充所希望的字段的web表格的示例性屏幕顯示。圖5是根據(jù)本發(fā)明的另一方面的說明相對于新的web表格采用智能填充系統(tǒng)的示意框圖。圖6是說明根據(jù)本發(fā)明的一方面的便于根據(jù)機(jī)器學(xué)習(xí)技術(shù)自通輸入表格字段的示例性方法的流程圖。圖7是說明根據(jù)本發(fā)明的一方面的便于學(xué)習(xí)哪些數(shù)據(jù)對應(yīng)于哪些字段的示例性方法的流程圖。圖8是根據(jù)本發(fā)明的一方面的可從圖7中的方法擴(kuò)展的、說明學(xué)習(xí)用戶輸入的示例性方法的流程圖。圖9是根據(jù)本發(fā)明的一方面的便于部分地根據(jù)任何數(shù)量的約束和條件將用戶數(shù)據(jù)輸入到新的web表格的示例性方法的流程圖。圖10是根據(jù)本發(fā)明的一方面的便于保存通過自動填充的輸入輸入用戶輸入的示例性方法的流程圖。圖11是說明用于實現(xiàn)本發(fā)明的各種方面的示例性環(huán)境。具體實施例方式現(xiàn)在參考附圖來描述本發(fā)明,其中相同的參考標(biāo)號用于表示相同的元件。在下面的描述中,出于解釋的目的而提出了許多特殊的細(xì)節(jié),以便給出對本發(fā)明的徹底理解。然而,顯然不用上述特殊細(xì)節(jié)就能夠?qū)嵤┍景l(fā)明。在其它情況下,以框圖形式示出已知的結(jié)構(gòu)和設(shè)備,以便于本發(fā)明的描述。如本申請中所使用的,術(shù)語“組件”和“系統(tǒng)”意圖指代計算機(jī)相關(guān)的實體,即硬件、軟件和硬件的組合、軟件或執(zhí)行中的軟件。例如,組件可以是但不限于運行于處理器上的進(jìn)程、處理器、對象、可執(zhí)行的、執(zhí)行線程、程序以及計算機(jī)。作為例示,運行于服務(wù)器上的應(yīng)用程序以及該服務(wù)器都可以是組件。一個或多個組件可駐留于進(jìn)程和/或執(zhí)行線程中,組件可位于一個計算機(jī)上和/或分布于兩個或多個計算機(jī)之間。此外,術(shù)語數(shù)據(jù)庫輸入可指代發(fā)送到一個或多個數(shù)據(jù)庫中的數(shù)據(jù)或其它基于用戶的輸入。數(shù)據(jù)庫輸入可位于數(shù)據(jù)庫中的對應(yīng)的數(shù)據(jù)庫字段中。術(shù)語“表格字段”指的是可接受來自用戶的輸入并也可顯示輸出的字段;從而,可以存在不同的輸入類型和不同的輸出類型。不同的輸出類型可對應(yīng)于不同的字段類型。如這里所使用的術(shù)語“輸入字段”也可指代用戶向其中輸入某些數(shù)據(jù)或信息的字段。根據(jù)上下文環(huán)境,輸入字段也可指代表格字段。本發(fā)明可結(jié)合與產(chǎn)生訓(xùn)練數(shù)據(jù)用于機(jī)器學(xué)習(xí)的自動填充表格字段有關(guān)的推理方案和/或技術(shù)。如這里所使用的,術(shù)語“推理”一般指代從通過事件和/或數(shù)據(jù)捕獲的一組觀察資料中推理出或推斷出系統(tǒng)、環(huán)境和/或用戶的狀態(tài)的過程。例如,推理可用于識別特定的上下文環(huán)境或動作,或可產(chǎn)生狀態(tài)的概率分布。推理可以是概率性的,即根據(jù)對數(shù)據(jù)和事件的考慮進(jìn)行所關(guān)心的狀態(tài)的概率分布的計算。推理還可指代用于從一組事件和/或數(shù)據(jù)中合成更高級的事件的技術(shù)。這種推理導(dǎo)致從一組觀察的事件和/或存儲的事件數(shù)據(jù)中構(gòu)造出新的事件或動作,而不論事件是否與時間密切相關(guān),以及不論事件和數(shù)據(jù)是來自一個還是若干個事件和數(shù)據(jù)源。例如,本發(fā)明涉及學(xué)習(xí)基于web的表格中的每個字段,而不論它是否可從一個或多個數(shù)據(jù)庫來填充。使用機(jī)器學(xué)習(xí)系統(tǒng)和技術(shù),本發(fā)明的自動填充系統(tǒng)和方法能夠?qū)W習(xí)哪些數(shù)據(jù)對應(yīng)于哪些表格字段,并在用戶請求時自動地填充表格字段。存在許多不同類型的HTMLweb表格,確切地說是表格字段,就像這里所使用的那樣。它們的范圍可以是從文本框到選擇框到單選按鈕。為了成功地自動填充表格字段,可能重要的是要確定哪個數(shù)據(jù)進(jìn)入某一表格字段。一般地,編碼可揭示出表格是什么、表格的起始點在哪里、表格的結(jié)尾在哪里。每個字段具有諸如文本之類的一個類型,可被命名用于識別。從而,存在與web表格相關(guān)聯(lián)的若干特征,可學(xué)習(xí)這些特征來便于在無需用戶努力的情況下來識別表格字段的類型以及哪個數(shù)據(jù)可以或應(yīng)該被輸入。例如,字段是文本字段的事實可以是一個特征。如果字段的名字是“姓”,則它指示出內(nèi)容應(yīng)該是某人的姓,這可以是一個特征。表格字段周圍的文本也有關(guān)系,因為文本可能表示出有關(guān)什么處于該字段中的內(nèi)容。從而可分別指示出用戶的名、姓或姓名的“名”、“姓”或“姓名”被輸入或應(yīng)被輸入到該字段中。單選按鈕是一般排列在表單中并可通過點擊它們來選取的小圓圈。一次只能選取一組按鈕中的一個按鈕。從而,選取一個按鈕就清除了組中先前被選取的按鈕。單選按鈕具有“單選”(radio)類型,排列在一組中的那些單選按鈕應(yīng)具有相同的名字,從而它們可一起工作。然而,組內(nèi)的每個按鈕可具有不同的文本標(biāo)簽,以彼此相區(qū)分。對應(yīng)于選取的按鈕的文本標(biāo)簽可被學(xué)習(xí)和記憶。實踐中,單選按鈕可用于指示出用戶的運輸偏好。為了減輕用戶的努力,例如,可在每次用戶訪問涉及檢驗的web網(wǎng)頁時自動填充對應(yīng)于基本運輸?shù)乃M膯芜x按鈕。可用類似的方式來學(xué)習(xí)復(fù)選框,盡管它們與單選按鈕的本質(zhì)區(qū)別在于用戶可選擇一個以上的復(fù)選框。因為單選按鈕和復(fù)選框的自動填充并非是常規(guī)的,這種自動填充可能是用戶未預(yù)期的。為了解決這個問題,可能需要在學(xué)習(xí)和/或相關(guān)匹配方面更高的閾值來更大地確保自動填充的數(shù)據(jù)是正確的。選擇框也能包含可被學(xué)習(xí)和自動填充的數(shù)據(jù)。在大多數(shù)的web表格上它們相對較為常見,例如用于提供一列國家名或簡稱。這種列表可被檢測,并且也可學(xué)習(xí)選擇的特定的列表或國家。除了選擇框之外,在學(xué)習(xí)過程中也可使用提交按鈕。特別是,它們可與上下文中鍵入的別的東西相關(guān)。例如,名為“購買”或“買”的提交按鈕可與鍵入地址的上下文相關(guān)。從而,當(dāng)自動填充新的或以前從未見過的web表格時,檢測用戶選擇了名為“買”的提交按鈕能夠指示出地址和/或名字?jǐn)?shù)據(jù)也被正確地輸入。也可使用其它標(biāo)志來促進(jìn)檢測哪些數(shù)據(jù)對應(yīng)于哪些字段。例如,字段寬度可能是重要的。“名”字段可能短語“姓”字段。類似地,地址字段可能長于姓名字段。與表格字段的位置、排列、順序等有關(guān)的其它細(xì)微差別可有助于學(xué)習(xí)和自動填充過程。而且,機(jī)器學(xué)習(xí)可能非常敏感于這些微妙的線索或提示。實際上,這些微妙之處可能是重要的,用于有效地和成功地學(xué)習(xí)哪些數(shù)據(jù)屬于哪些字段,以及當(dāng)存在字段的多個變型時學(xué)習(xí)數(shù)據(jù)對字段的賦值??蔀樵S多不同種類的信息創(chuàng)建表格字段。除了諸如名、姓、姓名、地址、公司、城市、國家、郵政編碼、電話號碼、電子郵件地址、類似于保證書和否認(rèn)書信息的文本段落、問題、選項、意見、個人信息、意見其它一般文本之類的標(biāo)準(zhǔn)類型的輸入字段之外,可為輸入文件名創(chuàng)建表格字段,一般來說,文件名由用戶通過瀏覽文件來填充。通常,用戶希望上傳(例如通過輸入到字段)的文件是他最近所使用的一個文件。因此,可使用用戶的系統(tǒng)上最近被訪問的文件來自動填充這些字段。特別地,某些操作系統(tǒng)可能包括“我最近的文檔”文件夾,至少部分地通過使用最近所使用的文件來自動填充該字段。在確定是否使用來用于自動填充時,還可考慮自從用戶訪問這些文檔以來經(jīng)過的時間長度。這種最近程度可與輸入到文件字段的其它文件的最近程度相比較,并且這些字段中最近使用的輸入和最近被訪問的文件的至少部分地基于最后訪問的時期和最后輸入的時期的某種組合可被輸入。實踐上,假設(shè)用戶近來修改了一幅數(shù)字照片,并且現(xiàn)在希望通過將它上傳到照片站點而與家人和朋友共享??刹糠值赝ㄟ^檢查最近被訪問的文件來幫助確定輸入哪個文件來自動填充文件表格字段。現(xiàn)在參考圖1,示出了便于自動將數(shù)據(jù)輸入到web網(wǎng)頁上的表格字段中的智能自動填充系統(tǒng)100的高級框圖。系統(tǒng)100包括能夠?qū)W習(xí)什么輸入對應(yīng)于任一給定的web表格上的哪些字段的機(jī)器學(xué)習(xí)組件110,所述輸入例如姓名(名和姓)、地址(電子郵件、家庭、公司、賬單、或運輸?shù)刂?、電話號碼(家庭、公司、傳真、或移動號碼)、郵政編碼、國家、文件名、和/或任何其它數(shù)據(jù)。給定一組輸入,機(jī)器學(xué)習(xí)組件110能夠?qū)W習(xí)預(yù)測輸出值,所述一組輸入也被稱為訓(xùn)練數(shù)據(jù)??梢阅撤N方式來收集由正確的輸入和輸出特征組成的訓(xùn)練數(shù)據(jù)。例如,一個專門增加的工具欄可以收集和聚集此信息。該數(shù)據(jù)可作為對訓(xùn)練算法的輸入而給出。該算法可由無數(shù)種機(jī)器學(xué)習(xí)技術(shù)中的任何一種來提供,這些機(jī)器學(xué)習(xí)技術(shù)創(chuàng)建神經(jīng)網(wǎng)絡(luò)、數(shù)理邏輯回歸、最大熵模型、決策樹、Bayes模型、感知器、簸選、任何線性分離器、支持向量機(jī)等。給定特征值,大多數(shù)的模型類型輸出每個可能的輸出的分?jǐn)?shù)或概率。從中產(chǎn)生經(jīng)學(xué)習(xí)得到的模型,然后可利用選擇性自動填充組件120將該模型運用于隨后的web表格中。當(dāng)用戶調(diào)用時,選擇性自動填充組件120可部分地根據(jù)所學(xué)的數(shù)據(jù)和字段之間的相關(guān)性來將最適當(dāng)?shù)妮斎腠椵斎氲阶侄沃?。可逐字段地或以字段組的方式調(diào)用選擇性自動填充組件120,或者可一次全部調(diào)用來填充所有可填充的字段??商畛涿總€字段的下拉菜單,或者作為選擇可直接將數(shù)據(jù)輸入到表格字段中??筛鶕?jù)包括所觀察的輸入的經(jīng)學(xué)習(xí)的相關(guān)性來選擇下拉菜單中存在的項目。此外,機(jī)器學(xué)習(xí)組件110以及選擇性自動填充組件120能夠依附于或鏈接于諸如地址薄、聯(lián)系人列表、賬戶登記、用戶配置文件等之類的一個或多個數(shù)據(jù)庫。系統(tǒng)可根據(jù)已輸入的信息來自動確定要使用哪個數(shù)據(jù)庫輸入。特別地,可關(guān)于存儲于一個或多個數(shù)據(jù)庫中的數(shù)據(jù)來訓(xùn)練機(jī)器學(xué)習(xí)組件。在使用過程中,選擇性自動填充組件120能夠按需從各數(shù)據(jù)庫中提取數(shù)據(jù)。例如,用戶可能鍵入他母親的名和姓,然后調(diào)用自動填充組件120。因為母親的名和姓是由用戶手工輸入的,自動填充組件能夠檢測到,按照名和姓輸入項搜索包含那些姓名的數(shù)據(jù)庫輸入項,然后使用來自數(shù)據(jù)庫的關(guān)于母親的信息自動填充表格的剩余部分??赡艽嬖谌舾刹煌姆椒ㄊ褂脵C(jī)器學(xué)習(xí)來以自動化的方式進(jìn)行web表格上的數(shù)據(jù)輸入。圖2和3描述了可與機(jī)器學(xué)習(xí)技術(shù)一起組合或分開使用的至少兩種不同的方法。圖2中,例示出根據(jù)本發(fā)明的一方面的面向數(shù)據(jù)庫的自動填充訓(xùn)練方案200的框圖。訓(xùn)練方案200包括基于用戶的輸入記錄組件210,它能夠觀察和/或收集用戶輸入的數(shù)據(jù)。例如,用戶能夠在訂購在線雜志時將其郵寄信息輸入到基于web的表格中。特定的數(shù)據(jù)以及數(shù)據(jù)的類型(如文本、復(fù)選的框等)以及它們對應(yīng)的表格字段(姓名、電子郵件地址、賬單地址等)可被收集并發(fā)送到中央儲存庫220。可選地或除此之外,可要求用戶預(yù)先填充一個或多個數(shù)據(jù)庫,例如用于用戶的個人簡介、聯(lián)系人列表、地址薄、產(chǎn)品注冊、和/或賬戶登記。可把這些數(shù)據(jù)庫聚集到中央儲存庫220或也可簡單地饋入中央儲存庫220。中央儲存庫220中維護(hù)的數(shù)據(jù)或其至少一部分可用作機(jī)器學(xué)習(xí)算法的輸入,來產(chǎn)生一組或多組訓(xùn)練數(shù)據(jù)。隨后能夠使用這些訓(xùn)練數(shù)據(jù)來訓(xùn)練自動填充系統(tǒng),以學(xué)習(xí)哪些數(shù)據(jù)庫輸入項填充哪些表格字段。更為具體地,輸入映射組件230能夠通過將實際數(shù)據(jù)映射到適當(dāng)?shù)谋砀褡侄蝸砝弥醒雰Υ鎺鞌?shù)據(jù)。例如,映射組件230能夠?qū)⑤斎搿?8052”映射到ZIP(郵政編碼)表格字段,并且數(shù)字?jǐn)?shù)據(jù)“98052”對應(yīng)于ZIP表格字段的事實可被學(xué)習(xí)。從而,當(dāng)在web表格上再次看到ZIP表格字段時,自動填充系統(tǒng)就能夠在該字段中輸入或建議輸入“98052”。在關(guān)心隱私的場合中,實際數(shù)據(jù)(例如“Fred”)不需要被發(fā)送到或存儲于中央儲存庫220中。相反,可發(fā)送術(shù)語“名”(firstname)來表示FIRSTNAME字段中的用戶的數(shù)據(jù)。實踐上,假設(shè)用戶正在使用瀏覽器,并停留于諸如Amazon.com之類的電子商務(wù)web網(wǎng)頁上以購買書。該用戶在標(biāo)識為FIRST的表格字段中輸入他的名,在標(biāo)識為LAST的表格字段中輸出他的姓。該信息,包括該web網(wǎng)頁,可由一工具化的工具欄來收集,并存儲于中央數(shù)據(jù)庫中,隨后被學(xué)習(xí),從而當(dāng)用戶或任何其它用戶重新訪問Amazon.com來購買書時,自動填充系統(tǒng)能夠識別出這是同一個頁面,然后預(yù)測出應(yīng)該相應(yīng)地輸入相同的信息(例如FIRST字段中的名和LAST字段中的姓)。一般地,一旦系統(tǒng)發(fā)現(xiàn)或識別出它訓(xùn)練所針對的東西時,就有相當(dāng)?shù)目赡苄运鼘⒃谙乱淮巫鞒稣_的預(yù)測。然而,可能更容易實施的一個替代的方法是對一給定的用戶僅僅學(xué)習(xí)他最可能輸入什么到該字段中。該方法可能根本不使用數(shù)據(jù)庫。這可被稱為觀察輸入(observed-entry)方法。例如,觀察輸入方法可學(xué)習(xí)該用戶通常在名為FIRST的字段中輸入“Joshua”,而不是學(xué)習(xí)他通常在名為FIRST的字段中從他的數(shù)據(jù)庫中輸入“名”字段。機(jī)器學(xué)習(xí)系統(tǒng)仍可用于此。系統(tǒng)的可能輸出是用戶曾經(jīng)輸入的所有字段值。例如,如果他已輸入過他的名、他的姓、若干電話號碼、以及若干電子郵件地址,則所有這些都變?yōu)榭赡艿妮斎腠?。系統(tǒng)的輸入與下述的Boolean系統(tǒng)的輸入是相同種類的特征??蛇x地,如果字段看上去包含或關(guān)于敏感信息(例如信用卡信息或口令),則不進(jìn)行這種學(xué)習(xí)。圖3例示出能夠便于自動填充表格字段的觀察輸入訓(xùn)練方案300的框圖。觀察輸入訓(xùn)練方案300包括能夠監(jiān)視和跟蹤用戶作出的數(shù)據(jù)輸入項的輸入項跟蹤組件310。由于沒有數(shù)據(jù)移動到長期存儲存儲庫或數(shù)據(jù)庫來用于學(xué)習(xí)目的,因此信息的輸入項對于自動填充輸出來說可能更為重要和/或更為有影響。一旦方案300檢測到輸入數(shù)據(jù),學(xué)習(xí)組件320就能夠?qū)W習(xí)關(guān)于數(shù)據(jù)和web表格的若干特征。在一個例子中,實際數(shù)據(jù)可與某個特定的表格字段相關(guān)聯(lián)。例如,用戶將他的名“Joshua”鍵入到FIRSTNAME字段中。這可以被特征化為要學(xué)習(xí)的特征字符或文本串J-o-s-h-u-a對應(yīng)于FIRSTNAME字段。其它特征包括觀察和學(xué)習(xí)表格字段位于某一web網(wǎng)頁上;FIRSTNAME字段可能在LASTNAME字段的左側(cè),并且寬度比LASTNAME字段的寬度??;如果用戶開始從左至右輸入數(shù)據(jù),則最左側(cè)字段可能是名字段;超過五個數(shù)字的數(shù)字?jǐn)?shù)據(jù)很可能是電話號碼;以及關(guān)于表格字段甚至是web網(wǎng)頁本身的各種其它特征。此外,觀察輸入方案300可通常利用順序信息。例如,緊接著輸入“Joshua”之后,該用戶通常輸入“Goodman”。緊接著輸入他的區(qū)域碼之后,該用戶通常輸入他的交換局。從而,可為下一個值之前的每個值創(chuàng)建特征。學(xué)習(xí)組件320可以進(jìn)行在線或離線學(xué)習(xí)。在離線學(xué)習(xí)中,包括敏感信息的字段輸入項的多個被觀察到的實例可被存儲,并稍候用作機(jī)器學(xué)習(xí)系統(tǒng)的輸入??刹捎萌魏螜C(jī)器學(xué)習(xí)系統(tǒng);然而,離線學(xué)習(xí)趨向于比在線學(xué)習(xí)更為費時。此外,由于可存儲敏感信息,離線學(xué)習(xí)可能趨向于比在線學(xué)習(xí)更為有效。在線學(xué)習(xí)采用諸如Bayes方法、梯度下降、簸選或感知器算法等等中之一的在線學(xué)習(xí)算法,除了可包含某些個人可識別的信息的模型本身之外,不需要存儲任何信息。當(dāng)觀察到新的實例時,自動填充系統(tǒng)300可進(jìn)行適應(yīng)。本質(zhì)上,(利用輸入一字段映射組件330)可將用戶輸入的數(shù)據(jù)映射到表格字段,而不用使用數(shù)據(jù)庫或中央儲存庫。然而,觀察輸入方法可連同數(shù)據(jù)庫輸入方法一起使用。例如,對于任一給定的字段,可以學(xué)習(xí)用來自數(shù)據(jù)庫的輸入項填充的概率乘以數(shù)據(jù)庫字段是正確的輸入項的概率。也可學(xué)習(xí)用不是來自數(shù)據(jù)庫的輸入項填充的概率乘以觀察輸入模型給出的概率??筛鶕?jù)該信息來排列或分級所產(chǎn)生的推測。不管采用哪種方法,都可實現(xiàn)訓(xùn)I練數(shù)據(jù),訓(xùn)練數(shù)據(jù)對于許多類型的web網(wǎng)頁(例如電子商務(wù)網(wǎng)站)來說可能是有用的,這些網(wǎng)頁或網(wǎng)站可能有時略微地改變它們的頁面或以不同的語言給出這些頁面。訓(xùn)練數(shù)據(jù)仍然能夠產(chǎn)生正確的響應(yīng),而不管這些改變,這增加了其關(guān)于基于web的表格的自動填充操作的多用性?,F(xiàn)在轉(zhuǎn)到圖4,例示出來自Verizonwirelessweb網(wǎng)頁的示例性HTMLweb表格400。下面是對應(yīng)的HTML源代碼的例子<!---====CustomerInformationtable/startshere======-----><TABLEWIDTH=″585″BORDER=″0″CELLSPACING=″0″CELLPADDING=″1″><TR><TDWIDTH=″5″BGCOLOR=″#990000″><!--SIPO<DPn="11">--><dpn="d11"/><IMGSRC=″https://www.verizonwireless.com/images/shared/pixel/trans.gif″WIDTH=″5″HEIGHT=″1″BORDER=″0″ALT=″″></TD><TDWIDTH=″583″CLASS=″smtext3″BGCOLOR=″#990000″COLSPAN=″5″><STRONG>UserInformation</STRONG></TD></TR><TR><TDWIDTH=″5″><IMGSRC=″https://www.verizonwireless.com/images/shared/pixel/trans.gif″WIDTH=″5″HEIGHT=″1″BORDER=″0″ALT=″″></TD></TR><TR><TDWIDTH=″5″><IMGSRC=″https://www.verizonwireless.com/images/shared/pixel/trans.gif″WIDTH=″5″HEIGHT=″1″BORDER=″0″ALT=″″></TD><TDwidth=″93″>Prefix</TD><TDwidth=″170″><STRONG><SPANCLASS=″text2″>*</SPAN></STRONG>First<br/>Name</TD><TDwidth=″30″>M.I.</TD><TDwidth=″195″><STRONG><SPANCLASS=″text2″>*</SPAN></STRONG>Last<br/>Name</TD><TDwidth=″186″>Suffix</TD></TR></TABLE><TABLEWIDTH=″585″BORDER=″0″CELLSPACING=″0″CELLPADDING=″1″><TR><TDWIDTH=″5″><IMGSRC=″https://www.verizonwireless.com/images/shared/pixel/trans.gif″WIDTH=″5″HEIGHT=″1″BORDER=″0″ALT=″″></TD><TDWIDTH=″93″><SELECTNAME=″p_prefix″><OPTIONVALUE></OPTION><OPTIONVALUE=″MR″>MR<OPTIONVALUE=″MS″>MS<OPTIONVALUE=″MRS″>MRS<OPTIONVALUE=″DR″>DR</SELECT></TD><TDWIDTH=″135″><INPUTTYPE=″text″CLASS=″input″NAME=″p_first_name″VALUE=″″SIZE=″15″MAXLENGTH=″15″></TD><TDWIDTH=″30″><INPUTTYPE=″text″CLASS=″input″NAME=″p_mid_init″VALUE=″″SIZE=″2″MAXLENGTH=″1″></TD><TDWIDTH=″160″><INPUTTYPE=″text″CLASS=″input″NAME=″p_last_name″VALUE=″″SIZE=″18″MAXLENGTH=″20″></TD><TDWIDTH=″184″><SELECTNAME=″p_suffix″><OPTION></OPTION><OPTIONVALUE=″JR″>JR<OPTIONVALUE=″SR″>SR<OPTIONVALUE=″2″>2<!--SIPO<DPn="12">--><dpn="d12"/><OPTIONVALUE=″3″>3<OPTIONVALUE=″4″>4</SELECT></TD></TR></TABLE>理解該HTML的關(guān)鍵在于找到標(biāo)記為“input”(粗體)的區(qū)域。第一個input是用戶的名,它由下述組成<TDWIDTH=″135″><INPUTTYPE=″text″CLASS=″input″NAME=″p_first_name″VALUE=″″SIZE=″15″MAXLENGTH=″15″></TD>這意味著此信息的全部都可能非常有助于機(jī)器學(xué)習(xí)系統(tǒng)預(yù)測這是名(firstname)輸入項。例如,字段名包含“first”和“name”的事實是極其有用的。字段寬度和大小是15個字符的事實也是有幫助的(注意,例如姓字段輸入項寬度為20)。此外,該字段輸入項的形式為表。如果某人分析該表,該人可看到緊接著最上面的表輸入項是<TDwidth=″170″><STRONG><SPANCLASS=″text2″>*</SPAN></STRONG>FirstName</TD>上面的表輸入項不是輸入字段且包含串“FirstName”的事實高度地指示出這是firstname字段。在某些情況下,緊接著左面的表輸入項也是有用的,緊接著右面的表輸入項也是有用的。例如,在該情況下,緊接著右面的字段也是輸入字段并具有名稱為“p_last_name”的事實同樣高度地指示出這是firstname字段。使用不相同或不完全確切匹配的附近文本或附近文本的子串可能也是有用的。給定一組輸入,機(jī)器學(xué)習(xí)系統(tǒng)通常試圖學(xué)習(xí)來預(yù)測輸出值。在該例子中,可能的輸出值可能是“名”(firstname)、“姓”(lastname)、“城市”(city)、“國家”(state)、“地址行1”(addressline1)、“地址行2”(addressline2)、“電話號碼”(phone#)等等,以及用于我們不知道如何自動填充的字段類型的“無”(none)。對系統(tǒng)的輸入是諸如下述的值Maxlength=15Size=15Fieldname=″p_first_name″Fieldname-to-right=″p_last_name″Text-above=″<TDwidth=″170″><STRONG><SPANCLASS=″text2″>*</SPAN></STRONG>FirstName</TD>″等等。這些輸入然后被轉(zhuǎn)變成特征值,一般是Boolean(布爾邏輯值),但是有時是數(shù)字的、絕對的和/或相對的。在該情況下,布爾邏輯值可包括MaxLengthBetween15and19=trueSizeBetween15and19=trueSizeExactly15=trueFieldNameContains_First=trueFieldnameContains_Name=trueFieldNameEquals_p_First_Name=trueFieldNameRightcontains_Last=trueFieldNameRightContains_Name=trueFieldNameRightSizeBetween20and24=trueTextAboveContains_First=trueTextAboveContains_Name=true還存在許多其它的可能的特征值,在該情況中,大多數(shù)的值為“false”??赏ㄟ^例如尋找有用的范圍以及通過尋找常用的、有用的字符順序來自動地確定布爾邏輯值??蛇x地,可通過例如編程者檢查輸入值并確定最有用的布爾邏輯值來人工地確定布爾邏輯值。現(xiàn)在轉(zhuǎn)到圖5,例示出根據(jù)本發(fā)明的一方面的已經(jīng)過訓(xùn)練的智能自動填充系統(tǒng)500的示意框圖。該圖指示出一張新的web表格已呈現(xiàn)給或顯示給用戶(510),以及自動填充特征已由用戶調(diào)用來填充一個或多個表格字段。特別地,選擇性填充組件520可被觸發(fā)來將信息自動輸入到一個或多個表格字段中。當(dāng)看到新的表格時,可以確定所有字段的特征值。這些值隨后可被傳送給經(jīng)過學(xué)習(xí)的模型,該模型為每個字段的每個輸出(字段類型)輸出概率、分?jǐn)?shù)或0-1值。例如,可以標(biāo)出表格字段和它們的值一個字段對于成為first的可能性為90%,不成為first的可能性為10%(或成為last的可能性為10%),另一個字段對于成為last的可能性為90%,成為first的可能性為10%。從而,應(yīng)該發(fā)現(xiàn)最佳的賦值,來促進(jìn)以最大的精確性將數(shù)據(jù)填充到表格字段中。對數(shù)據(jù)輸入項(數(shù)據(jù)庫輸入項)的賦值以形成值,這可至少部分地基于一個或多個約束530。約束530可設(shè)置用于限制或約束不作出某些類型的賦值。約束限制的一個例子與一給定表格中可使用數(shù)據(jù)庫輸入項的次數(shù)有關(guān)。一般地,數(shù)據(jù)庫輸入項每個表格僅應(yīng)使用一次,雖然在某些情況下(例如電話號碼),可能允許重復(fù)使用。如果阻止或禁止某些字段的重復(fù)使用(設(shè)置為約束),可發(fā)現(xiàn)符合重復(fù)使用約束的字段名對數(shù)據(jù)庫名的最可能或最高分?jǐn)?shù)的賦值。從而,數(shù)據(jù)輸入項—表格字段分析組件540可為給定的web表格評估一個或多個可用的約束,然后確定(來自任選的數(shù)據(jù)庫550的)數(shù)據(jù)輸入項的賦值以形成字段。最終,自動填充系統(tǒng)的“建議的”輸出可在各表格字段中顯示出來。還可能存在相沖突的輸出類型表示,例如“firstname”、“l(fā)astname”和“name”(firstname和lastname的組合)。從而,可設(shè)置合成約束,假設(shè)這些不同的變型都應(yīng)存在于同一頁面上。該約束能夠指示出僅能存在“name”字段或“first”和“l(fā)ast”name字段。如果存在“name”字段,則例如通過從數(shù)據(jù)庫連接firstname和lastname字段來構(gòu)成數(shù)據(jù)。類似地,可能存在“區(qū)碼”(areacode)、“交換局”(exchange)和“最后四位”(last4digits)字段,也可存在“電話號碼”(phonenumber)字段(由來自數(shù)據(jù)庫的所有三個字段組成)。在任何情況下,都可確定符合合成約束的字段名的最可能或最高分?jǐn)?shù)的賦值(因為不允許同時具有name輸入項和lastname輸入項)。某些字段輸入項在沒有其它字段輸入項的情況下永遠(yuǎn)不應(yīng)被使用。例如,沒有第1地址行(#1)輸入項,將永遠(yuǎn)不會使用第2地址行(#2)輸入項。沒有用戶的firstname,將永遠(yuǎn)不會使用用戶的中間首字母(middleinitial)。類似地,middleinitial永遠(yuǎn)不會出現(xiàn)在firstname字段之前;地址行2永遠(yuǎn)不會出現(xiàn)在地址行1之前。而且,也可找到符合這些約束的最可能的或最高分?jǐn)?shù)的字段名的賦值。此外,如果某人從左向右填寫信息,系統(tǒng)可猜測初始的數(shù)據(jù)輸入項對應(yīng)于firstname,然后預(yù)測右面的字段是lastname字段。因此,考慮到約束作出觀察來更好地確定數(shù)據(jù)輸入字段到表格字段的賦值。也可將對于某些表格字段唯一的特征限制到約束。例如,可為某一數(shù)據(jù)庫字段給出一特征,位于某一其它字段的上方、下方、左方、右方、緊接著上方、緊接著下方、緊接著左方、或緊接著右方。從而,在實踐中,可預(yù)期“exchange”字段位于“areacode”字段的緊接著右方。當(dāng)采用系統(tǒng)500時,可能不“知道”哪些輸入字段是哪些,但是可嘗試許多不同的賦值,并可作出嘗試來挑選符合諸約束的一種賦值??蛇x地,可作出若干不同的賦值。隨后,可確定輸入字段到包括這些布局特征的表格字段的某些賦值的最大聯(lián)合概率。這可部分地通過以下述為條件的方法來實現(xiàn)“該第一個是第一、在給定第一個的情況下第二個是第二、在給定第一個和第二個的情況下,第三個是第三、依此類推”的概率是什么。當(dāng)進(jìn)行復(fù)聯(lián)運算時,獲得了總的聯(lián)合概率。從而,不用將該問題考慮成獨立于其它字段而對每個字段賦值,可以按照使聯(lián)合概率最大化的方法來確定字段的最佳賦值。約束530可以是硬或軟約束。在硬約束中,必須滿足約束。在軟約束中,違反約束將有很大的懲罰。先前的大部分的討論涉及構(gòu)建為每個用戶(非用戶特定的)工作的自動填充系統(tǒng)。然而,還可根據(jù)用戶來定制自動填充系統(tǒng)。特別地,可將從數(shù)據(jù)庫字段到表格值的映射個人化。例如,可能觀察到在某一頁面上,用戶拒絕我們建議的自動輸入項,而是手工地輸入數(shù)據(jù)。這些數(shù)據(jù)中的一些可能匹配數(shù)據(jù)庫中的輸入項。從而,可隨后為該用戶學(xué)習(xí)到這些輸入字段輸入項對應(yīng)于所觀察的數(shù)據(jù)庫輸入項。接著,可利用該信息來更新用戶的自動填充器。信息也可以站點特定的方式來得到更新,從而學(xué)習(xí)到某一web頁面上的輸入項對應(yīng)于某些特定的數(shù)據(jù)庫輸入項。而且,用戶能夠從一開始就定制自動填充系統(tǒng),或者可把可由用戶按需修改的默認(rèn)設(shè)置呈現(xiàn)給用戶。可以站點特定的方式或機(jī)器學(xué)習(xí)的一般方式來進(jìn)行個人化。例如,系統(tǒng)可觀察到當(dāng)某一字段表示NOMBRE,用戶輸入“Jose”而不是可能為自動填充建議的Juan。如果是站點特定的,系統(tǒng)可能注意到用戶在該特定頁面上鍵入“Jose”。一般地,數(shù)據(jù)庫輸入項和/或任何個人化可任選地存儲于與用戶的計算機(jī)分離的計算機(jī)上(例如位于可通過因特網(wǎng)或LAN訪問的服務(wù)器上)。某些表格,諸如上面給出的示例性頁面,可能包含多組字段(例如家庭地址和公司地址)。可使用直觀推斷或?qū)W習(xí)來識別這些情況。例如,在Verizon頁面(圖4)上,不同的地址位于不同的表中。典型地,不同的地址可以與頁面的實際文本空間上不相交和/或相對遠(yuǎn)離。從而,可以學(xué)習(xí)到將信息分割成各自的組(例如家庭地址和公司地址)。在某些情況下,自動填充系統(tǒng)可能不立即向用戶建議用于某一表格的正確的輸入項。隨著用戶手工地將數(shù)據(jù)輸入到表格上,我們可觀察到用戶輸入了什么,并試圖確定是輸入字段對數(shù)據(jù)庫字段的其它映射符合他的輸入項,還是數(shù)據(jù)庫中的不同輸入項。例如,系統(tǒng)可輸入用戶的家庭地址,但是然后觀察到他輸入符合其公司地址的數(shù)據(jù)。可選地,系統(tǒng)可觀察到用戶輸入符合其聯(lián)系人列表中的輸入項的數(shù)據(jù)。在該情況下,可以作出根據(jù)最佳分級的一致輸入項來作出新的自動字段輸入項??墒褂谩耙淮稳俊庇脩艚缑鎭碜鞒鲚斎腠椀慕ㄗh,例如當(dāng)前所做的那樣,但是,也可以遞增的方式(例如通過每個字段中的下拉列表)來作出,可以利用或不利用字段的數(shù)據(jù)庫,且可以利用或不利用機(jī)器學(xué)習(xí)。隨著用戶開始輸入數(shù)據(jù)到字段中,可存在具有部分地根據(jù)用戶輸入了什么的最佳建議的下拉框(例如,用戶輸入“J”,下拉框提供“Joshua”)??蛇x地,在用戶輸入一輸入字段時(例如通過使用箭頭鍵(arrowkey)、標(biāo)志鍵(tabbing)或點擊字段),可用最佳建議來填充字段。當(dāng)用戶在包含所選文本的字段中鍵入時,所選文本可被自動去除;但是如果用戶不進(jìn)行鍵入,則文本保留在那里。將通過一系列動作來描述根據(jù)本發(fā)明的各種方法,要理解到本發(fā)明不限于動作的順序,因為根據(jù)本發(fā)明,某些動作可以與其它動作以不同的順序發(fā)生和/或同時發(fā)生。例如,本領(lǐng)域的技術(shù)人員將理解到可把方法表示為一系列相互關(guān)聯(lián)的狀態(tài)或事件,例如狀態(tài)圖。而且,并非所有例示出的動作都是實現(xiàn)根據(jù)本發(fā)明的方法所必須的。參考圖6,示出了根據(jù)本發(fā)明的一方面的便于將數(shù)據(jù)自動輸入到web頁面上的一個或多個表格字段中的示例性方法600的流程圖。方法600涉及在610處提供或生成基于web的表格。基于web的表格可包括用戶希望以自動化的方式進(jìn)行填充的一個或多個表格字段。在620,可使用機(jī)器學(xué)習(xí)技術(shù)將輸入數(shù)據(jù)映射到各數(shù)據(jù)輸入項字段。結(jié)果,機(jī)器學(xué)習(xí)系統(tǒng)能夠?qū)W習(xí)到哪些數(shù)據(jù)對應(yīng)于哪些字段。參考圖7,示出了與構(gòu)建智能填充系統(tǒng)有關(guān)的、便于生成用于機(jī)器學(xué)習(xí)系統(tǒng)的訓(xùn)練數(shù)據(jù)的示例性方法700的流程圖。方法700可起始于710處,用戶將數(shù)據(jù)輸入到web頁面上的一個或多個表格字段。在720處,可由一個或多個工具化的工具欄觀察和/或收集到下列的一個或多個輸入到至少一個各自的表格字段的數(shù)據(jù);哪個數(shù)據(jù)輸入項正進(jìn)入各表格字段;和/或各表格字段的特征。在730處,可采用一個或多個機(jī)器學(xué)習(xí)系統(tǒng)來學(xué)習(xí)數(shù)據(jù)輸入項與正確的表格字段之間的相關(guān)性,從而當(dāng)重新訪問新的頁面或先前的頁面時,方法700能夠以自動化的方式知道哪些數(shù)據(jù)輸入到哪些字段。這種學(xué)習(xí)可包括離線學(xué)習(xí)和在線學(xué)習(xí)。任選地,在720處收集的數(shù)據(jù)可在圖8所例示的810處發(fā)送回中央儲存庫或數(shù)據(jù)庫。中央儲存庫中的數(shù)據(jù)可被映射到它們各自的字段,導(dǎo)致生成一組或多組訓(xùn)練數(shù)據(jù)。訓(xùn)練數(shù)據(jù)隨后可用作機(jī)器學(xué)習(xí)系統(tǒng)的輸入,來學(xué)習(xí)哪些數(shù)據(jù)庫字段或輸入項對應(yīng)于哪些表格字段。作為這種學(xué)習(xí)的結(jié)果,可自動地填充用戶的web頁面上的表格字段,而不管該web頁面是否以前被看到過?,F(xiàn)在轉(zhuǎn)到圖9,示出了尤其當(dāng)web表格從未被自動填充系統(tǒng)或方法看到過時,促進(jìn)將數(shù)據(jù)庫輸入項賦值到表格字段的示例性方法900的流程圖。在這些情況下,方法900可在910處一開始發(fā)現(xiàn)用于表格字段的特征值。特征值可以是概率或分?jǐn)?shù),這取決于它們是如何被計算出的。在920處,可設(shè)置一個或多個約束來管理或控制數(shù)據(jù)輸入項(或數(shù)據(jù)庫輸入項)對表格字段的賦值??刹捎萌舾煞N約束,例如但不限于合成約束(例如相沖突的輸出類型)、重復(fù)使用約束(例如每個表格不止一次使用同一數(shù)據(jù)輸入項),順序約束(例如某些表格必須位于某一順序、位置或離開其它表格字段),和/或伴隨約束(例如某些表格不能獨立于其它表格而被使用)。在930,可至少部分地基于一個或多個約束來確定數(shù)據(jù)輸入項到表格字段的賦值。約束可包括硬約束和軟約束。與硬約束相反,軟約束不要求必須被滿足。然而,不滿足軟約束會導(dǎo)致嚴(yán)重的懲罰。作為與其它表格字段(不管是相鄰還是不相鄰)無關(guān)地確定每個表格字段的賦值的替代,在940處可計算最大聯(lián)合概率,以確定賦值的整體概率??勺鞒鲈S多不同組的賦值,一組賦值內(nèi)的每個賦值的各自的概率在給定該組中的其它賦值的情況下可復(fù)聯(lián)在一起??蛇x擇具有最高聯(lián)合概率的一組賦值,并利用它來填充基于web的表格?,F(xiàn)在參考圖10,示出了說明如上所述的智能自動填充方法或系統(tǒng)的調(diào)用的示例性方法1000的流程圖。在該特定場合下,可在1010處構(gòu)建一個或多個數(shù)據(jù)庫,可使其中存儲的數(shù)據(jù)相關(guān)聯(lián)來將輸入庫輸入項與表格字段相匹配。在1020,假設(shè)用戶已打開了具有要填充用戶的數(shù)據(jù)的一個或多個字段的基于web的表格頁面。在1030,用戶逐字段或按字段組地、選擇性地調(diào)用自動填充功能。例如,可一次調(diào)用全部自動填充特征來一次填充全部字段,逐字段地或按照字段組(諸如地址字段、城市字段和國家字段之類的相關(guān)字段)的方式進(jìn)行填充,從而每個字段都按照用戶所希望的那樣被填充。假設(shè)至少一個字段已被自動填充,用戶可通過簡單地在它上面進(jìn)行鍵入來覆蓋它。該“新的”數(shù)據(jù)也可被學(xué)習(xí),自動填充組件可被修改來識別何時該新的數(shù)據(jù)應(yīng)被使用。在覆蓋之后,自動填充特征可被再次調(diào)用,從而填充剩下的字段。然而,被覆蓋的字段不受影響。此外,自動填充特征可觀察用戶手工輸入的數(shù)據(jù),然后使用與被覆蓋的數(shù)據(jù)有關(guān)的數(shù)據(jù)來自動填充剩余的字段。例如,假設(shè)一開始自動填充了NAME字段。用戶刪除了他的姓名,并插入了他兄弟的姓名。他兄弟的信息可存儲于自動填充組件可訪問的一個數(shù)據(jù)庫中。從而,當(dāng)識別到該兄弟的姓名時,自動填充組件或方法可將兄弟的數(shù)據(jù)從數(shù)據(jù)庫提取出,并填充到表格字段中。為了提供用于本發(fā)明的各方面的額外的上下文環(huán)境,圖11以及下面的討論給出了在其中可實施本發(fā)明的各方面的一種適用的操作環(huán)境1110的簡要的總體說明。雖然以諸如程序模塊之類的由一個或多個計算機(jī)或其它設(shè)備執(zhí)行的計算機(jī)可執(zhí)行指令的上下文描述了本發(fā)明,但是本領(lǐng)域的技術(shù)人員將認(rèn)識到還可用其它程序模塊的組合和/或軟硬件的組合來實施本發(fā)明。然而,一般而言,程序模塊包括例程、程序、對象、組件、數(shù)據(jù)結(jié)構(gòu)等,它們執(zhí)行特定的任務(wù)和實現(xiàn)特定的抽象數(shù)據(jù)類型。操作環(huán)境1110僅僅是適用的操作環(huán)境的一個例子,不意圖對本發(fā)明的功能和使用范圍作出任何限制??蛇m用于本發(fā)明的其它已知的計算機(jī)系統(tǒng)、環(huán)境和/或配置包括但不限于個人計算機(jī)、手持或膝上型設(shè)備、多處理器系統(tǒng)、基于微處理器的系統(tǒng)、可編程的消費電子產(chǎn)品、網(wǎng)絡(luò)PC、小型機(jī)、大型機(jī)、包括上述系統(tǒng)或設(shè)備的分布式計算環(huán)境等等。參考圖11,用于實施本發(fā)明的各方面的示例性環(huán)境1110包括計算機(jī)1112。計算機(jī)1112包括處理單元1114、系統(tǒng)存儲器1116和系統(tǒng)總線(BUS)1118。系統(tǒng)總線1118將包括但不限于系統(tǒng)存儲器1116的系統(tǒng)組件耦合到處理單元1114。處理單元1114可以是任何可用的處理器。雙微處理器和其它多處理器架構(gòu)也可用作處理單元1114。系統(tǒng)總線1118可以是若干總線結(jié)構(gòu)中的任一種,包括存儲器總線或存儲器控制器、外圍總線或外部總線、和/或使用各種可用的總線體系結(jié)構(gòu)中的任一種的局部總線,包括但不限于11-bit總線、工業(yè)標(biāo)準(zhǔn)結(jié)構(gòu)(ISA)、微通道架構(gòu)(MSA)、擴(kuò)展的ISA(EISA)、智能驅(qū)動電子設(shè)備(IDE)、VESA局部總線(VLB)、外部設(shè)備互連(PCI)、通用串行總線(USB)、高級圖形端口(AGP)、個人計算機(jī)存儲卡國際協(xié)會總線(PCMCIA)、以及小型計算機(jī)系統(tǒng)接口(SCSI)。系統(tǒng)存儲器1116包括易失性存儲器1120和非易失性存儲器1122。包含諸如在起動期間在計算機(jī)1112內(nèi)的元件之間傳輸信息的基本例程的基本輸入/輸出系統(tǒng)(BIOS)存儲于非易失性存儲器1122中。作為示例但非限制,非易失性存儲器1122可包括只讀存儲器(ROM)、可編程ROM(PROM)、電氣可編程ROM(EPROM)、電氣可擦除ROM(EEPROM)、或閃存。易失性存儲器1120包括隨機(jī)存取存儲器(RAM),它作為外部高速緩沖存儲器。作為例示而非限制,RAM可采用各種形式,例如同步RAM(SRAM)、動態(tài)RAM(DRAM)、同步DRAM(SDRAM)、雙數(shù)據(jù)率SDRAM(DDRSDRAM)、增強性SDRAM(ESDRAM)、SynchlinkDRAM(SLDRAM)以及直接RambusRAM(DRRAM)。計算機(jī)1112還包括可移動/不可移動、易失性/非易失性計算機(jī)存儲媒介。例如,圖11例示出盤存儲器1124。盤存儲器1124包括但不限于類似于磁盤驅(qū)動器、軟盤驅(qū)動器、磁帶驅(qū)動器、Jaz驅(qū)動器、Zip驅(qū)動器、LS-100驅(qū)動器、閃存卡、或記憶棒之類的設(shè)備。此外,盤存儲器1124可包括與包括但不限于光盤驅(qū)動器的其它存儲媒介分離或組合的存儲媒介,光盤驅(qū)動器例如緊致盤ROM(CD-ROM)、CD可錄制驅(qū)動器(CD-RDrive)、CD可復(fù)寫驅(qū)動器(CD-RWDrive)或數(shù)字通用盤ROM驅(qū)動器(DVD-ROM)。為了便于將盤存儲設(shè)備1124連接到系統(tǒng)總線1118,通常使用諸如接口1126之類的可移動的或不可移動的接口。要理解到,圖11描述了充當(dāng)用戶和適用的操作環(huán)境1110中描述的基本計算機(jī)資源之間的中介的軟件。這種軟件包括操作系統(tǒng)1128。操作系統(tǒng)1128可存儲于盤存儲器1124上,用于控制和分配計算機(jī)系統(tǒng)1112的資源。系統(tǒng)應(yīng)用程序1130通過存儲于系統(tǒng)存儲器1116或盤存儲器1124上的程序模塊1132和程序數(shù)據(jù)1134來利用操作系統(tǒng)1128對資源的管理。還要理解到可用各種操作系統(tǒng)或操作系統(tǒng)的組合來實施本發(fā)明。用戶通過輸入設(shè)備1136將信息或命令輸入到計算機(jī)1112。輸入設(shè)備1136包括但不限于諸如鼠標(biāo)之類的指點設(shè)備、軌跡球、觸筆、觸板、鍵盤、話筒、操縱桿、游戲盤、圓盤式衛(wèi)星天線、掃描儀、TV調(diào)諧器卡、數(shù)字照相機(jī)、數(shù)字?jǐn)z像機(jī)、web照相機(jī)等等。這些和其它輸入設(shè)備通過接口端口1138,經(jīng)系統(tǒng)總線1118連接到處理單元1114。接口端口1138包括例如串口、并口、游戲端口、通用串行總線(USB)。輸出設(shè)備1140適用某些與輸入設(shè)備相同類型的端口。從而,例如,USB端口可用于向計算機(jī)1112提供輸入,以及從計算機(jī)1112將信息輸出到輸出設(shè)備1140。提供輸出適配器1142來例示出存在某些輸出設(shè)備1140,例如監(jiān)視器、揚聲器、打印機(jī)等,它們要求特殊的適配器。作為例示但非限制,輸出適配器1142包括視頻卡和聲卡,它們提供了一種輸出設(shè)備1140和系統(tǒng)總線1118之間的連接的手段。應(yīng)注意到其它設(shè)備和/或設(shè)備的系統(tǒng)提供輸入和輸出能力,例如遠(yuǎn)程計算機(jī)1144。計算機(jī)1112可工作于適用對諸如遠(yuǎn)程計算機(jī)1144之類的一個或多個遠(yuǎn)程計算機(jī)的邏輯連接的連網(wǎng)環(huán)境中。遠(yuǎn)程計算機(jī)1144可以是個人計算機(jī)、服務(wù)器、路由器、網(wǎng)絡(luò)PC、工作站、基于微處理器的設(shè)備、對等設(shè)備或其它公共網(wǎng)絡(luò)節(jié)點等,一般包括關(guān)于計算機(jī)1112描述的許多或全部元件。處于簡要的目的,遠(yuǎn)程計算機(jī)1144僅例示出存儲器存儲設(shè)備1146。遠(yuǎn)程計算機(jī)1144通過網(wǎng)絡(luò)接口1148與計算機(jī)1112邏輯連接,然后通過通信連接1150而在物理上進(jìn)行連接。網(wǎng)絡(luò)接口1148包括通信網(wǎng)絡(luò),例如局域網(wǎng)(LAN)和廣域網(wǎng)(WAN)。LAN技術(shù)包括光纖分布式數(shù)據(jù)接口(FDDI)、銅芯分布式數(shù)據(jù)接口(CDDI)、以太網(wǎng)/IEEE1102.3、令牌環(huán)/IEEE1102.5等等。WAN技術(shù)包括但不限于點對點鏈接、類似于綜合業(yè)務(wù)數(shù)字網(wǎng)絡(luò)(ISDN)的電路交換網(wǎng)絡(luò)及其變型、分組交換網(wǎng)絡(luò)、數(shù)字訂戶線路(DSL)。通信連接1150指的是用于將網(wǎng)絡(luò)接口1148連接到總線1118的硬件/軟件。雖然出于例示的目的示出通信連接位于計算機(jī)1112內(nèi),但是它也可在計算機(jī)1112的外部。出于示例性的目的,對于到網(wǎng)絡(luò)接口1148的連接所必需的硬件/軟件包括但不限于內(nèi)部和外部技術(shù),例如包括常規(guī)電話級調(diào)制解調(diào)器、電纜調(diào)制解調(diào)器、DSL調(diào)制解調(diào)器、ISDN適配器、以太網(wǎng)卡之類的調(diào)制解調(diào)器。上述的描述包括本發(fā)明的實例。當(dāng)然,出于描述本發(fā)明的目的,不可能描述各種組件或方法的每一種組合,但是本領(lǐng)域的技術(shù)人員可認(rèn)識到許多進(jìn)一步的組合和變更都是可能的。因此,本發(fā)明意圖包含所有這些改變、修改和變型,它們都落于本發(fā)明的要旨和范圍之內(nèi)。權(quán)利要求1.一種自動填充系統(tǒng),其特征在于,包括經(jīng)訓(xùn)練的機(jī)器學(xué)習(xí)組件,使用一組或多組輸入以便于基于web的表格的自動填充;以及自動填充組件,至少部分地根據(jù)所述機(jī)器學(xué)習(xí)組件生成的信息,選擇性地將適當(dāng)?shù)臄?shù)據(jù)輸入到一個或多個表格字段中。2.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述一組或多組輸入存儲并檢索于一個或多個數(shù)據(jù)庫中。3.如權(quán)利要求2所述的系統(tǒng),其特征在于,所述機(jī)器學(xué)習(xí)組件學(xué)習(xí)從多個數(shù)據(jù)庫字段映射到對應(yīng)的表格字段。4.如權(quán)利要求2所述的系統(tǒng),其特征在于,所述一個或多個數(shù)據(jù)庫包括自動填充數(shù)據(jù)庫、聯(lián)系人列表數(shù)據(jù)庫、賬戶登記數(shù)據(jù)庫、以及產(chǎn)品注冊數(shù)據(jù)庫中的至少一個。5.如權(quán)利要求2所述的系統(tǒng),其特征在于,所述機(jī)器學(xué)習(xí)組件至少部分地基于一個或多個約束來生成數(shù)據(jù)庫輸入項對表格字段的賦值。6.如權(quán)利要求5所述的系統(tǒng),其特征在于,所述一個或多個約束包括限制每個基于web的表格使用任一數(shù)據(jù)庫輸入項的次數(shù)的重復(fù)使用約束。7.如權(quán)利要求5所述的系統(tǒng),其特征在于,所述一個或多個約束包括控制允許哪些數(shù)據(jù)庫輸入項或輸出類型呈現(xiàn)在當(dāng)前的任一基于web的表格上的合成約束。8.如權(quán)利要求5所述的系統(tǒng),其特征在于,所述一個或多個約束包括對一起出現(xiàn)的或以某一順序出現(xiàn)的字段的約束。9.如權(quán)利要求2所述的系統(tǒng),其特征在于,數(shù)據(jù)庫的輸入對應(yīng)于一個或多個數(shù)據(jù)庫或輸入字段,數(shù)據(jù)庫或輸入字段具有一個或多個從中得出的特征。10.如權(quán)利要求9所述的系統(tǒng),其特征在于,至少一個特征用于一特定數(shù)據(jù)字段,該數(shù)據(jù)字段是其他數(shù)據(jù)庫字段的上面、下面、左面、右面、緊接著上面、緊接著下面、緊接著左面或緊接著右面中的至少一個的。11.如權(quán)利要求10所述的系統(tǒng),其特征在于,還包括確定輸入字段到表格字段的包括所述至少一個特征的一特定賦值的聯(lián)合概率的組件。12.如權(quán)利要求2所述的系統(tǒng),其特征在于,還包括通過為一特定用戶學(xué)習(xí)某些輸入字段輸入項對應(yīng)于所觀察的數(shù)據(jù)庫輸入項來將從數(shù)據(jù)庫字段到表格值的映射個人化,并利用這些信息來更新自動填充組件的組件。13.如權(quán)利要求12所述的系統(tǒng),其特征在于,所述組件以站點特定的方式更新自動填充組件,這包括學(xué)習(xí)一特定web頁面上的某些輸入字段輸入項對應(yīng)于特定的數(shù)據(jù)庫輸入項。14.如權(quán)利要求2所述的系統(tǒng),其特征在于,所述機(jī)器學(xué)習(xí)組件觀察到用戶正在將數(shù)據(jù)輸入到與所述一個或多個數(shù)據(jù)庫中找到的數(shù)據(jù)相符合的字段中,這觸發(fā)所述自動填充組件部分地根據(jù)最佳分級的一致輸入項來提供新的自動填充建議。15.如權(quán)利要求2所述的系統(tǒng),其特征在于,所述一個或多個數(shù)據(jù)庫維護(hù)在與用戶的計算機(jī)分開的機(jī)器上。16.如權(quán)利要求1所述的系統(tǒng),其特征在于,還包括從一個或多個源收集訓(xùn)練數(shù)據(jù)的數(shù)據(jù)收集組件。17.如權(quán)利要求16所述的系統(tǒng),其特征在于,所述數(shù)據(jù)收集組件聚集輸入,并將其發(fā)送到中央儲存庫用于進(jìn)一步處理。18.如權(quán)利要求16所述的系統(tǒng),其特征在于,所述數(shù)據(jù)收集組件包括至少一個工具化的工具欄。19.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述輸入包括MAXLENGTH或SIZE輸入項。20.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述輸入包括字段名的子串。21.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述輸入包括來自一個或多個相鄰表格字段的信息。22.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述輸入包括附近文本或附近文本的子串中的至少一個。23.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述機(jī)器學(xué)習(xí)組件將一個或多個輸入轉(zhuǎn)換成一個或多個特征值。24.如權(quán)利要求23所述的系統(tǒng),其特征在于,所述特征值是布爾邏輯值或數(shù)字值中的一個。25.如權(quán)利要求24所述的系統(tǒng),其特征在于,所述布爾邏輯值是通過進(jìn)行下列的至少一個來自動確定的尋找游泳的范圍;以及尋找公知的和有用的字符序列。26.如權(quán)利要求24所述的系統(tǒng),其特征在于,所述布爾邏輯值是通過檢查輸入值并確定一個或多個最有用的布爾邏輯值來手工確定的。27.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述自動填充組件在用戶開始將數(shù)據(jù)輸入到字段中時以來自字段的下拉框提供自動填充建議。28.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述自動填充組件在用戶輸入字段時用建議的數(shù)據(jù)填充字段。29.如權(quán)利要求1所述的系統(tǒng),其特征在于,還包括檢測基于web的表格是否包括多種字段,并將它們分成至少兩個字段子組的組件。30.如權(quán)利要求29所述的系統(tǒng),其特征在于,所述組件采用直觀推斷來檢測多個組,并將它們分成至少兩個子組。31.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述機(jī)器學(xué)習(xí)組件包括監(jiān)控組件,觀察用戶對表格字段的輸入,以促進(jìn)學(xué)習(xí)什么值最適合于一個或多個表格字段。32.如權(quán)利要求31所述的系統(tǒng),其特征在于,所述機(jī)器學(xué)習(xí)組件學(xué)習(xí)用戶先前作出的那個輸入項是他最可能輸入到一給定的輸入字段中的。33.如權(quán)利要求32所述的系統(tǒng),其特征在于,所述機(jī)器學(xué)習(xí)組件不學(xué)習(xí)對于那些看上去包含敏感信息的字段的用戶輸入。34.如權(quán)利要求31所述的系統(tǒng),其特征在于,所述機(jī)器學(xué)習(xí)組件利用一個或多個數(shù)據(jù)庫輸入項和觀察到的輸入項來學(xué)習(xí)下列中的至少一個一字段用來自數(shù)據(jù)庫的輸入項填充的概率乘以該數(shù)據(jù)庫字段是正確的輸入項的概率;以及一字段不用來自數(shù)據(jù)庫的輸入項填充的概率乘以通過觀察用戶輸入項而計算出的概率。35.如權(quán)利要求31所述的系統(tǒng),其特征在于,所述機(jī)器學(xué)習(xí)組件部分地根據(jù)可能用于字段的值來生成一個或多個特征。36.如權(quán)利要求35所述的系統(tǒng),其特征在于,所述一個或多個特征對于下一值之前的每個值來說是基于順序的。37.如權(quán)利要求31所述的系統(tǒng),其特征在于,使用離線算法來訓(xùn)練所述機(jī)器學(xué)習(xí)系統(tǒng),所述離線算法包括收集字段輸入項的多個觀察到的實例,并存儲它們。38.如權(quán)利要求31所述的系統(tǒng),其特征在于,使用在線算法來訓(xùn)練所述機(jī)器學(xué)習(xí)系統(tǒng),所述在線算法使用Bayes方法、梯度下降、簸選或感知器算法中的一個。39.如權(quán)利要求1所述的系統(tǒng),其特征在于,表格字段包括文件輸入字段,部分地基于最近訪問的文件來顯示文件。40.如權(quán)利要求39所述的系統(tǒng),其特征在于,自動填充組件輸入的文件是部分地基于該文件字段中最近使用的輸入項和最近訪問的文件的某種組合來確定的。41.如權(quán)利要求40所述的系統(tǒng),其特征在于,所述組合至少部分地基于最近訪問的時間和最近輸入的時間。42.如權(quán)利要求1所述的系統(tǒng),其特征在于,表格字段包括單選按鈕和復(fù)選框,從而自動填充組件能夠?qū)W習(xí)是否要復(fù)選或不復(fù)選復(fù)選框,或選擇單選按鈕。43.一種存儲有權(quán)利要求1所述的系統(tǒng)的計算機(jī)可讀媒介。44.一種自動填充系統(tǒng),其特征在于,包括至少部分地根據(jù)觀察用戶對基于web的表格的一個或多個字段的輸入來訓(xùn)練的機(jī)器學(xué)習(xí)組件;從一個或多個源收集訓(xùn)練數(shù)據(jù)的數(shù)據(jù)收集組件,訓(xùn)練數(shù)據(jù)用戶訓(xùn)練機(jī)器學(xué)習(xí)組件;以及自動填充組件,至少部分地根據(jù)從機(jī)器學(xué)習(xí)組件作出的觀察中學(xué)習(xí)到的信息,自動地將預(yù)期的數(shù)據(jù)輸入到一個或多個表格字段。45.一種自動填充系統(tǒng),其特征在于,包括產(chǎn)生數(shù)據(jù)輸入項對基于web的表格的一個或多個字段的賦值的經(jīng)訓(xùn)練的機(jī)器學(xué)習(xí)組件;以及自動填充組件,至少部分地根據(jù)機(jī)器學(xué)習(xí)組件觀察到的經(jīng)學(xué)習(xí)的用戶偏好,自動地將數(shù)據(jù)輸入項輸入到一個或多個表格字段。全文摘要本發(fā)明提供一種獨特的系統(tǒng)和方法,能夠采用機(jī)器學(xué)習(xí)技術(shù)跨各種不同的Web表格自動填充一個或多個字段。特別地,一個或多個工具化工具可收集表格字段的輸入或輸入項。機(jī)器學(xué)習(xí)可用于學(xué)習(xí)什么數(shù)據(jù)對應(yīng)于哪些字段或哪些類型的字段。輸入可被發(fā)送回中央儲存庫,在中央儲存庫中,其它數(shù)據(jù)庫也可聚集在一起。該輸入可提供給機(jī)器學(xué)習(xí)系統(tǒng),以學(xué)習(xí)如何預(yù)測所希望的輸出??蛇x地或除此之外,可部分地通過觀察輸入項,然后相應(yīng)地對自動填充組件進(jìn)行適配來進(jìn)行學(xué)習(xí)。此外,可采用數(shù)據(jù)庫字段的若干特征以及約束來促進(jìn)數(shù)據(jù)庫輸入項到表格值的賦值-特別是在Web表格從未被自動填充系統(tǒng)看到過時。文檔編號G06F15/00GK1696937SQ200510070040公開日2005年11月16日申請日期2005年4月29日優(yōu)先權(quán)日2004年5月12日發(fā)明者C·M·卡迪,D·A·格拉斯哥,D·M·奇克林,D·E·布拉德福德,J·T·古德曼申請人:微軟公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
阿拉尔市| 闻喜县| 眉山市| 新田县| 中西区| 静乐县| 田阳县| 广德县| 贡山| 新宁县| 朝阳市| 永昌县| 芮城县| 馆陶县| 河东区| 绍兴市| 抚松县| 吉林省| 阿合奇县| 武义县| 金秀| 五家渠市| 湛江市| 应用必备| 石泉县| 衡阳市| 满洲里市| 封丘县| 广宗县| 定西市| 章丘市| 鲁山县| 洪湖市| SHOW| 蛟河市| 灌阳县| 长垣县| 聊城市| 祁阳县| 高唐县| 温州市|