現(xiàn)今計算機和計算機軟件用戶使用多種軟件應用來執(zhí)行各種任務,例如,寫作、計算、繪圖、組織、準備展示、發(fā)送及接收電子郵件、制作音樂等等。用戶可以使用電子表格(spreadsheet)應用來處理及操作數(shù)據(jù),并且使用電子表格功能,利用他們的數(shù)據(jù)來執(zhí)行很多從簡單到很復雜的計算和組織的功能。
電子表格應用常常被用于數(shù)據(jù)分析;然而,很多現(xiàn)今的工具是手動的,意味著用戶必須規(guī)定他們正在饋入的數(shù)據(jù)是何類型并且他們希望執(zhí)行的分析是何種類。此外,用戶可以潛在地需要編輯他們的數(shù)據(jù)用以符合工具的需要(例如,重新排列他們的數(shù)據(jù)至能夠由工具識別的形式,以特定的格式表達數(shù)據(jù)等等)。
當嘗試從他們的數(shù)據(jù)識別見解(insights)時,一些用戶可能經(jīng)歷挑戰(zhàn)。例如,數(shù)據(jù)集可能包括嘈雜的和/或不完整的數(shù)據(jù)。諸如離群值和缺失數(shù)據(jù)之類的嘈雜數(shù)據(jù)可以使普通用戶難以確定有意義的分析數(shù)據(jù)(例如,平均值、趨勢線等等)。
可能需要普通用戶具有應用能力的某些知識基礎并且可能需要一系列復雜的步驟來執(zhí)行某些操作。很多普通用戶可能具有對統(tǒng)計圖形或數(shù)據(jù)分析的原理的有限知識,這使得他/她難以識別重要的見解。正是關于這些以及其他考慮,本發(fā)明得以做出。
技術實現(xiàn)要素:
本發(fā)明內(nèi)容被提供用于介紹以簡化形式的選擇的概念,其繼而在下文的具體實施方式中進行描述。本發(fā)明內(nèi)容并不旨在識別要求保護的主題的關鍵特征或本質(zhì)特征,也并不旨在作為確定要求保護的主題的范圍的幫助。
通過自動地識別來自數(shù)據(jù)集的見解并且呈現(xiàn)以重要性排名的見解,本發(fā)明的實施例解決上文以及其他問題。實施例提供不同數(shù)據(jù)類型以及結(jié)構(gòu)(例如,數(shù)字數(shù)據(jù)集、時間序列、序數(shù)序列、層級、類別等)的自動辨識,以及利用對應于它們的特定分析類型的這些數(shù)據(jù)類型和結(jié)構(gòu)的自動匹配。自動辨識可以對數(shù)據(jù)中的錯誤(例如,缺失值、離群值)并且對數(shù)據(jù)的格式中的多樣性(例如,可以表達日期/時間的大量方式,可以展示層級的不同方式等)是彈性的。
根據(jù)確定的對應的分析類型,數(shù)據(jù)可以被自動地分析,并且來自這些分析的見解可以被自動地識別。分析可以產(chǎn)生大量具有不同強度的見解。實施例包括等級系統(tǒng),其可操作為確定在給定見解類型中(例如,相關性、線性趨勢等)最強的見解,并且還確定見解類型之間的見解等級。因此,可以生成橫跨不同見解類型的見解并且按確定的重要性的次序的列表。
實施例可以包括見解展示引擎,其可操作為自動地生成圖表和自然語言文本,該圖標形象化描述每個見解,該自然語言文本以針對可能不熟悉統(tǒng)計學的普通觀眾可理解的方式描述每個見解。根據(jù)實施例,每個圖表可以被定制為展現(xiàn)特定的見解,而不是描繪全部數(shù)據(jù)集。文本可以包括來源于用戶自己的數(shù)據(jù)的標頭和值。
一個或多個實施例的細節(jié)在以下附圖和描述中進行闡述。其他特征和優(yōu)點根據(jù)閱讀以下的具體實施方式及檢閱關聯(lián)的附圖將是明顯的。要理解的是,以下的具體實施方式僅是說明性的而非對要求保護的發(fā)明進行限制。
附圖說明
并入本公開并且構(gòu)成本公開一部分的附圖圖示了本發(fā)明的各個實施例。在附圖中:
圖1是用于自動識別來自數(shù)據(jù)集的見解并且呈現(xiàn)以重要性排名的見解的系統(tǒng)的一個實施例的框圖;
圖2A是包括數(shù)據(jù)集的示例電子表格應用用戶界面的圖示;
圖2B是包括見解列表的示例電子表格應用用戶界面的圖示;
圖2C是見解被選擇并顯示為圖表的示例電子表格應用用戶界面的圖示;
圖2D是圖表被插入電子表格中的示例電子表格應用用戶界面的圖示;
圖3是用于自動識別來自數(shù)據(jù)集的見解并且呈現(xiàn)以重要性排名的見解的方法的流程圖;
圖4是圖示了計算設備的示例物理元件的框圖,本發(fā)明的實施例可以利用該計算設備而被實施;
圖5A和5B是移動計算設備的簡化框圖,本發(fā)明的實施例可以利用該移動計算設備而被實施;以及
圖6是本發(fā)明的實施例可以在其中被實施的分布式計算系統(tǒng)的簡化框圖。
具體實施方式
本發(fā)明的實施例針對自動識別來自數(shù)據(jù)集的見解并且按照重要性排名圖形地并以自然語言文本呈現(xiàn)見解。如上文簡要描述的,數(shù)據(jù)集中的不同數(shù)據(jù)類型和結(jié)構(gòu)可以被自動地辨識并且匹配有對應的特定分析類型。數(shù)據(jù)集可以根據(jù)確定的對應的分析類型而被分析,并且來自分析的見解可以被自動地識別。給定見解類型中的以及見解類型之間的見解可以按重要性的次序在自動生成的圖表中以及自然語言文本中被排名和呈現(xiàn),該自動生成的圖表形象化描述每個見解,該自然語言文本以針對可能不熟悉統(tǒng)計學的普通觀眾可以理解的方式描述每個見解。
以下的具體實施方式涉及附圖。在任何可能的情況下,在圖中和以下描述中使用的相同附圖標記指代相同或相似要素。當本發(fā)明的實施例被描述的時候,修改、適應以及其他的實施方式是可能的。例如,可以對附圖中圖示的要素做出代替、增加或修改,并且本文中描述的方法可以通過向所公開的方法代替、重新安排或增加階段而被修改。因此,以下的具體實施方式并不限制本發(fā)明,與之相反,本發(fā)明的適當?shù)姆秶伤降臋嗬髸薅ā?/p>
現(xiàn)在參照附圖,其中相同的附圖標記表示相同要素,各種實施例將被描述。圖1是圖示了用于自動地識別來自數(shù)據(jù)集的見解并且呈現(xiàn)以重要性排名的見解的系統(tǒng)架構(gòu)100的框圖。系統(tǒng)架構(gòu)100包括計算設備155。計算設備155可以是下文參照圖4至圖6描述的多種合適的計算設備之一。例如,計算設備155可以包括平板計算設備、臺式計算機、移動通信設備、膝上型計算機、膝上型/平板混合計算設備、游戲設備或用于執(zhí)行應用150的其他類型計算設備以用于執(zhí)行多種任務。
結(jié)合計算設備155圖示的應用150說明具有實現(xiàn)文中所述的本發(fā)明的實施例的充分的計算機可執(zhí)行指令的任意應用。例如,應用150可以包括電子表格應用、單詞處理應用、幻燈片展示應用、電子郵件應用、筆記記錄應用、桌面排版應用等。示例電子表格應用150包括由微軟公司(華盛頓的雷德蒙德)生產(chǎn)的應當理解的是,該示例電子表格格只是適用于實現(xiàn)文中所述的實施例的很多應用中的一個示例。
應用150可以包括厚客戶端應用或者可以包括瘦客戶端應用(即網(wǎng)絡應用),該厚客戶端應用可被本地存儲在計算設備155上,該瘦客戶端應用可位于遠端服務器上并且通過網(wǎng)絡(諸如因特網(wǎng)或內(nèi)聯(lián)網(wǎng))可訪問。瘦客戶端應用可以在瀏覽器控制的環(huán)境中被托管或以瀏覽器支持的語言被編碼,并且依靠普通網(wǎng)絡瀏覽器來實施在計算設備155上可執(zhí)行的應用。
系統(tǒng)架構(gòu)100包括辨識器110,其被配置為執(zhí)行與解析輸入數(shù)據(jù)105、辨識不同數(shù)據(jù)類型和結(jié)構(gòu)、以及利用對應于它們的特定分析類型自動地匹配這些數(shù)據(jù)類型和結(jié)構(gòu)相關的操作。根據(jù)實施例,輸入數(shù)據(jù)105可以是可以從電子表格應用105或其他數(shù)據(jù)源得到的半結(jié)構(gòu)化的數(shù)據(jù)。數(shù)據(jù)105可以包括數(shù)據(jù)單元矩陣中的數(shù)據(jù)點。
根據(jù)實施例,辨識器110可以可操作為解析輸入數(shù)據(jù)105并且生成結(jié)構(gòu)化數(shù)據(jù)集115(諸如數(shù)字數(shù)據(jù)集、時間序列、序數(shù)序列、層級、類別等)。辨識器110可以可操作為辨識數(shù)據(jù)類型(諸如時間序列、層級數(shù)據(jù)、類別等)。辨識器110還可以可操作為確定包含數(shù)字數(shù)據(jù)的列(或行)是公制的還是非公制的。例如,電子表格中的表格可以包括由識別號表示的學生ID的列。確定可以由辨識器110做出,當值是數(shù)字的時候,它們不應當被聚合,因而可以被辨識為非公制。自動辨識可以對數(shù)據(jù)105中的錯誤(例如,缺失值、離群值)以及在數(shù)據(jù)的格式中多樣性(例如,可以表達日期/時間的大量的方式,可以展示層級的不同方式等等)是彈性的。辨識器110可以辨識在半結(jié)構(gòu)化數(shù)據(jù)表之外的時間序列數(shù)據(jù),其中時間序列數(shù)據(jù)可以被定義為由具有相等間隔的時間序列驅(qū)動的一組數(shù)字值(例如,一天、兩周、三個月、五年等)。辨識器110可以可操作為辨識來自不同格式的數(shù)據(jù)表的時間序列數(shù)據(jù)(例如,僅包含一年、結(jié)合兩列/標頭來形成時間序列等)。很多電子表格可以是能夠被制定為層級結(jié)構(gòu)的復雜結(jié)構(gòu)。辨識器110可以可操作為從半結(jié)構(gòu)化輸入數(shù)據(jù)105中提取復雜結(jié)構(gòu)并且將數(shù)據(jù)105制定為層級結(jié)構(gòu)數(shù)據(jù)115。辨識器110還可以可操作為辨識輸入數(shù)據(jù)105內(nèi)的類別。例如,辨識器110可以辨識到,數(shù)據(jù)105表格中的列或行可以是諸如汽車品牌之類的類別。
系統(tǒng)架構(gòu)100包括見解引擎120,其被配置為執(zhí)行與接收及分析結(jié)構(gòu)化數(shù)據(jù)115并且基于該分析生成見解125相關的操作。見解引擎120可以可操作為生成與各種類型的結(jié)構(gòu)化數(shù)據(jù)115關聯(lián)的見解,這些結(jié)構(gòu)化數(shù)據(jù)115諸如為(但不局限于)單個數(shù)字數(shù)據(jù)集、單個時間序列、兩個時間序列之間的相關、多個時間序列之間的相關、層級、類別等。
可以從單個數(shù)字數(shù)據(jù)集生成的見解125的一種類型可以包括確定數(shù)據(jù)集105是否包括缺失數(shù)據(jù)點。通常,輸入數(shù)據(jù)集105中可能有缺失的數(shù)據(jù)點。這些缺失數(shù)據(jù)點的對應單元可以是空的或者充滿有特殊數(shù)字(例如,0、-1、-999等)。見解引擎120可以可操作為檢測這樣的空的單元或特殊數(shù)字,并且確定特定的數(shù)據(jù)點是否是缺失的數(shù)據(jù)點。
可以從單個數(shù)字數(shù)據(jù)集115生成的見解125的另一類型可以包括計算數(shù)字數(shù)據(jù)集的穩(wěn)健平均值。平均值是關于數(shù)字數(shù)據(jù)集的基本見解;然而,歸因于偏斜計算的平均值的離群值的可能性,直接計算所有數(shù)據(jù)點(除去任何缺失的數(shù)據(jù)點)的平均值可產(chǎn)生誤導的結(jié)果。因此,根據(jù)一個實施例,見解引擎120可以使用截尾均值統(tǒng)計測量來計算穩(wěn)健平均值(即,除去最大x%和最小x%值的數(shù)字數(shù)據(jù)集的平均值)。
見解引擎120可以可操作為自動地識別數(shù)字數(shù)據(jù)集115是否包括任何離群值數(shù)據(jù)點。根據(jù)一個實施例,見解引擎120可以計算數(shù)據(jù)集的截尾標準差,其中最大的x%和最小的x%被除去。穩(wěn)健的離群值可以通過確定預定間隔外的所有值而被獲得,例如:[TM-3*TS,TM+3*TS],其中TM是截尾平均值并且TS是截尾標準差。數(shù)據(jù)集115中離群值的數(shù)目可以被使用來確定離群值類型見解125的重要性。
離群值可以導致數(shù)字數(shù)據(jù)集115的偏態(tài)分布,其可導致普通直方圖不良可視化。因此,見解引擎120可以包含范圍直方圖,其智能地把偏態(tài)分布劃分為多個段,其中每一段具有正態(tài)分布。根據(jù)一個實施例,見解引擎120可以能夠自動地識別兩個或更多任意分布是否相似。
見解引擎120可以進一步可操作為生成與單個時間序列關聯(lián)的見解125。根據(jù)實施例,如上文描述的數(shù)字數(shù)據(jù)集115的見解125還可以應用于時間序列數(shù)據(jù)集115。此外,以下見解125的類型可以用于單個時間序列而被識別:尖峰、跳躍、具有離群值的穩(wěn)健線性趨勢、具有不同變體的段等等。
當在本地范圍中的值與它鄰近數(shù)據(jù)點相比顯著地高或低時,可以識別時間序列中的尖峰。當時間序列的平均值在特定的時間點顯著地變化時,可以識別時間序列中的跳躍。考慮潛在的離群值,可以檢測時間序列的線性趨勢。
見解引擎120可以利用穩(wěn)健線性回歸算法來檢測是否有針對時間序列的線性趨勢。算法可以對離群值不敏感。如果線性趨勢被識別,離群值可以針對時間序列與回歸的線性趨勢之間的殘差而被檢測。
見解引擎120可以可操作為識別具有不同變量范圍的時間序列中的段。例如,時間序列的變量范圍可以改變,其可以反映時間序列的穩(wěn)定性。
有時,兩個時間序列可以具有相似的發(fā)展模式(例如,兩個時間序列的值同時增加或減小)。見解引擎120可以可操作為識別兩個時間序列是否相關。根據(jù)一個實施例,穩(wěn)健線性回歸可以被利用,并且如果穩(wěn)健線性回歸的殘差是小的,則兩個時間序列可以被確定為相關。根據(jù)另一個實施例,相關系數(shù)(例如,皮爾遜相關)可以被計算以檢測是否兩個時間序列可以是有關的。
如上文描述,見解引擎120還可以可操作為檢測多個時間序列之間的相關。見解引擎120可以檢測所有的相關時間序列對且隨后執(zhí)行聚類來檢測可能的相關。
如上文描述,見解引擎120可以可操作為生成與數(shù)據(jù)的層級關聯(lián)的見解。為了從具有與每個節(jié)點關聯(lián)的數(shù)字屬性的層級得到見解,見解引擎120可以確定跨父節(jié)點的所有子節(jié)點的求和值的差,跨父節(jié)點的所有子節(jié)點的方差的差,以及跨父節(jié)點的所有子節(jié)點的平均值的差。
仍如上文描述,見解引擎120可以可操作為生成與數(shù)據(jù)種類關聯(lián)的見解。為了從類別中得到見解,見解引擎120可以確定跨給定類別值的多個值的求和。
對于給定數(shù)據(jù)集115,可以存在多個見解。即使小的數(shù)據(jù)集也可以產(chǎn)生大量不同強度的見解。向用戶呈現(xiàn)所有識別的見解125對于用戶而言可能是壓倒性的。因此,系統(tǒng)100可以包括排名系統(tǒng)130,其可操作為在給定見解類型(例如,相關、線性趨勢等)中且在不同見解類型之間對所識別的見解125進行排名。例如,排名系統(tǒng)130可以可操作為將相關見解的強度與線性趨勢的強度進行比較從而確定在結(jié)果的有序列表中哪一個見解125應當在其他見解之前出現(xiàn)。
一些見解125結(jié)果可以被認為相當?shù)貜姾兔黠@,而其他的見解可以被認為不那么強和明顯。例如,相對于落在平均值的兩個標準差內(nèi)的離群值,在平均值之上非常高(例如,平均值之上2.5個標準差)的離群值可以被認為是非常強的發(fā)現(xiàn)。排名系統(tǒng)130可以通過由見解引擎120識別的見解125而解析,經(jīng)由數(shù)學定義而確定最強的發(fā)現(xiàn),隨后跨各種見解類型排名最強的見解。因此,可以生成見解125的有序列表135。
系統(tǒng)架構(gòu)100包括見解呈現(xiàn)器140,其被配置為執(zhí)行與生成形象化描述每個見解125的圖表160以及生成在描述性本文字符串中描述每個見解125的自然語言文本165相關的操作。如參照圖2A至2D將更詳細描述的,(多個)圖表160和自然語言文本165可以被提供,并且可以在見解用戶界面(UI)145中被呈現(xiàn)。
現(xiàn)在參照圖2A,示例電子表格應用用戶界面200和電子表格文件205被圖示,其可以在上文描述的任何合適的計算設備155上被顯示。根據(jù)實施例,與電子表格用戶界面200和電子表格文件205的用戶交互可以經(jīng)由多種交互方法而被完成,這些交互方法包括鍵盤輸入、鼠標輸入、手勢輸入、語音命令、眼動追蹤、薄空氣手勢輸入、電子墨輸入和/或它們的組合。電子表格用戶界面200和電子表格文件205僅是為了示例和圖示的目的,且并不窮舉可以包含本發(fā)明實施例可以被使用的數(shù)據(jù)的文件的不同類型。例如,雖然本文中描述的實施例討論自動地識別來自數(shù)據(jù)集的見解和呈現(xiàn)與包含在電子表格應用文件205中的數(shù)據(jù)關聯(lián)的見解,能夠接收顯示并且允許電子表格類型的功能的操作的其他軟件應用以及關聯(lián)的文件(例如為單詞處理文件、幻燈片展示文件、電子郵件文件、筆記文件等)可以依照本發(fā)明的實施例被利用。
仍然參照圖2A,示例電子表格用戶界面200包括可以是半結(jié)構(gòu)化數(shù)據(jù)集的數(shù)據(jù)105。在示例電子表格文件205中,數(shù)據(jù)105是數(shù)據(jù)表,其包括數(shù)據(jù)單元矩陣,該數(shù)據(jù)單元矩陣包含從2022年至2023年的制造、零售和運輸?shù)脑露融厔莸臄?shù)據(jù)。根據(jù)實施例,見解功能控制220可以被提供,當其被選擇時可以自動地提取數(shù)據(jù)105并且導出及排名來自數(shù)據(jù)105的見解125。
現(xiàn)在參照圖2B,導出且排名的見解125被示出為顯示在見解任務窗格225中。根據(jù)一個實施例,見解135的有序列表可以響應于電子表格205中的數(shù)據(jù)105的選擇而動態(tài)地變化。列表135中的每個見解125A至125N可以由描述特定見解的自然語言文本字符串165A至165N表示。自然語言文本165可以以簡單的術語解釋見解125,使得對不熟悉統(tǒng)計學的普通觀眾而言是可理解的。自然語言文本165可以包括來源于數(shù)據(jù)105的文本。根據(jù)一個實施例,針對趨勢見解類型的描述性字符串可以是:“<時間期間>、<列名稱>、<變化程度>、從<時間粒度>。”例如,第一見解125A包括自然語言文本字符串165A“在2023年,制造和零售逐月穩(wěn)步增長”。
此外,每個見解125A至125N可以包括描述見解類型的圖標230A至230C(例如,增大、減小、或穩(wěn)定的趨勢、峰值或谷值、變量之間的正相關或負相關等)。例如,第一見解125A包括示出增大趨勢的圖標230A。
與見解125的交互在圖2C中被圖示。如圖所示的,在鼠標懸?;蜻x擇之上,見解125可以被強調(diào)210。此外,在電子表格205中涉及見解的單元255的范圍可以被強調(diào)。此外,在鼠標懸停或選擇之上,最佳示例了見解125的自動生成圖表160可以被顯示。圖表160可以包括趨勢線、形狀、注釋或其他有助于使見解125更直觀的附加特征,并且還可以包括涉及見解125的置信度水平數(shù)據(jù)245。每個見解125可以具有展現(xiàn)特定見解的一個或多個圖表160。
作為示例并且在圖2C中圖示,趨勢類型的見解125可以利用折線圖160表示,其中x軸可以跨越趨勢的期間并且可以由時間粒度界定(例如,逐年、逐月、逐日等),并且y軸是變量的值范圍。折線圖160還可以包括擬合觀察到的趨勢的斜率的線性趨勢線。圖表160可以包括標題215,其可以是(多個)變量列名稱(例如,“制造”和“零售”)和時間聲明(例如,“2023”、“2020-2022”、“五月-九月”等)的連結(jié)。
如果用戶希望插入與見解125關聯(lián)的圖表160至電子表格205中,他/她可以選擇插入圖表功能控制250。因此,圖表160可以被實例化為電子表格205中的圖表,如在圖2D中所示。
圖3是示出用于自動地識別來自數(shù)據(jù)集的見解并且呈現(xiàn)以重要性排名的見解的方法300的一個實施例的流程圖。方法300在操作305開始并且進行到操作310,在操作310處數(shù)據(jù)105被接收。如上所述,接收到的數(shù)據(jù)105可以是從電子表格應用150或其他數(shù)據(jù)源獲得的半結(jié)構(gòu)化數(shù)據(jù)。根據(jù)實施例,當接收到見解功能控制220的選擇的指示時,數(shù)據(jù)105可以被提取并且填充進辨識器110。
方法300可以進行至操作315,在操作315處數(shù)據(jù)105可以被解析并被轉(zhuǎn)換至結(jié)構(gòu)化數(shù)據(jù)集115。根據(jù)一個實施例,操作315可以由辨識器110執(zhí)行。如上所述,數(shù)據(jù)105可以被結(jié)構(gòu)化為數(shù)字數(shù)據(jù)集、時間序列、序數(shù)序列、層級、類別或其他類型的結(jié)構(gòu)化數(shù)據(jù)集115。
方法300可以進行至操作320,在操作320處結(jié)構(gòu)化數(shù)據(jù)115可以根據(jù)對應于數(shù)據(jù)類型和結(jié)構(gòu)的分析類型被分析,并且見解125可以被識別。例如,針對數(shù)字數(shù)據(jù)集,見解引擎120可以自動地識別是否任何數(shù)據(jù)點是離群值數(shù)據(jù)點。
方法300可以進行至操作325,在操作325處經(jīng)識別的見解125可以被分析并且按重要性次序排名。如上所述,排名系統(tǒng)130可以可操作為在給定見解類型中的(例如,相關性、線性趨勢等)以及不同見解類型之間排名所識別的見解125。例如,排名系統(tǒng)130可以可操作為將相關性見解的強度與線性趨勢見解的強度比較來確定在見解135的有序列表中哪一個見解125應當在其他見解之前出現(xiàn)。
方法300進行至操作330,在操作330處圖表160形象化描述每個見解125,并且在描述性文本字符串中描述每個見解125的自然語言文本165可以被生成。在操作335處,(多個)圖表160和自然語言文本165可以在見解用戶界面(UI)145中被呈現(xiàn)。見解125可以按由排名系統(tǒng)130確定的重要性的次序被呈現(xiàn)。用戶可以能夠滾動及觀看各種見解125,并且選擇性地將一個或多個見解125插入電子表格205中。該方法可以在操作395處結(jié)束。
雖然本發(fā)明已經(jīng)被與在計算機上的操作系統(tǒng)上運行的應用程序相結(jié)合而執(zhí)行的程序的背景中進行了描述,本領域的技術人員將意識到還可以結(jié)合其他程序模塊而實現(xiàn)本發(fā)明。通常,程序模塊包括例程、程序、組分、數(shù)據(jù)結(jié)構(gòu)、以及執(zhí)行特定任務或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的其他類型結(jié)構(gòu)。
本文中描述的實施例和功能可以經(jīng)由許多計算系統(tǒng)操作,這些計算機系統(tǒng)包括(但不限于)桌面計算機系統(tǒng)、有線和無線計算系統(tǒng)、移動計算系統(tǒng)(例如,移動電話、上網(wǎng)本、平板或板型計算機、筆記本計算機以及膝上型計算機)、手持設備、多處理器系統(tǒng)、基于微處理器或可編程消費級電子器件、微型計算機和大型計算機。
此外,本文中描述的實施例和功能可以在分布式系統(tǒng)上操作(例如,基于云的計算系統(tǒng)),其中應用功能、存儲器、數(shù)據(jù)儲存以及檢索和各種處理功能可以在分布式計算網(wǎng)絡上(諸如因特網(wǎng)或內(nèi)聯(lián)網(wǎng))彼此遠程操作。用戶界面和不同類型的信息可以經(jīng)由機載計算設備顯示器或經(jīng)由與一個或多個計算設備關聯(lián)的遠程顯示單元而被顯示。例如,用戶界面和不同類型的信息可以在墻表面上被顯示并交互,用戶在該墻表面上交互并且各種類型的信息被投影到該墻表面上。與本發(fā)明的實施例利用其可以被實施的多個計算系統(tǒng)的交互包括:按鍵輸入、觸屏輸入、聲音或其他音頻輸入、手勢輸入等,在手勢輸入中關聯(lián)的計算設備配備有檢測(例如,相機)功能,其用來采集以及解釋用戶手勢以用于控制計算設備的功能。
圖4至圖6和關聯(lián)的描述提供了在其中本發(fā)明的實施例可以被實踐的各種操作環(huán)境的討論。然而,關于圖4至圖6所圖示及討論的設備和系統(tǒng)是出于示例和圖示的目的,且并不對可被利用來實踐文中描述的本發(fā)明的實施例的大量計算設備配置做出限制。
圖4是圖示本發(fā)明的實施例可以利用其而被實踐的計算設備400的物理部件(即,硬件)的框圖。下文描述的計算設備部件可以適于用戶設備125和/或上文描述的服務器。在基本的配置中,計算設備400可以包括至少一個處理單元402和系統(tǒng)存儲器404。取決于計算設備的配置和類型,系統(tǒng)存儲器404可以包括(但不限于)易失性存儲器(例如,隨機存取存儲器)、非易失性存儲器(例如,只讀存儲器)、閃存、或這些存儲器的任意結(jié)合。系統(tǒng)存儲器404可以包括操作系統(tǒng)405和的一個或多個程序模塊406,其適于運行軟件應用150(諸如電子表格應用),且用于運行一個或多個辨識器110、見解引擎120、排名引擎130和見解呈現(xiàn)器140。操作系統(tǒng)405例如可以適于控制計算設備400的操作。此外,本發(fā)明的實施例可以與圖像庫、其他操作系統(tǒng)、或任意其他應用程序共同被實踐并且不限于任意特定的應用或系統(tǒng)?;镜呐渲迷趫D4中由在虛線408內(nèi)的那些部件圖示。計算設備400可以具有額外的特征或功能。例如,計算設備400還可以包括附加的數(shù)據(jù)儲存設備(可移動和/或不可移動)諸如舉例為磁盤、光盤或磁帶。這樣的附加儲存在圖4中由可移動儲存設備409和不可移動儲存設備410所圖示。
如上所述,多個程序模塊或數(shù)據(jù)文件可以被儲存在系統(tǒng)存儲器404中。當在處理器單元402上執(zhí)行時,程序模塊406可以執(zhí)行過程,該過程包括(但不限于)在圖3中圖示的方法300的一個或多個階段。其他程序模塊可以依照本發(fā)明的實施例被使用并且可以包括諸如電子郵件和聯(lián)絡應用、單詞處理應用、電子表格應用、數(shù)據(jù)庫應用、幻燈片展示應用、繪圖或計算機輔助應用程序之類的應用。
此外,本發(fā)明的實施例可以在包括分立的電子元件的電氣電路中、包括邏輯門的封裝或集成的電子芯片的電子電路、利用微處理器的電路、或在包含電子元件或微處理器的單個芯片上被實踐。例如,本發(fā)明的實施例可以經(jīng)由片上系統(tǒng)(SOC)而被實踐,在片上系統(tǒng)中圖4中圖示的每個或多個部件可以被集成到單個集成電路上。這樣的SOC設備可以包括一個或多個處理單元、圖形單元、通信單元、系統(tǒng)虛擬化單元以及各種應用功能,所有的這些被集成(或“燒”)到芯片基底上作為單個集成電路。當經(jīng)由SOC操作時,文中所述的關于自動地識別來自數(shù)據(jù)集的見解并且呈現(xiàn)以重要性排名的見解的功能可以經(jīng)由在單個集成電路(芯片)上與計算設備400的其他部件集成的特定應用邏輯而被操作。還可以使用能夠執(zhí)行邏輯操作(諸如,例如,與AND、或OR以及非NOT)的其他技術而實踐本發(fā)明的實施例,這些其他技術包括但不限于機械的、光學的、流體的和量子的技術。此外,本發(fā)明的實施例可以在通用目的計算機或任意其他電路或系統(tǒng)中被實踐。
計算設備400還可以具有諸如鍵盤、鼠標、筆、聲音輸入設備、接觸輸入設備之類的一個或多個輸入設備412。也可以包括諸如顯示器、揚聲器、打印機之類的輸出設備414。上文提到的設備是示例并且其他的設備也可以被使用。計算設備400可以包括一個或多個通信連接416,其允許與其他計算設備418進行通信。合適的通信連接416的示例包括但不限于:RF發(fā)送器、接收器、和/或收發(fā)器電路;通用串行總線(USB)、并聯(lián)和/或串聯(lián)端口。
如本文中使用的術語計算機可讀介質(zhì)可以包括計算機儲存介質(zhì)。計算機儲存介質(zhì)可以包括用于儲存諸如計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)或程序模塊之類的信息的以任何方法或技術實現(xiàn)的易失的和非易失的、可移動的和不可移動的介質(zhì)。系統(tǒng)存儲器404、可移動儲存設備409以及不可移動儲存設備410均是計算機儲存介質(zhì)示例(即,存儲器儲存)。計算機儲存介質(zhì)可以包括RAM、ROM、電可擦只讀存儲器(EEPROM)、閃存或其他存儲器技術、CD-ROM、數(shù)字多用盤(DVD)或其他光學儲存、磁帶盒、磁帶、磁盤儲存或其他磁儲存設備,或者可以被用來儲存信息并且可以由計算設備400訪問的任何其他制品。任何這種計算機儲存介質(zhì)可以是計算設備400的部分。計算機儲存介質(zhì)不包括載波或其他傳播的或調(diào)制的數(shù)據(jù)信號。
通信介質(zhì)可以由計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或在調(diào)制數(shù)據(jù)信號(諸如載波或其他運輸機制)中的其他數(shù)據(jù)實施,并且包括任何信息傳送介質(zhì)。術語“調(diào)制的數(shù)據(jù)信號”可以描述具有一個或多個特性集或以編碼在信號中的信息的方式變化的信號。通過示例(并且不是限制),通信介質(zhì)可以包括諸如有線網(wǎng)絡或直接有線連接之類的有線介質(zhì)以及諸如聲音、射頻(RF)、紅外線和其他無線介質(zhì)之類的無線介質(zhì)。
圖5A和圖5B圖示了本發(fā)明的實施例可以利用其實踐的移動計算設備500,例如移動電路、智能電話、平板個人計算機、膝上型計算機等。參照圖5A,圖示了用于實現(xiàn)實施例的移動計算設備500的一個實施例。在基本的配置中,移動計算設備500是具有輸入元件和輸出元件兩者的手持計算機。移動計算設備500通常包括顯示器505和允許用戶輸入信息至移動計算設備500中的一個或多個輸入按鍵510。移動計算設備500的顯示器505還可以作為輸入設備(例如,觸屏顯示器)工作。如果包括,可選的側(cè)面輸入元件515進一步允許用戶輸入。側(cè)面輸入元件515可以是旋轉(zhuǎn)的開關、按鍵或任意其他類型的手動輸入元件。在可替代實施例中,移動計算設備500可以包含更多或更少的輸入元件。例如,在一些實施例中,顯示器505可以不是觸屏。在另一個備選的實施例中,移動計算設備500是便攜式電話系統(tǒng),諸如蜂窩電話。移動計算設備500還可以包括可選的按鍵535。可選的按鍵535可以是物理的按鍵或在觸屏上生成的“軟”按鍵。在各個實施例中,輸出元件包括用于示出圖形用戶界面(GUI)的顯示器505、視覺指示器520(例如,發(fā)光二極管)、和/或音頻換能器525(例如,揚聲器)。在一些實施例中,移動計算設備500包含用于向用戶提供觸覺反饋的振動換能器。在又一實施例中,移動計算設備500包含用于向外部設備發(fā)送信號或接收來自外部設備信號的輸入和/或輸出端口,諸如音頻輸入(例如,麥克風插口)、音頻輸出(例如,耳機插口)以及視頻輸出(例如,HDMI端口)。
圖5B是圖示了移動計算設備的一個實施例的架構(gòu)的框圖。即,移動計算設備500可以包含系統(tǒng)(即,架構(gòu))502來實現(xiàn)一些實施例。在一個實施例中,系統(tǒng)502被實現(xiàn)為能夠運行一個或多個應用(例如,瀏覽器、電子郵件、日記、聯(lián)系人管理、消息客戶端、游戲以及媒體客戶端/播放器)的“智能電話”。在一些實施例中,系統(tǒng)502被集成為計算設備,諸如集成的個人數(shù)字助理(PDA)和無線電話。
一個或多個應用程序150以及一個或多個辨識器110、見解引擎120、排名系統(tǒng)130以及見解呈現(xiàn)器140可以被加載至存儲器562中并且在操作系統(tǒng)564上或關聯(lián)于操作系統(tǒng)564運行。應用程序的示例包括電話撥號程序、電子郵件程序、個人信息管理(PIM)程序、單詞處理程序、電子表格程序、因特網(wǎng)瀏覽器程序、消息程序等等。系統(tǒng)502還包括在存儲器562內(nèi)的非易失性儲存區(qū)域568。非易失性儲存區(qū)域568可以被使用于儲存如果系統(tǒng)502斷電也不應當丟失的永久信息。應用程序150可以使用及儲存在非易失性存儲區(qū)域568中的信息,諸如電子郵件或由電子郵件使用的其他消息等等。同步應用(未示出)也位于系統(tǒng)502上并且被編程用于與位于主機上的對應的同步應用交互來保持儲存在非易失性儲存區(qū)域568中的信息與對應的儲存在主機上的信息同步。應當理解的是,其他應用可以被加載至存儲器562中并且在移動計算設備500上運行。
系統(tǒng)502具有可以被實現(xiàn)為一個或多個電池的電源570。電源570還可以包括外部功率源,諸如對電池進行補充或充電的功率對接支架或AC配適器。
系統(tǒng)502還可以包括執(zhí)行發(fā)送和接收射頻通信功能的無線電572。無線電572經(jīng)由通信載波或服務提供者幫助系統(tǒng)502和“外部世界”之間的無線連接。來自或發(fā)送至無線電572的傳輸在操作系統(tǒng)564的控制下進行。換言之,由無線電572接收的通信可以經(jīng)由操作系統(tǒng)被散播至應用程序150,反之亦然。
視覺指示器520可以被使用來提供視覺通知和/或音頻界面574可以被使用來經(jīng)由音頻換能器525產(chǎn)生可聽見的通知。在圖示的實施例中,視覺指示器520是發(fā)光二極管(LED)并且音頻換能器525是揚聲器。這些設備可以直接連接至電源570,從而當處于激活時,即使處理器560和其他部件可能關閉來保存電池功率,它們保持由通知機制指定的一段期間。LED可以被編程來無限期保持直到用戶采取措施指示設備的通電狀態(tài)。音頻界面574被使用于提供可聽見的信號至用戶并且接收來自用戶的可聽見的信號。例如,除連接至音頻換能器525之外,音頻界面574還可以連接至麥克風來接收可聽見的輸入,諸如促進電話會話。依照本發(fā)明的實施例,下文將描述,麥克風還可以充當音頻傳感器來促進通知的控制。系統(tǒng)502還可以包括視頻界面576,其使能用來記錄靜止圖像、視頻流等的機載相機530的操作。
實現(xiàn)系統(tǒng)502的移動計算設備500可以具有附加的特征或功能。例如,移動計算設備500還可以包括附加的數(shù)據(jù)儲存設備(可移動的和/或不可移動的)(諸如,磁盤、光盤或磁帶)。這種附加的儲存在圖5B中由非易失性存儲區(qū)域568圖示。
由移動計算設備500產(chǎn)生或采集并且經(jīng)由系統(tǒng)502儲存的數(shù)據(jù)/信息可以如上文所述被局部地儲存在移動通信設備500上,或者數(shù)據(jù)可以被儲存在任何數(shù)量的儲存介質(zhì)上,其可以經(jīng)由無線電572或經(jīng)由移動計算設備500與關聯(lián)于移動計算設備500的單獨計算設備(例如,在諸如因特網(wǎng)之類的分布式計算網(wǎng)絡中的服務器計算機)之間的有線連接而被設備訪問。應該被理解的是這樣的數(shù)據(jù)/信息可以經(jīng)由移動計算設備500經(jīng)由無線電接收裝置572或經(jīng)由分布式計算網(wǎng)絡而被訪問。相似地,根據(jù)已知的數(shù)據(jù)/信息傳遞和儲存手段(包括電子郵件和合作的數(shù)據(jù)/信息分享系統(tǒng)),這樣的數(shù)據(jù)/信息可以容易地在計算設備之間被傳送以用于儲存和使用。
圖6圖示了如上文所述的用于自動地識別來自數(shù)據(jù)集的見解并且呈現(xiàn)以重要性排名的見解的系統(tǒng)的架構(gòu)的一個實施例。關聯(lián)于辨識器110、見解引擎120、排名系統(tǒng)130、見解呈現(xiàn)器140或應用150而發(fā)展、交互、或編輯的內(nèi)容可以被儲存在不同的通信信道或其他儲存類型中。例如,各種文件可以使用目錄服務622、網(wǎng)絡門戶624、郵箱服務626、即時消息儲存628或社交網(wǎng)絡網(wǎng)址630而被儲存。如本文中所述的,辨識器110、見解引擎120、排名系統(tǒng)130、見解呈現(xiàn)器140或應用150可以使用任何這些種類的系統(tǒng)之類的以用于自動地識別來自數(shù)據(jù)集的見解并且呈現(xiàn)以重要性排名的見解。服務器130可以向客戶125提供辨識器110、見解引擎120、排名系統(tǒng)130、見解呈現(xiàn)器140或應用150。作為一個示例,服務器130可以是在網(wǎng)絡上提供辨識器110、見解引擎120、排名系統(tǒng)130、見解呈現(xiàn)器140或應用150的網(wǎng)絡服務器。服務器130可以在網(wǎng)絡上向客戶經(jīng)過網(wǎng)絡140提供辨識器110、見解引擎120、排名系統(tǒng)130、見解呈現(xiàn)器140或應用150。通過示例,客戶計算設備125可以在個人計算機605A、平板計算設備605B和/或移動計算設備605C(例如,智能電話)或其他計算設備中被實現(xiàn)和實施。客戶計算設備的任何這些實施例可以從儲存616獲得內(nèi)容。
例如參照根據(jù)本發(fā)明實施例的方法、系統(tǒng)以及計算機程序產(chǎn)品的框圖和/或操作圖示,本發(fā)明的實施例在以上被描述。框中注釋的功能/動作可以按照任意流程圖中所示以外的順序發(fā)生。例如,連續(xù)示出的兩個框可以基本上同時被執(zhí)行,或者框可以有時以相反的順序被執(zhí)行,這取決于涉及到的功能/動作。
在本申請中提供的一個或多個實施例的描述和圖示不是旨在限制或限定以任意方法主張的發(fā)明的范圍。在本申請中提供的實施例、示例和細節(jié)被認為充分傳達占有并且使其他人可以制造和使用主張的發(fā)明的最佳模式。主張的發(fā)明不應該理解為被限制在申請中提供的任意實施例、示例、或細節(jié)。不管是否組合或單獨地示出以及描述,不同的特征(結(jié)構(gòu)上的和方法上的)旨在被選擇地包括或忽略來產(chǎn)生具有特別的特征集的實施例。已經(jīng)被提供以本申請的描述和圖示,本領域技術人員可以預想變化、修改以及落在本申請中呈現(xiàn)的通用發(fā)明概念的更廣的方面的精神中的其他的實施例,其不脫離主張發(fā)明的更廣的范圍。