知識(shí)捕獲和發(fā)現(xiàn)系統(tǒng)的制作方法
【專利說(shuō)明】
[0001] 相關(guān)申請(qǐng)的交叉引用 本申請(qǐng)要求在2013年3月15日提交并且標(biāo)題為"EnterpriseLevelApplication SoftwareDevelopmentSystem"的美國(guó)臨時(shí)專利申請(qǐng)序列號(hào)61/787, 177的優(yōu)先權(quán),該專利 申請(qǐng)的教導(dǎo)通過(guò)該引用并入本文中。
技術(shù)領(lǐng)域
[0002] 本公開大體涉及企業(yè)信息管理,并且具體地涉及作為企業(yè)信息管理的一部分或針 對(duì)企業(yè)信息管理的補(bǔ)充的、用于知識(shí)的捕獲和發(fā)現(xiàn)的系統(tǒng)。
【背景技術(shù)】
[0003] 諸如此處共同地稱為企業(yè)的商業(yè)或其它組織之類的各種類型的實(shí)體通常被創(chuàng)建、 組織和操作以便實(shí)現(xiàn)特定目標(biāo),例如向相關(guān)消費(fèi)者提供物品和/或服務(wù)。為了實(shí)現(xiàn)這些目 標(biāo),不同規(guī)模的許多企業(yè)共享參與眾多過(guò)程中以及在執(zhí)行這樣的過(guò)程時(shí)獲得與此相關(guān)的大 量數(shù)據(jù)的特性。隨著企業(yè)變得越來(lái)越大和/或設(shè)法實(shí)現(xiàn)前所未有地更困難和復(fù)雜的目標(biāo), 得到為了恰當(dāng)?shù)毓芾磉@樣的過(guò)程所牽涉的過(guò)程的真實(shí)理解以及實(shí)現(xiàn)它們所要求的資源的 能力常常變?yōu)榧值膯?wèn)題。盡管可能存在可以用于開發(fā)這樣的洞察(insight)的大量數(shù)據(jù), 但是這樣的數(shù)據(jù)的絕對(duì)的數(shù)量、復(fù)雜性和可變性使得難以利用該潛在資源。
[0004] 當(dāng)前存在各種技術(shù)以解決該問(wèn)題的部分。例如,為了高效地存儲(chǔ)并提供對(duì)數(shù)據(jù)的 訪問(wèn),在過(guò)去四十年內(nèi)已經(jīng)開發(fā)了眾多數(shù)據(jù)庫(kù)技術(shù),其中每一種可以具有特定的優(yōu)點(diǎn)和缺 點(diǎn)。附加地,甚至在這樣的技術(shù)的情況下,為決策做出者提供對(duì)該數(shù)據(jù)的訪問(wèn)要求專門受訓(xùn) 的技術(shù)人員的支持,諸如軟件開發(fā)和/或數(shù)據(jù)庫(kù)管理專家。這導(dǎo)致大開銷以及未滿足數(shù)據(jù) 消費(fèi)者的需要的非常真實(shí)的可能性。又進(jìn)一步地,即便技術(shù)對(duì)于來(lái)自這樣的存儲(chǔ)數(shù)據(jù)的遞 送報(bào)告是已知的,開發(fā)關(guān)于這樣的數(shù)據(jù)所表示的過(guò)程的理解和洞察的能力也保持為困難的 任務(wù)。
[0005] 因此,將有利的是,提供一種準(zhǔn)許捕獲企業(yè)數(shù)據(jù)并且在此之后以促進(jìn)對(duì)其訪問(wèn)的 方式使得可用的系統(tǒng),使得甚至具有很少企業(yè)數(shù)據(jù)管理經(jīng)驗(yàn)或沒(méi)有這種經(jīng)驗(yàn)的人員也可以 能夠開發(fā)之前實(shí)現(xiàn)起來(lái)過(guò)分昂貴(如果不是不可能的話)的洞察。
【發(fā)明內(nèi)容】
[0006] 本公開描述一種克服現(xiàn)有技術(shù)解決方案的缺點(diǎn)的用于知識(shí)捕獲和發(fā)現(xiàn)的系統(tǒng)。具 體地,該系統(tǒng)包括知識(shí)庫(kù),其中所有輸入數(shù)據(jù)被存儲(chǔ)為對(duì)象和對(duì)象之間的關(guān)系。附加地,輸 入數(shù)據(jù)可以根據(jù)多于一種存儲(chǔ)格式進(jìn)行存儲(chǔ)。該系統(tǒng)中的至少兩個(gè)分級(jí)用戶接口提供輸入 機(jī)構(gòu)以獲得輸入數(shù)據(jù)、涉及輸入數(shù)據(jù)的對(duì)象信息和涉及輸入數(shù)據(jù)的關(guān)系信息,由此準(zhǔn)許開 發(fā)最終用戶應(yīng)用。附加地,操作連接到知識(shí)庫(kù)和至少兩個(gè)分級(jí)用戶接口的控制器從至少兩 個(gè)分級(jí)用戶接口接收輸入數(shù)據(jù)、對(duì)象信息和關(guān)系信息,并且基于對(duì)象信息和關(guān)系信息而使 輸入數(shù)據(jù)作為對(duì)象存儲(chǔ)在知識(shí)庫(kù)中。
【附圖說(shuō)明】
[0007] 在隨附權(quán)利要求中具體地闡述本公開中所描述的特征。這些特征將從結(jié)合附圖進(jìn) 行的以下詳細(xì)描述的考慮變得顯而易見?,F(xiàn)在僅通過(guò)示例的方式參照附圖描述一個(gè)或多個(gè) 實(shí)施例,其中相似附圖標(biāo)記表示相似元件,并且其中: 圖1是可以用于實(shí)現(xiàn)本公開的各方面的示例性處理設(shè)備的框圖; 圖2是圖示了可以用于實(shí)現(xiàn)本公開的特征的各聯(lián)網(wǎng)硬件組件的框圖; 圖3是圖示了依照本公開的各實(shí)施例的功能組件的框圖;并且 圖4是基于RDF和相關(guān)數(shù)據(jù)的數(shù)據(jù)轉(zhuǎn)換處理的示例性實(shí)現(xiàn)的框圖。
【具體實(shí)施方式】
[0008] 圖1圖示了可以用于實(shí)現(xiàn)本公開的教導(dǎo)的代表性處理設(shè)備100。處理設(shè)備100可 以用于實(shí)現(xiàn)例如以下更詳細(xì)描述的系統(tǒng)200的一個(gè)或多個(gè)組件。例如,處理設(shè)備100可以 包括工作站計(jì)算機(jī)或服務(wù)器計(jì)算機(jī)。不管怎樣,設(shè)備100包括耦合到存儲(chǔ)組件104的處理器 102。存儲(chǔ)組件104繼而包括存儲(chǔ)的可執(zhí)行指令116和數(shù)據(jù)118。在實(shí)施例中,處理器102 可以包括能夠執(zhí)行存儲(chǔ)的指令116并且對(duì)存儲(chǔ)的數(shù)據(jù)118操作的微處理器、微控制器、數(shù)字 信號(hào)處理器、協(xié)處理器等中的一個(gè)或多個(gè)或者其組合。同樣地,存儲(chǔ)組件104可以包括一個(gè) 或多個(gè)設(shè)備,諸如易失性或非易失性存儲(chǔ)器,包括但不限于隨機(jī)存取存儲(chǔ)器(RAM)、只讀存 儲(chǔ)器(ROM)或其它非暫時(shí)性機(jī)器可讀設(shè)備。又進(jìn)一步地,存儲(chǔ)組件104可以以各種形式來(lái) 體現(xiàn),諸如硬盤驅(qū)動(dòng)器、光盤驅(qū)動(dòng)器、軟盤驅(qū)動(dòng)器等。圖1中所圖示的類型的處理器和存儲(chǔ) 布置對(duì)本領(lǐng)域普通技術(shù)人員是公知的。在一個(gè)實(shí)施例中,本文描述的處理技術(shù)被實(shí)現(xiàn)為一 個(gè)或多個(gè)處理設(shè)備100的存儲(chǔ)組件104內(nèi)的可執(zhí)行指令和數(shù)據(jù)的組合。
[0009] 如所示出的,設(shè)備100可以包括與處理器102通信的一個(gè)或多個(gè)用戶輸入設(shè)備 106、顯示器108、外圍接口 110、其它輸出設(shè)備112和網(wǎng)絡(luò)接口 114。盡管處理器102和各 其它設(shè)備/顯示器/接口 106-114之間的連接被圖示為分離的直接連接,但是本領(lǐng)域普通 技術(shù)人員將認(rèn)識(shí)到,在實(shí)踐中,一個(gè)或多個(gè)總線子系統(tǒng)(未示出)可以用作用于如所意圖的 那樣使處理設(shè)備100的各組件彼此通信的機(jī)構(gòu)。用戶輸入設(shè)備106可以包括用于向處理器 102提供用戶輸入的任何機(jī)構(gòu)。例如,用戶輸入設(shè)備106可以包括鍵盤、鼠標(biāo)、觸摸屏、麥克 風(fēng)和適合的語(yǔ)音識(shí)別應(yīng)用或任何其它構(gòu)件,由此設(shè)備100的用戶可以向處理器102提供輸 入數(shù)據(jù)。顯示器108可以包括任何常規(guī)顯示機(jī)構(gòu),諸如陰極射線管(CRT)、平坦面板顯示器 或本領(lǐng)域普通技術(shù)人員已知的任何其它顯示機(jī)構(gòu)。在實(shí)施例中,顯示器108與由處理器102 所執(zhí)行的適合的存儲(chǔ)指令116結(jié)合可以用于實(shí)現(xiàn)如下文所描述的圖形用戶接口。以該方式 的圖形用戶接口的實(shí)現(xiàn)對(duì)于本領(lǐng)域普通技術(shù)人員是公知的。外圍接口 110可以包括用于與 各種外圍設(shè)備通信所必要的硬件、固件和/或軟件,所述各種外圍設(shè)備諸如媒體驅(qū)動(dòng)器(例 如磁盤或光盤驅(qū)動(dòng)器)、其它處理設(shè)備或與本技術(shù)結(jié)合使用的任何其它輸入源。同樣地,(多 個(gè))其它輸出設(shè)備112可以可選地包括能夠向設(shè)備100的用戶提供信息的類似媒體驅(qū)動(dòng)器 機(jī)構(gòu)、其它處理設(shè)備或其它輸出目的地,諸如揚(yáng)聲器、LED、打印機(jī)、傳真機(jī)、觸覺(jué)輸出等。最 后,網(wǎng)絡(luò)接口 114可以包括允許處理器102經(jīng)由如本領(lǐng)域中所已知的有線或無(wú)線網(wǎng)絡(luò)(不管 是局域的還是廣域的,專用的還是公用的)與其它設(shè)備通信的硬件、固件和/或軟件。例如, 這樣的網(wǎng)絡(luò)可以包括萬(wàn)維網(wǎng)或互聯(lián)網(wǎng)、或者專用企業(yè)網(wǎng)絡(luò),如本領(lǐng)域中所已知的。
[0010] 盡管設(shè)備100已經(jīng)被描述為用于實(shí)現(xiàn)本文描述的技術(shù)的一種形式,但是本領(lǐng)域普 通技術(shù)人員將認(rèn)識(shí)到,可以采用其它功能等同的技術(shù)。例如,如本領(lǐng)域中所已知的,經(jīng)由由 一個(gè)或多個(gè)處理器所執(zhí)行的可執(zhí)行指令而實(shí)現(xiàn)的一些或全部功能也可以使用諸如專用集 成電路(ASIC)、可編程門陣列、狀態(tài)機(jī)等之類的固件和/或硬件設(shè)備來(lái)實(shí)現(xiàn)。此外,設(shè)備100 的其它實(shí)現(xiàn)可以包括比所圖示的那些更多或更少數(shù)量的組件。再次地,本領(lǐng)域普通技術(shù)人 員將認(rèn)識(shí)到可以使用的為數(shù)眾多的變化是該方式。又進(jìn)一步地,盡管在圖1中圖示了單個(gè) 處理設(shè)備100,但是要理解到,這樣的處理設(shè)備的組合可以被配置成結(jié)合地操作(例如使用 已知聯(lián)網(wǎng)技術(shù))以實(shí)現(xiàn)本公開的教導(dǎo)。由于處理設(shè)備和網(wǎng)絡(luò)的不斷改變性質(zhì),圖1中所描繪 的處理設(shè)備100的描述僅意圖為代表本領(lǐng)域普通技術(shù)人員所已知的大量的處理設(shè)備的特 定示例。
[0011] 現(xiàn)在參照?qǐng)D2,示出系統(tǒng)200,其圖示了可以用于實(shí)現(xiàn)本公開的教導(dǎo)的許多硬件組 件。如所示出的,系統(tǒng)200包括控制器202,其可以包括一個(gè)或多個(gè)服務(wù)器計(jì)算機(jī)??刂破?202直接地或者經(jīng)由一個(gè)或多個(gè)網(wǎng)絡(luò)204與各種其它組件通信。網(wǎng)絡(luò)204可以包括如本領(lǐng) 域中所已知的無(wú)線或有線網(wǎng)絡(luò)的任何期望的組合,不管是局域的還是廣域的,專用的還是 公用的。如上文指出的,這樣的網(wǎng)絡(luò)可以包括萬(wàn)維網(wǎng)或互聯(lián)網(wǎng)或?qū)S闷髽I(yè)網(wǎng)絡(luò),如本領(lǐng)域中 所已知的。
[0012] 可以包括諸如桌上型或膝上型計(jì)算機(jī)或移動(dòng)計(jì)算設(shè)備之類的處理設(shè)備的工作站 206可以經(jīng)由網(wǎng)絡(luò)204與控制器202通信。在實(shí)施例中,工作站206可以實(shí)現(xiàn)能夠提供圖形 用戶接口的web(網(wǎng)絡(luò))瀏覽器應(yīng)用或其它應(yīng)用,如本領(lǐng)域中所已知的。使用這樣的應(yīng)用, 工作站206還可以實(shí)現(xiàn)若干分級(jí)用戶接口中的一個(gè),如下文更詳細(xì)描述的。附加地,工作站 206可以操作成接收和執(zhí)行基于這樣的分級(jí)用戶接口所開發(fā)的一個(gè)或多個(gè)最終用戶應(yīng)用。
[0013] 如進(jìn)一步示出的,一個(gè)或多個(gè)分級(jí)用戶接口服務(wù)器208可以與控制器202通信,并 且經(jīng)由網(wǎng)絡(luò)204與工作站206通信。如本領(lǐng)域中所已知的,一個(gè)或多個(gè)分級(jí)用戶接口服務(wù) 器208可以包括應(yīng)用和web服務(wù)器的組合,其中web服務(wù)器服務(wù)于來(lái)自用戶的請(qǐng)求以使用 與web服務(wù)器通信的應(yīng)用服務(wù)器所提供的應(yīng)用資源來(lái)執(zhí)行動(dòng)作。具體地,web服務(wù)器將這 樣的請(qǐng)求中繼給應(yīng)用服務(wù)器,其采取指定動(dòng)作并且將該動(dòng)作的結(jié)果返回給web服務(wù)器,其 繼而將結(jié)果中繼給用戶工作站206。應(yīng)當(dāng)指出的是,盡管這樣的web服務(wù)器可以被視為硬件 組件(如本文所描述的任何服務(wù)器那樣),但是這樣的web服務(wù)器也可以是在計(jì)算機(jī)系統(tǒng)上 操作的軟件模塊。
[0014] 不管怎樣,依照這樣的技術(shù),分級(jí)用戶接口服務(wù)器208可以提供至少一個(gè)主要開 發(fā)者接口和/或次要開發(fā)者接口,如下文更詳細(xì)描述的。例如,分級(jí)用戶接口服務(wù)器208可 以實(shí)現(xiàn)web頁(yè)面等,其顯示在工作站206上以實(shí)現(xiàn)一個(gè)或多個(gè)分級(jí)用戶接口。這些分級(jí)接 口繼而可以在一個(gè)實(shí)施例中用于最終開發(fā)應(yīng)用元文件。如本文中所使用的,應(yīng)用元文件可 以包括足以生成可執(zhí)行源代碼的信息,諸如如本領(lǐng)域所已知且在下文描述的用戶接口標(biāo)記 (markup)或功能標(biāo)記。(多個(gè))最終用戶應(yīng)用服務(wù)器212可以包括web和應(yīng)用服務(wù)器(如上 文描述的),將由代碼生成服務(wù)器210所生成的最終用戶應(yīng)用提供給請(qǐng)求用戶的功能。
[0015] 如圖2中進(jìn)一步示出的,控制器202與共同地建立數(shù)據(jù)庫(kù)聯(lián)合體(complex)219的 多個(gè)數(shù)據(jù)庫(kù)服務(wù)器214-218通信。如本文所使用的,數(shù)據(jù)庫(kù)可以包括實(shí)現(xiàn)已知數(shù)據(jù)庫(kù)存儲(chǔ) 格式的任何適合存儲(chǔ)設(shè)備,包括但不限于本文中指出的各種數(shù)據(jù)庫(kù)存儲(chǔ)格式。例如,可以提 供實(shí)現(xiàn)第一存儲(chǔ)格式或模式的一個(gè)或多個(gè)第一數(shù)據(jù)庫(kù)服務(wù)器214、實(shí)現(xiàn)第二存儲(chǔ)格式或模 式的一個(gè)或多個(gè)第二數(shù)據(jù)庫(kù)服務(wù)器216、以及這樣往上直到實(shí)現(xiàn)第N存儲(chǔ)格式或模式的一 個(gè)或多個(gè)第N數(shù)據(jù)庫(kù)服務(wù)器218。例如,在一個(gè)實(shí)施例中,第一數(shù)據(jù)庫(kù)服務(wù)器214可以實(shí)現(xiàn) 所謂的三元組儲(chǔ)存(triplestore)數(shù)據(jù)庫(kù),而第二數(shù)據(jù)庫(kù)服務(wù)器216可以實(shí)現(xiàn)相關(guān)數(shù)據(jù)庫(kù), 并且第N數(shù)據(jù)庫(kù)服務(wù)器218可以實(shí)現(xiàn)又另一數(shù)據(jù)庫(kù)存儲(chǔ)格式,諸如但不限于列式數(shù)據(jù)庫(kù)、圖 形數(shù)據(jù)庫(kù)、關(guān)鍵值數(shù)據(jù)庫(kù)、文檔數(shù)據(jù)庫(kù)和文件存儲(chǔ)數(shù)據(jù)庫(kù)。如本領(lǐng)域普通技術(shù)人員將領(lǐng)會(huì)到 的,可以使用又其它數(shù)據(jù)庫(kù)存儲(chǔ)格式,并且本公開不在這方面受限。
[0016]以此方式配置,每一種數(shù)據(jù)庫(kù)存儲(chǔ)格式的相對(duì)優(yōu)點(diǎn)是可用的,并且如下文更詳細(xì) 描述的控制器202有效地充當(dāng)抽象層以保護(hù)最終用戶免于不必精通每一種數(shù)據(jù)庫(kù)存儲(chǔ)格 式的復(fù)雜性。在下文同樣描述的一個(gè)實(shí)施例中,控制器202操作成如所需要地發(fā)起從一種 存儲(chǔ)格式向另一種的數(shù)據(jù)的轉(zhuǎn)換以改進(jìn)總體性能。在另一實(shí)施例中,多種數(shù)據(jù)庫(kù)存儲(chǔ)格式 的存在準(zhǔn)許用戶具體地限定條件,從而引起數(shù)據(jù)的轉(zhuǎn)換。例如,在所謂的CAP(-致性、可用 性、分區(qū)容忍性)定理之下,斷言到,利用分布式數(shù)據(jù)庫(kù),人們可能僅具有三個(gè)屬性之中的兩 個(gè):一致性(所有節(jié)點(diǎn)具有最新且相同的信息)、可用性(正常運(yùn)行時(shí)間/采取請(qǐng)求)和分區(qū)容 忍性(處理斷開狀態(tài))。基于該目標(biāo),用戶可以指定針對(duì)各種數(shù)據(jù)庫(kù)之間的數(shù)據(jù)轉(zhuǎn)換的要求 以使這些屬性中的每一個(gè)或其任何組合優(yōu)化。
[0017]如進(jìn)一步示出的,控制器202可以經(jīng)由網(wǎng)絡(luò)204與一個(gè)或多個(gè)自然語(yǔ)言處理(NLP) 服務(wù)器220和一個(gè)或多個(gè)數(shù)據(jù)挖掘服務(wù)器222通信。如下文更詳細(xì)描述的,NLP服務(wù)器220 操作成不僅在訪問(wèn)數(shù)據(jù)庫(kù)聯(lián)合體219內(nèi)的數(shù)據(jù)時(shí)而且在開發(fā)最終用戶應(yīng)用時(shí)促進(jìn)自然語(yǔ) 言查詢的使用。與NLP服務(wù)器220結(jié)合地工作,數(shù)據(jù)挖掘服務(wù)器222基于存儲(chǔ)在數(shù)據(jù)庫(kù)聯(lián) 合體219中的數(shù)據(jù)而實(shí)現(xiàn)各種數(shù)據(jù)挖掘任務(wù),諸如根本原因分析、分類、集群、相關(guān)聯(lián)規(guī)則 發(fā)現(xiàn)和/或回歸分析。
[0018]現(xiàn)在參照?qǐng)D3,圖示了根據(jù)本文提供的各種功能的系統(tǒng)300。要指出的是,圖3中 所圖示的每一個(gè)組件可以使用如上文描述的一個(gè)或多個(gè)處理設(shè)備來(lái)實(shí)現(xiàn),從而實(shí)現(xiàn)本文描 述的功能。在系統(tǒng)300內(nèi),控制器302與在所圖示的示例中包括相關(guān)數(shù)據(jù)庫(kù)304、列式數(shù)據(jù) 庫(kù)306和三元組儲(chǔ)存數(shù)據(jù)庫(kù)308的多個(gè)數(shù)據(jù)庫(kù)304-308通信。如本領(lǐng)域中所已知的,每一 個(gè)數(shù)據(jù)庫(kù)304-308可以(并且通常將)包括其自身的促進(jìn)與數(shù)據(jù)庫(kù)的交互的數(shù)據(jù)庫(kù)管理系統(tǒng) (DBMS)。如所示出的,控制器302通過(guò)由對(duì)應(yīng)DBMS實(shí)現(xiàn)的應(yīng)用編程接口(API) 304a-308a 與各數(shù)據(jù)庫(kù)304-308通信。這樣的API可以由制造商專有驅(qū)動(dòng)器或?qū)S斜硎鲂誀顟B(tài)轉(zhuǎn)移 (REST)接口體現(xiàn)。
[0019] 在實(shí)施例中,由系統(tǒng)200、300處理的每一個(gè)