專利名稱:基于Web的數(shù)據(jù)可視化系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息可視化技術(shù),尤其是一種數(shù)據(jù)可視化系統(tǒng)。
背景技術(shù):
在當(dāng)前數(shù)據(jù)爆炸性增長的時代,大量的商業(yè)數(shù)據(jù)被收集并存放在磁盤中,但目前還沒有強有力的工具將數(shù)據(jù)轉(zhuǎn)換成有用的信息——知識。對這些數(shù)據(jù)進行分析的需求可描述為“數(shù)據(jù)豐富,但信息貧乏”,因此,如何從堆積在“數(shù)據(jù)墳?zāi)埂敝袩o法被利用的數(shù)據(jù)中挖掘知識,為決策者提供依據(jù),是當(dāng)前迫切需要解決的問題。對于數(shù)據(jù)泛濫,傳統(tǒng)的數(shù)據(jù)分析和數(shù)據(jù)挖掘工具對數(shù)據(jù)進行分析處理已顯得捉襟見肘,于是并需要更加高效的方式來對數(shù)據(jù)進行可視分析。因為人類接收的信息90%來自圖像,而圖形可視化分析,正是利用人類自身強大的視覺感知能力,在人和信息之間架起了一座橋梁,為日益嚴重的“信息迷航”問題提供了一種可行的解決方法。信息可視化是利用計算機圖形學(xué)和圖像處理技術(shù)將抽象數(shù)據(jù)以可視化的形式展示出來,輔助以相應(yīng)的交互技術(shù),最終達到增強用戶認知的目的。面對日益積累起來的信息數(shù)據(jù),通過資源的有效交換和共享,挖掘其中隱藏著的大量潛在、尚且未知的知識,已經(jīng)成為打破現(xiàn)有圖形可視分析研究局限的迫切需要,也是國際上新興的熱點研究趨勢之一。由于地理環(huán)境等因素的局限,海量的信息數(shù)據(jù)往往分散在不同的用戶和機構(gòu)中,不同的用戶和機構(gòu)各自有著不同的研究目標和功能,彼此之間的信息交流十分有限,形成了一個個數(shù)據(jù)孤島。因此,打破數(shù)據(jù)孤島間的壁壘,實現(xiàn)用戶之間的良性協(xié)同互動、共享可視化服務(wù)結(jié)果,已經(jīng)成為一項亟需解決的研究難題。當(dāng)前使用在線可視化方式的平臺有來自Swivel公司提供的Swivel商業(yè)可視化分析平臺,IBM研究院Visual Communication Lab開發(fā)的ManyEyes可視化平臺,Tableau 公司開發(fā)的Tableau Public軟件以及美國Google公司開發(fā)的Google Viz平臺等。Swivel是最早進行商業(yè)化嘗試的可視化平臺之一,其提供了非常友好的界面供用戶上傳其數(shù)據(jù),包含了諸如折線圖,柱形圖,餅圖等可視化方式,同時可以將可視化的結(jié)果制作成自定義的報表,并分享給特定的群體或者公眾。除此之外,Swivel上可視化的構(gòu)建采用了 HTML, JavaScript等方式,因此就可以跨平臺地使用Swivel。由于Swivel是商業(yè)化的可視化平臺,對于普通用戶的使用就有所限制,而且Swivel提供的可視化工具比較傳統(tǒng),缺乏諸如顯示層次數(shù)據(jù)的TreeMaps等新穎的可視化方式。ManyEyes為IBM研究院研發(fā)的免費在線可視化服務(wù),ManyEyes提供了諸如 TreeMaps, Graph等數(shù)十種常用的可視化技術(shù),允許整個社區(qū)用戶和機構(gòu)上傳自己的數(shù)據(jù)、 可視化數(shù)據(jù)、分享可視化結(jié)果、與其他用戶討論數(shù)據(jù)挖掘中的新發(fā)現(xiàn)、并對不同的可視化進行評分和評論。由于ManyEyes是基于Java Applet來實現(xiàn)各種數(shù)據(jù)的可視化,因此對普通群體客戶端的用戶體驗有一定影響,而且對處理器和內(nèi)存的消耗比較大。Tableau Public為Tableau公司提供的免費可視分析的客戶端軟件,通過非常簡單易用的拖拽界面來構(gòu)建用戶所需的可視化結(jié)果,除此之外,Tableau Public還可以針對用戶數(shù)據(jù),智能地提供最合適的可視化方式供用戶查看。通過Tableau Public,用戶可以上傳自己的可視化結(jié)果到Tableau服務(wù)器上與他人共享。但是在使用Tableau Public 過程中,用戶用于可視化數(shù)據(jù)都是公開的,而且可視化的結(jié)果只能保存在網(wǎng)絡(luò)上;同時由于 Tableau Public是本地運行的客戶端軟件,應(yīng)此在適用范圍上比較窄。Google Viz API是Google公司研發(fā)的用于公共數(shù)據(jù)挖掘和可視化的應(yīng)用程序接口,通過這一接口,用戶就可以訪問本地或者遠程的表格形式的結(jié)構(gòu)化數(shù)據(jù),并實現(xiàn)高自由度的個人定制可視化,但是Google Viz并不是面向普通用戶,而是擁有計算機編程知識的專業(yè)用戶來進行可視分析的。
發(fā)明內(nèi)容
為了克服已有現(xiàn)有的可視化系統(tǒng)的對客戶端硬件要求較高、客戶使用成本較高、 適用性較差的不足,本發(fā)明提供一種對客戶端硬件要求較低、降低客戶使用成本、適用性較好的基于Web的數(shù)據(jù)可視化系統(tǒng)。本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是一種基于Web的數(shù)據(jù)可視化系統(tǒng),所述數(shù)據(jù)可視化系統(tǒng)包括Web服務(wù)平臺和客戶端,所述Web服務(wù)平臺包括Web瀏覽器、Web服務(wù)器和數(shù)據(jù)庫服務(wù)器,所述Web服務(wù)器接收客戶端瀏覽器的數(shù)據(jù)請求,負責(zé)數(shù)據(jù)計算工作并將生成的處理結(jié)果轉(zhuǎn)發(fā)到客戶端瀏覽器,所述Web服務(wù)器內(nèi)設(shè)置地圖可視化組件、樹圖可視化組件、平行坐標可視化組件、時間流圖可視化組件、散點圖可視化組件、柱狀圖可視化組件、網(wǎng)狀圖可視化組件、餅狀圖可視化組件、 折線圖可視化組件和標簽云組件,所述Web服務(wù)器還包括用以根據(jù)預(yù)先設(shè)置的規(guī)則配合使用兩種以上可視化組件共同展示數(shù)據(jù)的可視化組件協(xié)同模塊。進一步,所述的Web服務(wù)器內(nèi)還設(shè)置氣泡圖可視化組件。再進一步,所述Web服務(wù)器還包括用以允許用戶間的數(shù)據(jù)數(shù)據(jù)共享,提供API和外鏈供其他網(wǎng)站分享可視結(jié)果的社會協(xié)同可視模塊。更進一步,所述Web服務(wù)器還包括用于對客戶端的用戶數(shù)據(jù)進行分級權(quán)限管理的數(shù)據(jù)安全管理模塊。所述數(shù)據(jù)庫服務(wù)器采用云平臺數(shù)據(jù)管理模式,分布式存儲用戶數(shù)據(jù)。本發(fā)明的技術(shù)構(gòu)思為基于互聯(lián)網(wǎng)Web服務(wù)平臺的信息可視化方法是可視化技術(shù)的新發(fā)展,其將信息可視化技術(shù)與Web服務(wù)相結(jié)合,為用戶提供在線可視化服務(wù),將用戶數(shù)據(jù)項轉(zhuǎn)換為圖形圖像的形式,并從中發(fā)現(xiàn)數(shù)據(jù)內(nèi)在的聯(lián)系和發(fā)展規(guī)律,互聯(lián)網(wǎng)平臺能很好地解決可視數(shù)據(jù)的協(xié)同和共享等問題,降低數(shù)據(jù)計算成本,實現(xiàn)社會協(xié)同可視化。Web服務(wù)具有成本低、高可擴展性、可移植性高等特點,用戶只需一臺可聯(lián)網(wǎng)的個人終端并可隨時隨地使用Web服務(wù),基于Web平臺的可視化技術(shù)將成為信息可視化發(fā)展的主流趨勢之一。本發(fā)明旨在通過Web服務(wù)平臺實現(xiàn)一個社會化數(shù)據(jù)存儲、加工、共享、展示,最終實現(xiàn)有效集成的圖形可視分析系統(tǒng),它隨著計算機網(wǎng)絡(luò)的覆蓋、信息數(shù)據(jù)的豐富和可視化技術(shù)的更新而不斷發(fā)展和成長。本發(fā)明涉及到大量的可視化技術(shù),如傳統(tǒng)的經(jīng)典的折線圖、餅圖、散點圖、網(wǎng)狀圖、 地圖等可視化方式,以及較新穎的平行坐標、樹圖、時間流圖等可視化方式,同時可以根據(jù)用戶的需求與數(shù)據(jù)的特點不斷添加新的可視化方式。本發(fā)明的有益效果主要表現(xiàn)在
I)本發(fā)明將信息可視化技術(shù)與Web服務(wù)平臺相結(jié)合,客戶僅需一個可以連入因特網(wǎng)的瀏覽器并可不受時間和地域的限制使用可視服務(wù),無需安裝軟件客戶端,對客戶端硬件要求低,降低客戶使用可視服務(wù)的成本。2)本發(fā)明系統(tǒng)實現(xiàn)了多種可視化組件,如傳統(tǒng)的散點圖、柱狀圖、網(wǎng)狀圖、餅圖等, 以及新穎的樹形圖、平行坐標、時間流圖等,豐富了用戶數(shù)據(jù)的展現(xiàn)方式,用戶可通過網(wǎng)站提供的可視分析服務(wù)對數(shù)據(jù)集進行合理地挖掘。3)本發(fā)明中用戶可根據(jù)自身需求定制網(wǎng)站可視化服務(wù),通過拖拽組件以增加或刪除某一可視服務(wù)組件,使得可視服務(wù)在為用戶服務(wù)這一方面更具針對性,用戶對數(shù)據(jù)的展現(xiàn)方式有更大的自由性。4)本發(fā)明系統(tǒng)提供了多種組件協(xié)同交互的規(guī)則,組件之間以主輔關(guān)系實現(xiàn)聯(lián)動展示,豐富了數(shù)據(jù)的展現(xiàn)形式,有利于從多角度、多方面觀察數(shù)據(jù)特征。用戶可以查看其它用戶的可視化結(jié)果、引用其他用戶的數(shù)據(jù)進行可視化以及對可視化結(jié)果的外鏈等,提供站外使用信息可視化服務(wù)的API。5)本發(fā)明將數(shù)據(jù)可視化的渲染和展示分割開來,渲染過程交給Web服務(wù)平臺處理,展示及交互過程交給客戶端處理,對性能有較大的提高。6)本發(fā)明對用戶數(shù)據(jù)進行隱私安全管理,合理實現(xiàn)用戶權(quán)限,系統(tǒng)中的公共數(shù)據(jù)可以被其他用戶瀏覽并下載,對用戶在上傳數(shù)據(jù)時設(shè)置的私有數(shù)據(jù),僅開放部分權(quán)限以保障數(shù)據(jù)的安全性。
圖I是基于Web的數(shù)據(jù)可視化系統(tǒng)的架構(gòu)圖。圖2是兩種顏色的顏色聚合示意圖。圖3是平行坐標可視化組件的示意圖。
具體實施例方式下面結(jié)合附圖對本發(fā)明作進一步描述。參照圖I 圖3,一種基于Web的數(shù)據(jù)可視化系統(tǒng),本系統(tǒng)可以用于各種類型數(shù)據(jù)的可視分析,包括對公眾數(shù)據(jù)和相應(yīng)機構(gòu)的私有數(shù)據(jù)。本發(fā)明最終結(jié)果以服務(wù)的形式展現(xiàn)給用戶,用戶只需要一臺具備基本計算能力的終端設(shè)備以及一個有效的互聯(lián)網(wǎng)連接,就可以隨時隨地訪問使用該可視化服務(wù),通過瀏覽器來交互并得到形式多樣的可視化結(jié)果,通過瀏覽其他用戶的可視化結(jié)果來解決可視化協(xié)同和共享的問題,實現(xiàn)社會協(xié)同可視化。本發(fā)明系統(tǒng)使用的Web服務(wù)后臺服務(wù)器接收客戶端瀏覽器的數(shù)據(jù)請求,數(shù)據(jù)處理的細節(jié)對客戶端完全透明,客戶端只關(guān)心數(shù)據(jù)呈現(xiàn)結(jié)果。后臺服務(wù)器負責(zé)數(shù)據(jù)計算工作并將生成的處理結(jié)果轉(zhuǎn)發(fā)到客服端瀏覽器,在本發(fā)明中,后臺服務(wù)器僅處理數(shù)據(jù)計算請求,可視化服務(wù)的交互呈現(xiàn)均由瀏覽器實現(xiàn),以此減少數(shù)據(jù)傳輸時延,改善用戶體驗。本發(fā)明將多種可視化技術(shù)結(jié)合呈現(xiàn)在瀏覽器窗口中,包括相對較簡單的餅圖、柱狀圖、折線圖、散點圖等傳統(tǒng)可視化技術(shù),另外本系統(tǒng)還采用了用于顯示層次化數(shù)據(jù)的樹圖可視化組件(TreeMaps),用于關(guān)系結(jié)構(gòu)的網(wǎng)狀圖,用于顯示地理信息的地圖,用于顯示多維數(shù)據(jù)的平行坐標(Parallel Coordinates),以及用于顯示文本數(shù)據(jù)的標簽云。本發(fā)明中多個可視化組件之間實現(xiàn)協(xié)同交互功能,本發(fā)明自定義的可視化組件可聯(lián)動操作同一數(shù)據(jù), 利用不同組件模塊來實現(xiàn)對數(shù)據(jù)的多方位展示。同時,本發(fā)明實現(xiàn)的社會協(xié)同可視功能允許用戶間的數(shù)據(jù)數(shù)據(jù)共享,提供API和外鏈供其他網(wǎng)站分享可視結(jié)果。本發(fā)明對于數(shù)據(jù)上傳和導(dǎo)入功能,支持常見的表格數(shù)據(jù),如Excel文件、CSV文件、 結(jié)構(gòu)良好的txt文本??紤]到隨著本發(fā)明可視服務(wù)的開發(fā),使用本發(fā)明可視分析的用戶群規(guī)模不斷擴大,用戶數(shù)據(jù)上傳量也隨之劇增,本發(fā)明采用了云平臺數(shù)據(jù)管理模式,分布式存儲用戶數(shù)據(jù),實現(xiàn)了海量數(shù)據(jù)的有效管理。另外,本發(fā)明實現(xiàn)了對用戶數(shù)據(jù)的分級權(quán)限管理,對于涉及到商業(yè)機密或自身利益的敏感數(shù)據(jù)進行隱私安全管理,不同權(quán)限的用戶可查看的數(shù)據(jù)內(nèi)容不同。下面就逐個介紹本發(fā)明采用的部分可視化組件。I)地圖可視化組件本發(fā)明使用的地圖組件根據(jù)用戶上傳的數(shù)據(jù),其中數(shù)據(jù)包括地理位置和不同維度的數(shù)值大小,結(jié)合地理信息將數(shù)據(jù)模糊映射到地圖上,地圖可采用互聯(lián)網(wǎng)上常見的二維平面地圖或衛(wèi)星遙感地圖。利用劃分好的地圖區(qū)塊內(nèi)的顏色的深淺或者地圖上的氣泡大小表示某一屬性的數(shù)值大小,本發(fā)明的地圖使用區(qū)塊顏色的透明度來表示某一數(shù)值的大小,并用文本標識不同的區(qū)域,如在杭州區(qū)域規(guī)劃圖上以濱江區(qū)、西湖區(qū)淺色字樣覆蓋區(qū)域。本發(fā)明地圖組件在實現(xiàn)可視化某一屬性的同時,保留了數(shù)據(jù)原有的地理特征,使用戶在直覺上聯(lián)系地理信息分析數(shù)據(jù),對數(shù)據(jù)有一個直觀上的理解。除了使用顏色透明度可視化一維數(shù)據(jù),本發(fā)明地圖區(qū)塊顏色也可利用色調(diào)和飽和度可視化二維數(shù)據(jù),即將兩個維度的數(shù)據(jù)映射到兩個顏色區(qū)間,并從兩個顏色區(qū)間插值計算得到相應(yīng)的顏色矩陣,并在地圖上用該顏色矩陣表示該二維數(shù)據(jù),如圖2所示。2)樹圖可視化組件本發(fā)明定義的樹圖可視化組件采用一個矩形方塊表示某屬性節(jié)點,如對浙江省內(nèi)各縣市房地產(chǎn)樹圖展示中,利用杭州市、臺州市等市級名稱作為所有數(shù)據(jù)的根節(jié)點,市內(nèi)行政區(qū)域塊作為該根節(jié)點的子節(jié)點,或?qū)r間數(shù)據(jù)的分析中,采用年份作為根節(jié)點,月份作為子節(jié)點,樹圖以其高效的平面空間利用率可以將所有數(shù)據(jù)繪制在指定的矩形區(qū)域內(nèi)。本發(fā)明實現(xiàn)的樹圖使用矩形方塊的顏色和面積大小來表示當(dāng)前節(jié)點對應(yīng)屬性的兩個數(shù)值型數(shù)據(jù)維度,矩形方塊顏色透明度與屬性數(shù)值成反比,矩形方塊的面積則用來表示另一屬性,與與當(dāng)前節(jié)點屬性的數(shù)值成正比,矩形塊在父節(jié)點區(qū)域內(nèi)與它兄弟塊面積成比例填充父節(jié)點區(qū)域。本發(fā)明實現(xiàn)的樹圖可視化組件的用戶交互功能,用戶選擇某一節(jié)點時,通過層層遞進方式不斷展示父節(jié)點下子矩形塊的詳細內(nèi)容,子節(jié)點將覆蓋原來窗口的展示區(qū)域,通過Esc鍵返回根節(jié)點層。3)平行坐標可視化組件本發(fā)明實現(xiàn)了常用于可視化多維數(shù)據(jù)的平行坐標圖,根據(jù)數(shù)據(jù)屬性整合維度,在二維平面上繪制多條間距相等的平行坐標軸,每個維度對應(yīng)一個坐標軸表示,各維度的數(shù)值按大小自上而下分布在各個坐標軸上,通過連接各坐標軸上某一數(shù)據(jù)項對應(yīng)的各個點產(chǎn)生一條橫跨平行坐標軸的折線,如圖3所示,在數(shù)據(jù)項達到一定規(guī)模后可根據(jù)數(shù)據(jù)特征聚類,賦予不同的類別折線不同的顏色,用戶可直觀了解數(shù)據(jù)的大致分布情況。
本發(fā)明實現(xiàn)的平行坐標可視化組件提供了刷技術(shù)、維度重排、坐標軸范圍縮放交互功能來改變數(shù)據(jù)分布和顯示方式,使得平行坐標可以更深入地挖掘高維數(shù)據(jù)。在本發(fā)明中使用的平行坐標可視化組件中,用戶通過拖拽選中的某一坐標軸,如拖動圖3的V1、V2實現(xiàn)兩坐標軸位置的互換,并重繪該坐標軸與其他軸之間的數(shù)值點連接線段,也可通過坐標軸縮放調(diào)節(jié)坐標軸范圍的最值,此兩個功能均改變了數(shù)據(jù)項在平行坐標中的初始分布。本發(fā)明組件的刷技術(shù)允許用戶選用高亮顏色對平行坐標軸上的折線重新上色,突出用戶感興趣的數(shù)據(jù)。4)時間流圖可視化組件本發(fā)明采用時間流圖來可視化時序數(shù)據(jù),采用沿水平軸對稱式均勻分布條帶展現(xiàn)數(shù)據(jù)。本發(fā)明時間流圖采用水平時間軸和垂直數(shù)值軸,橫坐標表示從左到右依次遞增的時間,示例數(shù)據(jù)中使用年份做時間單位,本發(fā)明可根據(jù)用戶上傳得數(shù)據(jù)特性選用微秒、秒、分鐘等合適的時間單位,縱坐標表示數(shù)據(jù)項的數(shù)值大小,數(shù)值單位從上到下遞增。本發(fā)明流圖中每一數(shù)據(jù)條帶表示一個數(shù)據(jù)項,數(shù)據(jù)條帶的寬度表示數(shù)值項在對應(yīng)時間單位上的大小, 通過層層疊加的形式來展示出不同數(shù)據(jù)項間的相對大小,并根據(jù)數(shù)據(jù)項的兩個屬性值賦予條帶不同的顏色的飽和度。本發(fā)明時間流圖實現(xiàn)了基本的交互功能,隨著用戶鼠標在展示區(qū)域滑動,時間流圖可視化組件采用高亮顏色重繪用戶鼠標停留區(qū)域上的條帶,本發(fā)明流圖高亮顏色采用天藍色,同時以提示框方式顯示該時間點該數(shù)據(jù)項所含的信息,包括介紹文本、某一時間點上的數(shù)值等,鼠標移開時使用原來顏色重繪條帶并隱藏提示框。5)本發(fā)明實現(xiàn)了經(jīng)典散點圖,橫縱坐標和點大小表示離散數(shù)據(jù)項的屬性值,點可采用常見的圓點、方點或其它簡單幾何圖形。在本發(fā)明組件的示例數(shù)據(jù)中采用圓點表示個體,以某校中學(xué)生在校情況作為例子,橫坐標表示學(xué)生的綜合文化課成績的加權(quán)平均分,以 10分為單位,橫坐標表示學(xué)生的身體素質(zhì)測評,以5分為單位,圖上散點集中分布在文化課和身體素質(zhì)測評分中段,高分和低分散點分布稀疏,這表明的散點圖適合表示無線性關(guān)系的數(shù)據(jù),經(jīng)常被用于比較跨類別、多模型混合的聚合數(shù)據(jù)。本發(fā)明實現(xiàn)的散點圖組件適用于顯示和比較至少二維以上的數(shù)值,當(dāng)展現(xiàn)數(shù)據(jù)越多,比較效果就越明顯,它對展現(xiàn)隨意的、 無明顯關(guān)系數(shù)據(jù)非常有效。6)本發(fā)明實現(xiàn)了經(jīng)典柱狀圖組件,用戶可指定柱狀圖排列方式(水平和垂直)、顏色和標簽信息,本發(fā)明實現(xiàn)的柱狀圖適用于統(tǒng)計和分析分離的、不連續(xù)的數(shù)據(jù),且一般用于小型數(shù)據(jù)集變量。本發(fā)明柱狀圖組件以浙江省大學(xué)生衣著購買方式調(diào)查數(shù)據(jù)作為示例數(shù)據(jù),使用水平軸作為標簽軸,斜方向顯示購物方式標簽(如顯示網(wǎng)絡(luò)購物、電視購物、逛實體專賣店等),縱軸做為數(shù)值軸表示表示購買次數(shù),默認單位為I次。本發(fā)明組件實現(xiàn)的用戶交互功能上,用戶將鼠標移上條帶時高亮顯示條帶,突出選中柱體漸隱未選中部分,在鼠標移開時重繪柱狀圖。7)本發(fā)明實現(xiàn)的網(wǎng)狀圖分析提取用戶上傳數(shù)據(jù)信息賦值給多個結(jié)點實體,通過最優(yōu)布局算法進行點、線繪制,根據(jù)結(jié)點的度按比例繪制大小并使用文本加以描述該點,本發(fā)明網(wǎng)狀圖采用常見的圓形結(jié)點,并采用長短不一的折線形成聚類,隱藏結(jié)點簇各個結(jié)點文本標簽僅顯示該簇名稱,根據(jù)不同的聚類賦予折線簇各不相同的顏色。本發(fā)明實現(xiàn)的網(wǎng)狀圖繼承了一般網(wǎng)狀圖善于展示實體間關(guān)聯(lián)關(guān)系的特性,適用于可視化社交網(wǎng)絡(luò)、網(wǎng)站網(wǎng)頁附屬關(guān)系、學(xué)術(shù)論文引用等,支持IE、FireFox、Opera等常用瀏覽器。
本發(fā)明組件在交互上,用戶任意選擇一個結(jié)點簇在屏幕上進行拖拽,或按重新排列各個結(jié)點簇位置。考慮到用戶交互的便捷性,使用鼠標滾輪或組件下方的縮放鍵縮放網(wǎng)狀圖,查看節(jié)點細節(jié),鼠標移上任意節(jié)點以高亮邊框顯示該節(jié)點,并顯示該結(jié)點說明標簽。8)本發(fā)明采用了常見的餅狀圖組件,通過將圓形區(qū)域按比例分成多個扇形片,分片區(qū)域附近標上說明文本和比例系數(shù),并使用不同顏色加以區(qū)分,來比較各數(shù)據(jù)類別間的比例大小。本發(fā)明實現(xiàn)的餅圖組件可以清晰地比較分塊和全局以及塊與塊之間的比例關(guān)系,在分塊上以文本標注該塊所占百分比和名稱。在用戶交互上,當(dāng)用戶將鼠標移入某一分塊時,高亮顯示該分塊,并將分塊與整體餅圖分離顯示更多的隱藏信息(如對分塊的文本說明、比例等),也可旋轉(zhuǎn)圓形區(qū)域、拖動重排分塊布局。9)本發(fā)明實現(xiàn)了傳統(tǒng)的折線圖功能組件,通過折線將分散在二維坐標平面的各點連結(jié),并使用不同顏色描繪折線加以區(qū)分,同時在上面添加文本說明信息。本發(fā)明折線圖組件克服了傳統(tǒng)折線圖僅適用于小規(guī)模數(shù)據(jù)展示的缺點,對大規(guī)模數(shù)據(jù)按指定類別進行聚類,如針對房產(chǎn)數(shù)據(jù)可按行政區(qū)域或年份聚類,在初始畫面僅展現(xiàn)數(shù)個聚類后的折線,隨著用戶交互展現(xiàn)聚類前的折線。本組件實現(xiàn)的用戶交互上,鼠標移近某一折線以橙色高亮顯示該折線并以文本描述折線,點擊則突出折線隱藏其他折線,鼠標在折線上移動可獲得該點的具體數(shù)值。10)本發(fā)明實現(xiàn)了目前在搜索網(wǎng)站、社交網(wǎng)絡(luò)上常見的標簽云組件,標簽云是對文本數(shù)據(jù)一種高效的可視化展現(xiàn)方式,常用于統(tǒng)計給定文本中關(guān)鍵詞詞頻,一般用于描述網(wǎng)站搜索標簽、文章關(guān)鍵詞。標簽云直觀的展現(xiàn)方式和簡單的實現(xiàn)方式使得它被廣泛采用,可以幫助人們快速瀏覽文本數(shù)據(jù)中的重要信息,把握全文體現(xiàn)的大概涵義。標簽云一般可分為緊密型和松散型布局,本發(fā)明的標簽云組件采用緊密型布局,使用貪婪算法盡可能填充空白區(qū)域充分利用展示區(qū)域,呈現(xiàn)大量詞頻統(tǒng)計結(jié)果,并根據(jù)標簽權(quán)重賦予標簽不同的字體大小和顏色,其中標簽顏色僅做區(qū)分作用。。本標簽云組件實現(xiàn)的用戶交互功能中,用戶移動鼠標可上下、左右旋轉(zhuǎn)標簽群,標簽移動速度與標簽權(quán)重成反比,權(quán)重大的標簽因其重要性在組件中緩慢移動。組件內(nèi)各標簽上均添加超鏈接,單個標簽與文本數(shù)據(jù)有著一對多或多對多的映射關(guān)系,用戶點擊該標簽可查看關(guān)鍵詞在文本數(shù)據(jù)中的分布情況,分布情況以柱狀圖形式展示,關(guān)聯(lián)本發(fā)明中的柱狀圖組件。11)經(jīng)典氣泡圖通常以圓形節(jié)點展現(xiàn)數(shù)值型數(shù)據(jù),圓形面積對應(yīng)數(shù)值大小,顏色可表示數(shù)值的正負等信息,是一種常見的圖表展現(xiàn)形式。通過對圓節(jié)點進行文本標注,提示用戶該節(jié)點的簡要說明和值大小,同時,可通過調(diào)整節(jié)點的大小和其之間的間隙提高區(qū)域的利用率,在此類型中節(jié)點的位置不包含任何信息,本發(fā)明氣泡圖組件在繼承經(jīng)典氣泡圖特點的同時將它與地圖結(jié)合,使用氣泡地圖來展示與地理位置相關(guān)的數(shù)據(jù),本組件地圖區(qū)域中的氣泡節(jié)點大小表示數(shù)值,氣泡顏色表示其他屬性,組件中的地圖采用互聯(lián)網(wǎng)地圖保留區(qū)域劃分,賦予不同區(qū)域相同的背景顏色以突出氣泡節(jié)點。。本發(fā)明組件在用戶交互時,用戶將鼠標移上節(jié)點,節(jié)點以橙色高亮顯示,并提示其他隱藏的說明信息。基于Web2. O的系統(tǒng)協(xié)同功能I)本發(fā)明實現(xiàn)的社會協(xié)同功能本發(fā)明系統(tǒng)的社會化功能研究主要涉及到如何實現(xiàn)具有Web 2. O元素的可視化服務(wù)及為用戶提供在線服務(wù)。研究不同用戶之間同時/同地、同時/異地、異時/同地、異時/異地的協(xié)同可視化方式,異步協(xié)同可視化是本發(fā)明研究的重點,實現(xiàn)異步協(xié)同可視化, 一般需要先對可視分析過程進行形式化描述。同時,這一功能還包括共享可視化結(jié)果的外鏈、用戶對可視化結(jié)果的評分評論、用戶上傳數(shù)據(jù)管理等。I.本發(fā)明系統(tǒng)注重友好的界面設(shè)計和流暢的用戶體驗的實現(xiàn),不僅用戶在發(fā)布內(nèi)容過程中實現(xiàn)與網(wǎng)絡(luò)服務(wù)器之間的交互,而且也實現(xiàn)了同一網(wǎng)站不同用戶之間的交互,以及不同網(wǎng)站之間信息的交互,有利于數(shù)據(jù)在不同實體間的傳遞。用戶界面注重功能的使用性,提高實時交互的響應(yīng)速度,注重交互性是Web2. O的一個主要特點。2.在網(wǎng)站內(nèi),用戶可以對可視化數(shù)據(jù)和結(jié)果進行評論、標注和評分,方便日后的查看,也可為其他用戶提供參考作用,增加不同用戶實體間的交流,加強實體間溝通也是 Web2.0網(wǎng)站的一個鮮明特色。網(wǎng)站運營商可通過該功能的評分評估某一服務(wù)的優(yōu)劣,提高信息可視服務(wù)的質(zhì)量。用戶可定制個性化的服務(wù)平臺界面,或根據(jù)用戶的搜索歷史對用戶進行服務(wù)推薦。用戶拖拽可視化組件以增加或刪除該組件,使得網(wǎng)站服務(wù)和數(shù)據(jù)處理結(jié)果更有針對性。
3.用戶除了可以在站內(nèi)分享數(shù)據(jù)和可視化結(jié)果外,還可以將交互的可視化結(jié)果以外鏈的形式發(fā)布到其他社交網(wǎng)站,站外用戶可直接通過外鏈查看可視化結(jié)果,有利于不同站點之間共享可視結(jié)果,實現(xiàn)社會協(xié)同可視化。4.對于不同類型的數(shù)據(jù)上傳和導(dǎo)入,本系統(tǒng)研究實現(xiàn)了支持常見的表格數(shù)據(jù)的處理,如Excel文件、TAB符號或者逗號分隔的文本,另外也支持數(shù)據(jù)庫文件的導(dǎo)入,如MySQL、 Oracle,SQLServer等常用數(shù)據(jù)庫。由于本系統(tǒng)提供一種標準服務(wù),供參與可視分析的用戶使用,用戶越來越多,數(shù)據(jù)上傳量也隨之越來越大,本發(fā)明同樣研究對海量數(shù)據(jù)進行有效管理的方法。由于不同的用戶可能會上傳結(jié)構(gòu)和內(nèi)容相同或類似的數(shù)據(jù),雖然廉價的、高可擴展的云存儲服務(wù)可以適應(yīng)各種情況下的數(shù)據(jù)存儲,但面對海量的上傳數(shù)據(jù),如果僅是單純的存儲在云端服務(wù)器,不僅會浪費磁盤空間,也增加了服務(wù)器在數(shù)據(jù)傳輸時的壓力。因此本系統(tǒng)通過查找和比對將數(shù)據(jù)文件中冗余和無用的數(shù)據(jù)項剔除和合并,針對相同服務(wù)類型項目的數(shù)據(jù)文件,在比較數(shù)據(jù)集之間結(jié)構(gòu)的異同之后采用特殊算法融合多個同項目的數(shù)據(jù)文件,有效的節(jié)約了磁盤空間,提高數(shù)據(jù)傳輸效率。另外,用戶上傳的數(shù)據(jù)可能涉及到商業(yè)機密或自身利益,所以需要區(qū)分公共與私有數(shù)據(jù),對私有數(shù)據(jù)進行隱私安全管理,公共數(shù)據(jù)可以被其他用戶瀏覽并下載。用戶在上傳數(shù)據(jù)時可對數(shù)據(jù)進行隱私設(shè)置,開放部分權(quán)限以保障數(shù)據(jù)的安全性,即使是網(wǎng)站管理者也無法隨意查看用戶設(shè)置的私有數(shù)據(jù),其他用戶如需使用該私有數(shù)據(jù),可通過申請得到臨時或永久的使用權(quán)限。5.在互聯(lián)網(wǎng)上大量的第三方站點包含著數(shù)目可觀的可用數(shù)據(jù),可作為本系統(tǒng)可視服務(wù)展示數(shù)據(jù)的重要來源之一,因此在第三方站點上使用可視化技術(shù)呈現(xiàn)數(shù)據(jù)是非常必要的。本發(fā)明設(shè)計適當(dāng)?shù)慕涌跇藴?,在第三方站點上實現(xiàn)一個小窗體,第三方站點用戶可以在這個小窗體里面上傳數(shù)據(jù),數(shù)據(jù)上傳的操作都是在第三方站點的前端上實現(xiàn),但是最終數(shù)據(jù)仍舊保存在云端服務(wù)器上;針對不同的可視化組件,設(shè)計不同的接口組件,輔助以一定的交互功能,用戶就可以在第三方站點上實現(xiàn)數(shù)據(jù)的可視化,其操作體驗跟原始站點一樣。用戶同樣可以將可視化得到的結(jié)果保存下來或者以外鏈的形式發(fā)布到其他站點。2)本發(fā)明的組件協(xié)同功能
本發(fā)明系統(tǒng)實現(xiàn)了多個信息可視化組件,其中主要的有地圖可視化組件、樹圖組件、平行坐標組件、時間流圖組件、柱狀圖組件、折線圖組件、標簽云組件、氣泡地圖組件等, 組件可以單獨使用,也可按預(yù)先設(shè)置的規(guī)則配合使用共同展示數(shù)據(jù),用戶對瀏覽器窗口中的組件有最大權(quán)限,可任意拖拽、增刪組件。本發(fā)明系統(tǒng)著重實現(xiàn)組件間的協(xié)同可視功能, 組件可與其他多個組件間進行交互,在定義組件間的交互操作規(guī)則后,對某一組件的操作均可聯(lián)動其他組件進行協(xié)同交互。下面就介紹組件間的協(xié)同交互規(guī)則功能I.地圖可視組件與時間流圖組件、折線圖組件間的協(xié)同交互。地圖組件以全局方式展示所有與地理位置相關(guān)的信息,本發(fā)明的地圖組件采用了互聯(lián)網(wǎng)上常見的二維平面地圖,支持用戶操作功能。地圖組件上可以使用地圖位置標簽、區(qū)域聚類、區(qū)域劃分來展示數(shù)據(jù)。在添加時間流圖組件和折線圖組件關(guān)聯(lián)后,以地圖組件為主組件,其他為輔助組件,用戶在地圖上的操作均會影響其他兩組件的顯示內(nèi)容,兩組件在初始界面時均展示全部節(jié)點數(shù)據(jù)。以杭州市的近年的房地產(chǎn)銷售數(shù)據(jù)為示例數(shù)據(jù),采用地理位置標簽標注杭州市目前正處于銷售的樓盤位置。在地圖組件初始界面中若標簽數(shù)量過多,為使界面整潔、易讀, 按一定分類規(guī)則將同類型的標簽聚類,隨著用戶操作逐漸展示詳細信息。用戶在選中某一樓盤標簽或樓盤群后,時間流圖組件和折線圖組件重繪選中數(shù)據(jù),若選中數(shù)據(jù)仍然較多超過預(yù)先設(shè)置的數(shù)量閾值,本發(fā)明折線圖則對數(shù)據(jù)按一定規(guī)則進行聚類僅顯示數(shù)條折線,使得畫面清晰。同樣地,對輔助組件的操作也影響主組件的顯示內(nèi)容。本規(guī)則也允許地圖組件僅和時間流圖組件或折線圖組件關(guān)聯(lián)。2.樹圖組件與平行坐標組件、時間流圖組件間的協(xié)同交互。樹圖組件同樣展示全局數(shù)據(jù),用戶可對樹圖中的矩形塊操作以得到該節(jié)點下的子矩形塊信息。在規(guī)則中,樹圖組件為主組件,平行坐標、時間流圖組件為輔助組件,用戶對樹圖矩形塊的選擇均會改變其他輔助組件中的數(shù)據(jù)顯示內(nèi)容。組件在初始時均顯示所有數(shù)據(jù)信息。用戶選擇樹圖矩形節(jié)點后,平行坐標圖和時間流圖重繪該樹圖節(jié)點與其子節(jié)點的所有數(shù)據(jù),如以年份為樹圖節(jié)點父節(jié)點,初始時組件展示所有年份數(shù)據(jù),在用戶選擇樹圖中某一年的節(jié)點后,平行坐標和時間流圖組件則重繪該年份下的所有數(shù)據(jù)。相似的,對輔助組件的操作也會改變樹圖組件的顯示內(nèi)容。本規(guī)則允許樹圖與單個輔助組件進行關(guān)聯(lián)。3.散點圖、平行坐標圖、柱狀圖、折線圖組件之間的交互規(guī)則。本發(fā)明中的此部分組件為展示數(shù)據(jù)的經(jīng)典圖表,被廣泛采用,均可單獨展示全局數(shù)據(jù)。散點圖組件展示離散節(jié)點信息,對節(jié)點的選擇會同時高亮顯示此節(jié)點數(shù)據(jù)在平行坐標圖組件中的折線,柱狀圖組件顯示該點多個屬性條帶,折線圖則重繪該點折線段。在添加組件關(guān)聯(lián)后,對本規(guī)則的某一組件的操作均會改變其他組件的顯示內(nèi)容。4.標簽云組件與柱狀圖組件間的關(guān)聯(lián)交互。標簽云展示文本數(shù)據(jù)中詞頻較大的關(guān)鍵標簽,標簽z 顯不的標簽與文本中的多處標簽有映射關(guān)系,用戶在選中某一標簽后看查看該標簽在文本數(shù)據(jù)中的分布情況,文本數(shù)據(jù)面板中該標簽詞語均高亮顯示。柱狀圖組件在初始時展示所有關(guān)鍵標簽的統(tǒng)計情況,當(dāng)用戶在本發(fā)明標簽云組件中選擇某一標簽后, 顯示該標簽在文本數(shù)據(jù)的分布情況,如在多個文本文件中的分布或在多個段落中的分布, 挖掘該詞的分布規(guī)律。本發(fā)明系統(tǒng)采用Web服務(wù)與信息可視化技術(shù)相結(jié)合的方式,將信息可視化服務(wù)移CN 102609507 A
書
明
說
9/9頁
植到Web服務(wù)平臺,實現(xiàn)了信息可視化服務(wù)系統(tǒng)的跨平臺特性,充分利用Web服務(wù)平臺覆蓋區(qū)域廣、易升級和成本低的優(yōu)勢。本發(fā)明實現(xiàn)的服務(wù)平臺采用了 B/S開發(fā)中常用的三層結(jié)構(gòu),即Web瀏覽器、Web服務(wù)器、數(shù)據(jù)庫服務(wù)器的軟件結(jié)構(gòu),前端展示、后臺處理,數(shù)據(jù)處理對客戶端瀏覽器透明,用戶無需考慮數(shù)據(jù)處理細節(jié)。I)本發(fā)明架構(gòu)考慮在前端設(shè)計中,在對信息可視化服務(wù)展示實現(xiàn)時,由于用戶端瀏覽器種類繁多,各瀏覽器支持標準有所差異,本發(fā)明系統(tǒng)前端設(shè)計中需要著重考慮瀏覽器兼容性,盡量實現(xiàn)對所有瀏覽器呈現(xiàn)相同的預(yù)期效果??蛻舳藶g覽器僅發(fā)送、接收、展示數(shù)據(jù)處理結(jié)果,為減少網(wǎng)絡(luò)傳輸時延帶來的不良的用戶交互體驗,將數(shù)據(jù)處理和計算均交付給云計算服務(wù)器,服務(wù)器再將處理發(fā)回到瀏覽器展示。2)對于后端,本系統(tǒng)采用目前最傳統(tǒng)的架構(gòu)模式一LAMP,即Linux(操作系統(tǒng))、 Apache (網(wǎng)頁服務(wù)器)、MySQL (數(shù)據(jù)庫服務(wù)器)、PHP或Perl或Python (腳本語言)。但是在目前Web 2.0的情況下,面臨著海量用戶及海量數(shù)據(jù),為了加強整個站點的性能,需要添加分布式緩存,分布式數(shù)據(jù)庫等模塊。后臺通過MySQL實現(xiàn)對數(shù)據(jù)庫的管理,同時后臺通過硬件虛擬化,來實現(xiàn)對數(shù)據(jù)的分布式存儲,并行計算和負載均衡。后端服務(wù)器接受客戶端的數(shù)據(jù)請求后將處理完的結(jié)果發(fā)回到客戶端,由瀏覽器接收展示。因服務(wù)器接受客戶端的所有數(shù)據(jù)請求及發(fā)送結(jié)果數(shù)據(jù),因此對傳輸線路有較高的帶寬要求以滿足實時交互性。
權(quán)利要求
1.一種基于Web的數(shù)據(jù)可視化系統(tǒng),其特征在于所述數(shù)據(jù)可視化系統(tǒng)包括Web服務(wù)平臺和客戶端,所述Web服務(wù)平臺包括Web瀏覽器、Web服務(wù)器和數(shù)據(jù)庫服務(wù)器,所述Web服務(wù)器接收客戶端瀏覽器的數(shù)據(jù)請求,負責(zé)數(shù)據(jù)計算工作并將生成的處理結(jié)果轉(zhuǎn)發(fā)到客戶端瀏覽器,所述Web服務(wù)器內(nèi)提供地圖可視化組件、樹圖可視化組件、平行坐標可視化組件、 時間流圖可視化組件、散點圖可視化組件、柱狀圖可視化組件、網(wǎng)狀圖可視化組件、餅狀圖可視化組件、折線圖可視化組件和標簽云組件,所述Web服務(wù)器還包括用以根據(jù)預(yù)先設(shè)置的規(guī)則配合使用兩種以上可視化組件共同展示數(shù)據(jù)的可視化組件協(xié)同模塊。
2.如權(quán)利要求I所述的基于Web的數(shù)據(jù)可視化系統(tǒng),其特征在于所述的Web服務(wù)器內(nèi)還設(shè)置氣泡圖可視化組件。
3.如權(quán)利要求I或2所述的基于Web的數(shù)據(jù)可視化系統(tǒng),其特征在于所述Web服務(wù)器還包括用以允許用戶間的數(shù)據(jù)數(shù)據(jù)共享,提供API和外鏈供其他網(wǎng)站分享可視結(jié)果的社會協(xié)同可視模塊。
4.如權(quán)利要求I或2所述的基于Web的數(shù)據(jù)可視化系統(tǒng),其特征在于所述Web服務(wù)器還包括用于對客戶端的用戶數(shù)據(jù)進行分級權(quán)限管理的數(shù)據(jù)安全管理模塊。
全文摘要
一種基于Web的數(shù)據(jù)可視化系統(tǒng),包括Web服務(wù)平臺和客戶端,所述Web服務(wù)平臺包括Web瀏覽器、Web服務(wù)器和數(shù)據(jù)庫服務(wù)器,所述Web服務(wù)器接收客戶端瀏覽器的數(shù)據(jù)請求,負責(zé)數(shù)據(jù)計算工作并將生成的處理結(jié)果轉(zhuǎn)發(fā)到客戶端瀏覽器,所述Web服務(wù)器內(nèi)設(shè)置地圖可視化組件、樹圖可視化組件、平行坐標可視化組件、時間流圖可視化組件、散點圖可視化組件、柱狀圖可視化組件、網(wǎng)狀圖可視化組件、餅狀圖可視化組件、折線圖可視化組件和標簽云組件,所述Web服務(wù)器還包括用以根據(jù)預(yù)先設(shè)置的規(guī)則配合使用兩種以上可視化組件共同展示數(shù)據(jù)的可視化組件協(xié)同模塊。本發(fā)明對客戶端硬件要求較低、降低客戶使用成本、適用性較好。
文檔編號G06F17/30GK102609507SQ20121002404
公開日2012年7月25日 申請日期2012年2月3日 優(yōu)先權(quán)日2012年2月3日
發(fā)明者于明遠, 何賢國, 葉蕾, 孫國道, 梁榮華 申請人:浙江工業(yè)大學(xué)