本發(fā)明涉及一種多路數(shù)據(jù)分塊浮點(diǎn)量化處理架構(gòu)
背景技術(shù):
隨著云計(jì)算及虛擬化,呈現(xiàn)出“大規(guī)?!?、“高密度”、“高能耗”、“復(fù)雜化”等特點(diǎn),建設(shè)與發(fā)展新一代數(shù)據(jù)中心,提升數(shù)據(jù)中心基礎(chǔ)設(shè)施管理將變得日趨重要,數(shù)據(jù)中心的基礎(chǔ)架構(gòu)融合管理與智能將成為數(shù)據(jù)中心發(fā)展的新趨勢(shì)。超大型數(shù)據(jù)中心提供了從基礎(chǔ)設(shè)施到后面的數(shù)據(jù)分析、篩選、應(yīng)用的整個(gè)應(yīng)用服務(wù)。不僅是數(shù)據(jù)分析,還包括與公有云提供的通用化服務(wù)不同的專門服務(wù)于智能制造的云計(jì)算,以及超級(jí)運(yùn)算,這就對(duì)大數(shù)據(jù)的處理能力提出了更高要求。
能夠用數(shù)據(jù)或統(tǒng)一的結(jié)構(gòu)加以表示,我們稱之為結(jié)構(gòu)化數(shù)據(jù),如數(shù)字、符號(hào)。傳統(tǒng)的關(guān)系數(shù)據(jù)模型、行數(shù)據(jù),存儲(chǔ)于數(shù)據(jù)庫(kù),可用二維表結(jié)構(gòu)表示。半結(jié)構(gòu)化數(shù)據(jù),就是介于完全結(jié)構(gòu)化數(shù)據(jù)(如關(guān)系型數(shù)據(jù)庫(kù)、面向?qū)ο髷?shù)據(jù)庫(kù)中的數(shù)據(jù))和完全無結(jié)構(gòu)的數(shù)據(jù)(如聲音、圖像文件等)之間的數(shù)據(jù),xml、html文檔就屬于半結(jié)構(gòu)化數(shù)據(jù)。它一般是自描述的,數(shù)據(jù)的結(jié)構(gòu)和內(nèi)容混在一起,沒有明顯的區(qū)分。非結(jié)構(gòu)化數(shù)據(jù)庫(kù)是指其字段長(zhǎng)度可變,并且每個(gè)字段的記錄又可以由可重復(fù)或不可重復(fù)的子字段構(gòu)成的數(shù)據(jù)庫(kù),用它不僅可以處理結(jié)構(gòu)化數(shù)據(jù)(如數(shù)字、符號(hào)等信息)而且更適合處理非結(jié)構(gòu)化數(shù)據(jù)(全文文本、圖象、聲音、影視、超媒體等信息)。
數(shù)據(jù)沿一相同方向的排列稱為一路陣列。標(biāo)量是零路陣列的表示,行向量和列向量分別是數(shù)據(jù)沿水平和垂直方向排列的一路陣列,矩陣是數(shù)據(jù)沿水平和垂直兩個(gè)方向排列的二路陣列。張量是數(shù)據(jù)的多路陣列表示,它是矩陣的一種擴(kuò)展。最常用的張量為三階張量。三階張量也稱三維矩陣。維數(shù)相同的正方三階張量稱為立方體。
三階張量的三路陣列不以行向量、列向量等相稱,而改稱張量纖維。纖維是只保留一個(gè)下標(biāo)可變,固定其他所有下標(biāo)不變而得到的一路陣列。它們分別是三階張量的水平纖維、豎直纖維和縱深纖維。高階張量也可以用矩陣的集合表示。這些矩陣形成了三階張量的水平切片、側(cè)向切片和正面切片。在張量的分析與計(jì)算中,能夠?qū)⒁粋€(gè)三階張量(三路陣列)經(jīng)過重新組織或者排列,變成一個(gè)矩陣(二路陣列)。
矩陣有兩個(gè)相伴的向量空間:列空間和行空間。奇異值分解將這兩個(gè)向量空間正交化,并將矩陣分解為三個(gè)矩陣的乘積:左奇異矩陣、右奇異矩陣和中間對(duì)角奇異值矩陣。由于奇異值得作用往往比左和右奇異向量更加重要,所以奇異值矩陣可視為矩陣的核心矩陣。若將對(duì)角奇異值矩陣看作一個(gè)二階張量,則奇異值矩陣很自然地是二階張量的核心張量,而矩陣的三個(gè)矩陣乘積即可改為二階張量的n-模式積。
稀疏信號(hào)是指在大多數(shù)采樣時(shí)刻的取值等于零或近似等于零,只有少數(shù)采樣時(shí)刻的取值明顯不等于零的信號(hào)。許多自然信號(hào)在時(shí)域并不是稀疏信號(hào),但是在某個(gè)變換域是稀疏的。這些變換工具包括fourier變換、短時(shí)fourier變換、小波變換和gabor變換等。
采用塊浮點(diǎn)算法是將數(shù)據(jù)分成組,組內(nèi)的數(shù)據(jù)相對(duì)彼此按比例縮放,但是不能與其他組的成員按相同的比例縮放,即使諸如乘法這樣簡(jiǎn)單的數(shù)學(xué)運(yùn)算。在比較復(fù)雜的矩陣求逆情況中,分組之間需要比較復(fù)雜的數(shù)學(xué)運(yùn)算,就必須采用塊浮點(diǎn)處理器。
分塊浮點(diǎn)量化算法基于的事實(shí)是在一個(gè)小的時(shí)間間隔上,數(shù)據(jù)的熵要低于整個(gè)數(shù)據(jù)集的熵。分塊浮點(diǎn)量化器是一個(gè)接收模數(shù)轉(zhuǎn)換器的輸出數(shù)據(jù)流,并將采樣數(shù)據(jù)統(tǒng)一量化為原始數(shù)據(jù)的一種有效表示形式的設(shè)備,在量化過程中只要求比特?cái)?shù)小于樣本數(shù)。
本發(fā)明提供了一種多路數(shù)據(jù)分塊浮點(diǎn)量化處理架構(gòu)。架構(gòu)的特征為,將結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)排列成三路陣列;使用高階奇異值分解,將三路陣列分解為二階張量的矩陣模式;再將矩陣模式變換到稀疏域,進(jìn)行分塊浮點(diǎn)量化處理。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供一種多路數(shù)據(jù)分塊浮點(diǎn)量化處理架構(gòu)。本發(fā)明包括以下特征:
發(fā)明技術(shù)方案
1.一種多路數(shù)據(jù)分塊浮點(diǎn)量化處理架構(gòu),架構(gòu)的特征:
1)將結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)排列成三路陣列;
2)使用高階奇異值分解,將三路陣列分解為二階張量的矩陣模式;
3)再將矩陣模式變換到稀疏域,進(jìn)行分塊浮點(diǎn)量化處理。
附圖說明
附圖1是多路數(shù)據(jù)分塊浮點(diǎn)量化處理架構(gòu)圖。
具體實(shí)施方式
這種多路數(shù)據(jù)分塊浮點(diǎn)量化處理架構(gòu),包括如下步驟特征:
1)將結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)排列成三路陣列;
2)使用高階奇異值分解,將三路陣列分解為二階張量的矩陣模式;
3)再將矩陣模式變換到稀疏域,進(jìn)行分塊浮點(diǎn)量化處理。