專利名稱:基于小波變換的人工視覺圖像處理方法
技術領域:
本發(fā)明涉及一種圖像處理技術領域的方法,具體是一種基于小波變換的人工 視覺圖像處理方法。
背景技術:
人工耳蝸技術和人工視覺技術都屬于人工感知的范疇。由于視覺與聽覺的生 理機制有很多相似之處,因此人工耳蝸技術和人工視覺技術也有相似之處。他們 分別是對由麥克風釆集的外部聲音信號和攝像頭采集的外部圖像信號,進行人工 的處理和編碼,然后由電極陣列將編碼的結果以電流脈沖波的方式施加到聽神經(jīng) 和視神經(jīng)/視網(wǎng)膜上,使其產(chǎn)生神經(jīng)沖動,傳入大腦產(chǎn)生聽幻覺和視幻覺。上世 紀50年代就開始的人工耳蝸技術如今已經(jīng)廣泛應用于臨床成為目前全聾患者恢 復聽覺的唯一有效的治療方法。
小波技術是為了解決傅立葉變換的局限性而產(chǎn)生的一項技術。1989年,馬 拉特(S.Mallat)在《IEEE Trans on Acoustics, Speech and Signal Processing》 (聲學、語音與信號處理學報)(1989年37巻12號2091至2110頁)上發(fā)表 Multifrequency channel decompositions of images and wavelet models (圖 像的多頻率通道分解與小波模型),提出了多分辨率分析(Multi-Resolution Analysis)的概念,并給出了快速小波變換(FWT)的算法,稱為馬拉特算法(Mallat 算法)。馬拉特算法的提出大大提高了小波變換的計算速度,從而使小波變換在 工程領域得到廣泛的應用小波變換在人工耳蝸聲音處理系統(tǒng)有出色的表現(xiàn);離 散小波變換在數(shù)字圖像壓縮、處理和分析中也已經(jīng)被廣泛采用。而且,小波變換 和人體視覺處理系統(tǒng)的機制具有一定的相似性局部性、多分辨率、稀疏性。
經(jīng)過對現(xiàn)有技術文獻檢索發(fā)現(xiàn),ECKMILLER等在《JOURNAL OF NEURAL ENGINEERING))(神經(jīng)工程學雜志)(2005年2月期91至104頁)上發(fā)表Tunable retina encoders for retina implants: why and how (可調(diào)的視網(wǎng)膜視覺假體
4
編碼器),該文中提出可調(diào)的視網(wǎng)膜圖像處理方法,具體方法為應用視網(wǎng)膜和 中央視覺系統(tǒng)兩個模塊,用時空濾波器對圖像進行編碼,用移動的圓作為樣本來 訓練兩個模塊的狀態(tài)參數(shù)。但其不足在于僅只停留在對圖像的重構層面,而沒有 將圖像與視覺假體的電極刺激聯(lián)系起來,而且模型實時性差,訓練過程比較復雜, 實際應用中可控性差,不便于嵌入到視覺假體應用系統(tǒng)中去。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術中的不足,本發(fā)明提出了一種基于小波變換 的人工視覺圖像處理方法,使其針對視網(wǎng)膜或視神經(jīng)視覺假體中的信號處理系 統(tǒng),參考人工耳蝸中的聲音信號處理方法,采用二維離散小波變換對原始圖像進 行變換,變換后的小波系數(shù)經(jīng)過采樣、選擇和映射轉化為視覺假體中的刺激電極 電流強度,從而刺激人體視覺系統(tǒng)產(chǎn)生視幻覺。
本發(fā)明是通過以下技術方案實現(xiàn)的,本發(fā)明包括以下步驟
步驟一,對采集圖像進行二維離散小波變換以及二級小波分析,獲得小波系
數(shù);
一幅原始灰度圖像,經(jīng)過對比度增強后用馬拉特快速小波變換算法進行二維 離散小波變換并進行二級小波分析,得到小波系數(shù)。所述小波,選用雙正交小波, 因為這種小波函數(shù)與神經(jīng)節(jié)細胞的感受野模型較為接近。本發(fā)明中視覺系統(tǒng)中的 神經(jīng)元被簡化地看成相互獨立的個體,每個神經(jīng)元的響應是線性的。那么,每個 神經(jīng)元的響應程度就是小波變換產(chǎn)生的小波系數(shù)大小。
對于一個32X32像素的原始灰度圖像,進行二級小波分析,將得到七個小 波系數(shù)矩陣,即一個低頻近似系數(shù)矩陣cA2 (14X14)和六個高頻系數(shù)矩陣,六 個高頻系數(shù)矩陣包括三個二級小波系數(shù)矩陣(14X14):水平cD2(h)、豎直cD2(v) 和對角系數(shù)矩陣cD2w),和三個一級小波系數(shù)矩陣(20X20):水平cD,)、豎直 cD,)和對角系數(shù)矩陣cD,。
步驟二,對步驟一得到的小波系數(shù)進行硬閾值化處理;
對經(jīng)過小波變換得到的小波系數(shù),分布在零附近的系數(shù)認為其不足以引起神 經(jīng)細胞的反應將其置為0,稱之為硬閾值化過程,艮口
其中^是選定的閾值,w是小波系數(shù);
小波系數(shù)不僅表示了圖像的局部與小波基的相似程度,也反映了該局部的神 經(jīng)細胞被激活的程度。因此本發(fā)明將針對小波系數(shù)進行處理而不是針對由單一小 波系數(shù)重建的圖像分量。
步驟三,對步驟二閾值化以后的系數(shù)進行采樣;
所述采樣,根據(jù)視網(wǎng)膜神經(jīng)節(jié)細胞的分布性質(zhì)和人眼視覺機制,對于低頻近 似系數(shù),采用全局均勻采樣的方法,均勻地采樣一個4X4的系數(shù)矩陣,作為低 頻成分通道的輸出;對于一級二級小波系數(shù)和二級小波系數(shù),采用中間局部均勻 采樣的方法,其中一級水平、豎直和對角系數(shù)矩陣為20X20大小,對其中間的 8X8矩陣均勻采樣出4X4個小波系數(shù),二級水平、豎直和對角系數(shù)矩陣為14X14 大小,直接采樣其中間的4X4矩陣。只對高頻矩陣的中間矩陣子塊進行采樣而 忽略周圍高頻信息,是基于人眼對于環(huán)境的感知是一種中間精細外周粗糙的編碼 方式。
步驟四,對步驟三中經(jīng)過采樣的高頻系數(shù)進行能量比較選擇,選擇4通道輸
出;
所述能量比較選擇,是指將低頻近似系數(shù)矩陣的采樣結果作為第一通道的輸 出,對剩余的6個高頻系數(shù)矩陣計算小波能量,選擇能量最大的三個采樣系數(shù)矩 陣作為剩下三個通道的輸出。
對于選擇能量最大的三個采樣系數(shù)矩陣,首先計算各個高頻分量采樣之后的 小波能量。小波能量E的計算公式為
"S卜('、川 (2)
八j
其中『6',力為采樣點的小波系數(shù)。
因為電極陣列的數(shù)量有限,每組電極上的輸出要盡量包含能量多的圖形信
息;所以選擇能量最高的三個采樣系數(shù)矩陣,作為三個高頻通道的輸出。
通過本步驟,得到一個帶有圖像信息的4通道輸出,所述4通道,是指包含
原圖像不同尺度不同位置信息的矩陣輸出,每個通道的輸出矩陣的大小是4X4。
步驟五,采用步驟四中的4通道輸出驅動脈沖發(fā)生器產(chǎn)生脈沖波,通過電極 陣列剌激視神經(jīng)細胞,在人腦中形成視幻覺。
所述脈沖波,由上述步驟得到的4通道的每個輸出通道的系數(shù)矩陣對應驅動 電極陣列中的一組脈沖發(fā)生器輪流產(chǎn)生,脈沖波通過嵌入在人體視網(wǎng)膜上或者視 神經(jīng)上的電極陣列刺激相應的神經(jīng)細胞,神經(jīng)細胞經(jīng)過電刺激會產(chǎn)生響應,從而 在人腦中形成視幻覺,還原圖像。
與現(xiàn)有技術相比,本發(fā)明結合了人體視覺感知的特點,結合人工耳蝸的經(jīng)驗, 應用二維離散小波變換,將一個32X32像素的輸入圖像最終通過視網(wǎng)膜上或視 神經(jīng)上的4組電極刺激在人腦中還原,為視覺假體的信號處理系統(tǒng)。小波變換將 圖像中的信息進行分塊分頻率分解,分別輸出至相應的電極陣列中。小波變換的 計算復雜度為O(N),整個方法很容易嵌入到任意的數(shù)字信號處理系統(tǒng)中,因此具 有很好的實時性和可實施性。本發(fā)明和圖像采集和電極制作技術相結合,可以實 現(xiàn)的人工視覺假體系統(tǒng)。
圖l為本發(fā)明流程示意圖2為本發(fā)明中系數(shù)矩陣采樣規(guī)則原理圖3為本發(fā)明實施例中的原始圖像和四通道采樣矩陣輸出示意圖4為本發(fā)明圖像仿真輸出方法原理圖5為本發(fā)明實施例中的原始圖像和仿真輸出圖像示意圖。
具體實施例方式
下面結合附圖對本發(fā)明的實施例作詳細說明,本實施例在以本發(fā)明技術方案 為前提下進行實施,給出了詳細的實施方式和具體的操作過程,但本發(fā)明的保護 范圍不限于下述的實施例。
如圖1所示,本實施例根據(jù)對32X32像素的原始灰度圖像按照如下步驟進 行處理。
步驟一,對原灰度圖像進行對比度增強,使其全部像素的灰度值分布在0到 255之間,增強后的圖像如圖3(a)和圖5(a)所示;對增強過的灰度圖象采用馬拉特快速小波變換算法進行二維離散小波變換,其小波函數(shù)選用雙正交小波,并進 行二級小波分析,共得到共7個系數(shù)矩陣l個低頻近似系數(shù)矩陣cA2 (14X14) 和6個高頻系數(shù)矩陣,6個高頻系數(shù)矩陣包括3個二級小波系數(shù)矩陣(14X14): 水平cD2(h),豎直cD2w和對角系數(shù)矩陣cD2(d),和3個一級小波系數(shù)矩陣(20X20): 水平CD,,豎直cD^和對角系數(shù)矩陣dVd)。
步驟二,對所有的7個系數(shù)矩陣進行硬閾值化處理,在本例中閾值《=10。
步驟三,對7個硬閾值化處理后的系數(shù)矩陣分別進行采樣,具體方式如下 低頻近似系數(shù)矩陣采用全局均勻采樣的方式,均勻地選取第2、 6、 9、 13行的第 2、 6、 9、 13列元素共4X4=16個采樣點; 一級和二級小波系數(shù)矩陣采用中間局 部均勻采樣的方法,二級小波系數(shù)矩陣直接選取矩陣中間的4X4系數(shù)矩陣即第 6到9行的第6到9列元素,得到16個采樣點; 一級小波系數(shù)矩陣首先選擇矩 陣中間的8X8系數(shù)矩陣即第7到14行的第7到14列元素,然后對選擇的8X8 矩陣,均勻交錯地選擇第l、 3、 5、 7行的第1、 3列元素和第2、 4、 6、 8行的 第5、 7列元素得到4X4=16個采樣點,即原一級小波系數(shù)矩陣的第7、 9、 11、 13行的第7、 9列元素和第8、 10、 12、 14行的第11、 13列元素。采樣方式如 圖3所示,其中一個小方格代表一個系數(shù)元素,灰色為采樣點,白色為非采樣點。 共得到7個4X4的輸出矩陣低頻近似系數(shù)矩陣cA2采樣方式如圖2 (a)所示 得到4X4個系數(shù)矩陣;二級小波系數(shù)采樣方式如圖2 (b)所示得到3個4X4 個系數(shù)矩陣; 一級小波系數(shù)采樣方式如圖2 (c)所示得到3個4X4個系數(shù)矩陣。
步驟四,將低頻近似系數(shù)矩陣的采樣結果作為第一通道的輸出。對剩余的6 個一級二級小波系數(shù)矩陣計算小波能量,選擇能量最大的三個采樣系數(shù)矩陣作為 剩下三個通道的輸出。于是,得到4通道每通道4X4個輸出值的輸出結果。采 樣后的系數(shù)矩陣為灰度圖象的形式,如圖3 (b)所示,其中每個大正方形表示 一個通道的輸出,每個小方格表示通道中的一個系數(shù),小方格顏色越淺,表示系 數(shù)值越大,顏色越深,表示系數(shù)值越小。
步驟五,由上述步驟得到的4通道的每個輸出通道的系數(shù)矩陣對應驅動脈 沖發(fā)生器,脈沖發(fā)生器產(chǎn)生強度、頻率、脈寬均不相同的雙相脈沖方波,在不同 的電極陣列上產(chǎn)生剌激電流,電極陣列刺激相應的神經(jīng)細胞,神經(jīng)細胞經(jīng)過電刺
激會產(chǎn)生響應,從而在人腦中形成視幻覺,還原圖像。
步驟六,將所獲得的4通道輸出進行視覺系統(tǒng)的仿真
為了描述人腦中的還原出的圖形,將所獲得的4通道輸出進行視覺系統(tǒng)的仿 真,其過程如圖4所示對于每個通道的16個輸出系數(shù),首先進行插值,對第 一通道的輸出采樣系數(shù)1采取雙線性插值的方式,得到一個還原的14X14的低 頻近似系數(shù)矩陣cA2,,對第二通道、第三通道、第四通道的輸出采樣系數(shù)2、 采樣系數(shù)3、采樣系數(shù)4根據(jù)采樣規(guī)則的逆向操作采用補零插值。然后分別與各 級二維小波基(二維小波基是二維小波的基本組成單位,每個小波系數(shù)對應一個 小波基)做巻積運算,之后將所有的結果疊加起來,得到一個還原的32X32像 素的仿真圖像,結果如圖5(b)所示,與之對照的原始圖像如圖5(a)。
本實施例結合了人體視覺感知的特點,參考了人工耳蝸的成功經(jīng)驗,應用二 維離散小波變換,將一個32X32像素的輸入圖像最終通過視網(wǎng)膜上或視神經(jīng)上 的4組電極刺激在人腦中還原,并通過仿真方法,將人腦中的視幻覺仿真出來, 從而實現(xiàn)了本實施例的目的。
權利要求
1.一種基于小波變換的人工視覺圖像處理方法,其特征在于,包括以下步驟步驟一,對采集圖像進行二維離散小波變換以及二級小波分析,獲得小波系數(shù);步驟二,對步驟一得到的小波系數(shù)進行硬閾值化處理;步驟三,對步驟二閾值化以后的系數(shù)進行采樣;步驟四,對步驟三中經(jīng)過采樣的高頻系數(shù)進行能量比較選擇,選擇能量最大的三個采樣系數(shù)矩陣作為剩下三個通道的輸出,得到4通道每通道4×4個輸出值的輸出結果;步驟五,采用步驟四中的4通道輸出驅動脈沖發(fā)生器產(chǎn)生脈沖波,通過電極陣列刺激視神經(jīng)細胞,在人腦中形成視幻覺。
2. 根據(jù)權利1所要求的基于小波變換的人工視覺圖像處理方法,其特征是, 所述二維離散小波變換,是指采用馬拉特快速小波變換算法進行二維離散小波 變換,并對圖像進行二級小波分析,得到小波系數(shù)。
3. 根據(jù)權利1或2所要求的基于小波變換的人工視覺圖像處理方法,其特 征是,所述小波,是二維雙正交小波。
4. 根據(jù)權利1或2所要求的基于小波變換的人工視覺圖像處理方法,其特 征是,所述小波系數(shù),是指對一個32X32像素的圖像進行二級小波分析得到 的七個小波系數(shù)矩陣,即一個低頻近似系數(shù)矩陣cA2 (14X14)和六個高頻系數(shù) 矩陣,六個高頻系數(shù)矩陣包括三個二級小波系數(shù)矩陣(14X14):水平cD^、豎 直cD2w和對角系數(shù)矩陣cD2"),和三個一級小波系數(shù)矩陣(20X20):水平cD,、 豎直cD:)和對角系數(shù)矩陣dVd)。
5. 根據(jù)權利1所要求的基于小波變換的人工視覺圖像處理方法,其特征是, 所述硬閾值化處理,是指對經(jīng)過小波變換得到的小波系數(shù),將分布在零附近的系 數(shù)認為其不足以引起神經(jīng)細胞的反應將其置為O,艮P: <formula>formula see original document page 3</formula>其中^是選定的閾值,w是小波系數(shù)。
6. 根據(jù)權利1所要求的基于小波變換的人工視覺圖像處理方法,其特征是,所述采樣,具體為根據(jù)視網(wǎng)膜神經(jīng)節(jié)細胞的分布性質(zhì)和人眼視覺機制,對于低 頻近似系數(shù),采用全局均勻采樣的方法,均勻地采樣一個4X4的系數(shù)矩陣,作 為低頻成分通道的輸出;對于一級二級小波系數(shù)和二級小波系數(shù),采用中間局部 均勻采樣的方法,其中一級水平、豎直和對角系數(shù)矩陣為20X20大小,對其中 間的8X8矩陣均勻采樣出4X4個小波系數(shù),二級水平、豎直和對角系數(shù)矩陣為 14X14大小,直接采樣其中間的4X4矩陣。
7. 根據(jù)權利1所要求的基于小波變換的人工視覺圖像處理方法,其特征是, 所述能量比較選擇,是指將低頻近似系數(shù)矩陣的采樣結果作為第一通道的輸出, 對剩余的6個高頻系矩陣計算小波能量,選擇能量最大的三個采樣系數(shù)矩陣作 為剩下三個通道的輸出。
8. 根據(jù)權利7所要求的基于小波變換的人工視覺圖像處理方法,其特征是, 所述小波能量E,其計算公式為其中^rX^為采樣點的小波系數(shù)。
9. 根據(jù)權利1所要求的基于小波變換的人工視覺圖像處理方法,其特征是, 所述4通道,每個通道的輸出矩陣的大小是4X4。
10. 根據(jù)權利1所要求的基于小波變換的人工視覺圖像處理方法,其特征是, 所述脈沖波,由每個輸出通道的系數(shù)矩陣對應驅動電極陣列中的一組脈沖發(fā)生器 輪流產(chǎn)生,脈沖波通過嵌入在人體視網(wǎng)膜上或者視神經(jīng)上的電極陣列刺激相應的 神經(jīng)細胞,神經(jīng)細胞經(jīng)過電刺激會產(chǎn)生響應,從而在人腦中形成視幻覺,還原圖 像。
全文摘要
一種視覺替代系統(tǒng)領域中的基于小波變換的人工視覺圖像處理方法,通過將原始灰度自然圖像進行二維離散小波變換,并對變換后的小波系數(shù)進行硬閾值化處理和采樣,并通過高頻系數(shù)能量比較選擇4通道輸出,驅動脈沖發(fā)生器產(chǎn)生脈沖波,通過視神經(jīng)上的4組電極陣列刺激視神經(jīng)細胞,在人腦中形成視幻覺。本發(fā)明應用二維離散小波變換,將一個32×32像素的輸入圖像最終在人腦中還原,小波變換將圖像中的信息進行分塊分頻率分解,小波變換的計算復雜度為0(N),本方法很容易嵌入到任意的數(shù)字信號處理系統(tǒng)中,具有很好的實時性和可實施性。
文檔編號A61N1/04GK101114336SQ200710044898
公開日2008年1月30日 申請日期2007年8月16日 優(yōu)先權日2007年8月16日
發(fā)明者朱貽盛, 童善保, 邱意弘, 虹 郭 申請人:上海交通大學