本發(fā)明涉及神經(jīng)網(wǎng)絡(luò)領(lǐng)域,尤其是適用于灰度圖片的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法以及訓(xùn)練方法。
背景技術(shù):
隨著計(jì)算機(jī)與信息技術(shù)的不斷演進(jìn),機(jī)器學(xué)習(xí)以及模式識(shí)別已成為近幾年來最炙手可熱的領(lǐng)域之一。在一些以往需要人執(zhí)行的圖像識(shí)別任務(wù)正在逐漸被機(jī)器替代,例如車牌識(shí)別,人臉識(shí)別以及指紋識(shí)別等。雖然這些領(lǐng)域已經(jīng)有相對成熟的解決方案,但是其方案應(yīng)用的領(lǐng)域非常有限,往往只能在特定條件的環(huán)境下才能達(dá)到預(yù)期的識(shí)別效果;除此之外,傳統(tǒng)的圖像識(shí)別技術(shù)往往只能提取圖片的局部信息,而無法對待測試圖片中的所有信息作識(shí)別以及分類,應(yīng)用范圍廣泛,識(shí)別準(zhǔn)確度高。在現(xiàn)有的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法中由于涉及到多位浮點(diǎn)數(shù)的運(yùn)算,普遍計(jì)算量過大,減慢了運(yùn)算速度,所以對運(yùn)算設(shè)備的要求很高。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供適用于灰度圖片的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法以及訓(xùn)練方法,克服了現(xiàn)有技術(shù)的困難,能夠通過二值化矩陣和浮點(diǎn)數(shù)矩陣的交替使用,減小了矩陣運(yùn)算時(shí)的字節(jié)數(shù),加快運(yùn)算速度,大大降低了對運(yùn)算設(shè)備的要求。
根據(jù)本發(fā)明的一個(gè)方面,提供適用于灰度圖片的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法,所述神經(jīng)網(wǎng)絡(luò)包括大量的神經(jīng)元,將大量帶有字符圖形的灰度圖片分別提供給所述神經(jīng)元進(jìn)行學(xué)習(xí),所述灰度圖片中包含c種字符,c屬于常數(shù),包括以下步驟:
s101、將一灰度圖片預(yù)處理,根據(jù)所述灰度圖片中的像素排列和字符圖形,將所述灰度圖片轉(zhuǎn)化為一個(gè)二維的第一矩陣m1,所述第一矩陣m1的行數(shù)為a,列數(shù)為b,a、b均為大于1的常數(shù),所述第一矩陣m1中的每個(gè)所述元素值的取值范圍為[0,255]之間的整數(shù);
s102、將所述第一矩陣轉(zhuǎn)化為一個(gè)一維的第二矩陣m2,所述第二矩陣m2的行數(shù)為a×b,列數(shù)為1,所述第二矩陣m2中的每個(gè)所述元素值的取值范圍為[0,255]之間的整數(shù);
s103、通過同一隨機(jī)種子生成二值化的隨機(jī)編碼矩陣來建立一個(gè)二維的第三矩陣m3,所述第三矩陣m3的行數(shù)為d,d屬于大于0的整數(shù),列數(shù)為a×b,所述第三矩陣m3中的每個(gè)所述元素值為1或-1;
s104、將所述第三矩陣m3乘以第二矩陣m2,得到一個(gè)一維的第四矩陣m4,所述第四矩陣m4的行數(shù)為d,列數(shù)為1,所述第四矩陣m4中的每個(gè)所述元素值的取值范圍為[-255×(a×b),+255×(a×b)]的整數(shù);
s105、通過激活函數(shù)調(diào)整所述第四矩陣m4,并且將每個(gè)所述元素值移位縮小2n倍后只保留整數(shù)位,n為可變參數(shù),n屬于整數(shù),得到一個(gè)一維的第六矩陣m6,所述第六矩陣m6的行數(shù)為d,列數(shù)為1,所述第六矩陣m6中的每個(gè)所述元素值的取值范圍是
s106、建立一二維的第七矩陣m7,所述第七矩陣m7的行數(shù)為c,列數(shù)為d,二值化的所述第七矩陣m7中的每個(gè)所述元素值為-1或+1;并且建立一二維的第八矩陣m8,所述第八矩陣m8的行數(shù)為c,列數(shù)為d,所述第八矩陣m8中的每個(gè)所述元素值的取值范圍是[-1,+1]之間的浮點(diǎn)數(shù);
s107、所述第七矩陣m7乘以所述第四矩陣m4,得到一個(gè)一維的第九矩陣m9,所述第九矩陣m9的行數(shù)為c,列數(shù)為1,所述第九矩陣m9中的每個(gè)所述元素值的取值范圍是
s108、得到代表當(dāng)前所述灰度圖片的字符的一維的第十矩陣m10,所述第十矩陣m10的行數(shù)為c,列數(shù)為1,所述第十矩陣m10中的每一行的元素代表一種所述字符,所述第十矩陣m10中代表當(dāng)前所述灰度圖片的字符的行的元素值為0或2m,m為可變參數(shù),m屬于整數(shù),其余行的元素值為0;
s109、將所述第十矩陣m10減去所述第九矩陣m9,得到一個(gè)表示誤差的一維的第十一矩陣m11,所述第十一矩陣m11的行數(shù)為c,列數(shù)為1,所述第十一矩陣m11中的每個(gè)所述元素值的取值范圍是
s110、計(jì)算所述第六矩陣m6的轉(zhuǎn)置矩陣,得到一個(gè)一維的第十二矩陣m12,所述第十二矩陣m12的行數(shù)為1,列數(shù)為d,所述第十二矩陣m12中的元素值的取值范圍為
s111、將所述第六矩陣m6乘以所述第十二矩陣m12得到一過程參數(shù)num,所述過程參數(shù)num屬于整數(shù);
s112、將所述第十二矩陣m12除以所述過程參數(shù)num得到一個(gè)一維的第十三矩陣m13,所述第十三矩陣m13的行數(shù)為1,列數(shù)為d,所述第十三矩陣m13中的元素值的取值范圍為
s113、將所述第十一矩陣m11乘以所述第十三矩陣m13,得到一個(gè)二維的第十四矩陣m14,所述第十四矩陣m14的行數(shù)為c,列數(shù)為d,所述第十四矩陣m14中的元素值的取值范圍為
s114、將所述第十四矩陣m14與所述第八矩陣m8相加,得到一個(gè)第十五矩陣m15,將當(dāng)前的所述第八矩陣m8更新為所述第十五矩陣m15,所述第十五矩陣m15的行數(shù)為c,列數(shù)為d,所述第十五矩陣m15中的元素值的取值范圍為
s115、將所述第十五矩陣m15進(jìn)行二值化,將所述第十五矩陣m15中大于0的元素值轉(zhuǎn)化為1,將所述第十五矩陣m15中小于等于0的元素值轉(zhuǎn)化為-1,得到一個(gè)第十六矩陣m16,所述第十六矩陣m16的行數(shù)為c,列數(shù)為d,所述第十六矩陣m16中的元素值為-1或1;將當(dāng)前的所述第七矩陣m7更新為所述第十六矩陣m16,返回步驟s107。
優(yōu)選地,所述步驟s101包括:所述第一矩陣中的每個(gè)元素各自對應(yīng)所述灰度圖片中的一個(gè)像素點(diǎn),每個(gè)所述像素點(diǎn)對應(yīng)的所述第一矩陣中的元素值為取值范圍為[0,255]之間的整數(shù)。
優(yōu)選地,所述步驟s102包括:將二維的第一矩陣中每一行首尾相連形成一維的第二矩陣,其中所述第一矩陣的每一行的尾端銜接下一行的首端。
優(yōu)選地,d=a×b×e,e為大于1的整數(shù)。
優(yōu)選地,e的取值范圍是[5,20]之間的整數(shù)。
優(yōu)選地,所述步驟s105包括:根據(jù)以下四個(gè)激活函數(shù)中的任意一種激活所述第四矩陣m4的每一個(gè)元素,所述激活函數(shù)包括:
relu(x)=max(0,x);以及
sta(x)=max(0,|x|-α);
然后將激活后的每個(gè)元素移位縮小2n倍,得到一個(gè)一維的第五矩陣m5,所述第五矩陣m5的行數(shù)為d,列數(shù)為1,所述第五矩陣m5中的元素值的取值范圍為
將所述第五矩陣m5的每個(gè)元素只保留整數(shù)位,得到所述第六矩陣m6。
優(yōu)選地,所述步驟s105替換為將所述第四矩陣m4的每個(gè)元素移位縮小2n倍后只保留整數(shù)位,得到所述第六矩陣m6,所述第六矩陣m6的行數(shù)為d,列數(shù)為1,所述第六矩陣m6中的每個(gè)所述元素值的取值范圍是
優(yōu)選地,所述步驟s106中包括:所述第七矩陣m7和第八矩陣m8中每個(gè)所述元素值的初始賦值均為0。
優(yōu)選地,所述步驟s107中所述第九矩陣m9和所述步驟s108中的第十矩陣m10中的每一行的元素所代表的所述字符按照相同的字符順序沿列方向自上而下進(jìn)行排列。
優(yōu)選地,所述步驟s112替換為:將所述第十二矩陣m12除以調(diào)整后的所述過程參數(shù)num得到一個(gè)一維的第十三矩陣m13,調(diào)整所述過程參數(shù)num的方法為對所述過程參數(shù)num加1求和,所述第十三矩陣m13的行數(shù)為1,列數(shù)為d,所述第十三矩陣m13中的元素值的取值范圍為
優(yōu)選地,所述帶有字符圖形的灰度圖片代表阿拉伯?dāng)?shù)字字符、英文字母字符、中文字符、日文字符、韓文字符中的至少一類。
優(yōu)選地,所述灰度圖片包括a行、b列像素,所述神經(jīng)網(wǎng)絡(luò)至少包括a×b個(gè)神經(jīng)元構(gòu)成的輸入層、c個(gè)神經(jīng)元構(gòu)成的輸出層以及d個(gè)神經(jīng)元構(gòu)成的隱藏層。
根據(jù)本發(fā)明的另一個(gè)方面,提供適用于灰度圖片的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法,所述神經(jīng)網(wǎng)絡(luò)包括大量的神經(jīng)元,將大量帶有字符圖形的灰度圖片分別提供給所述神經(jīng)元進(jìn)行學(xué)習(xí),所述灰度圖片中包含c種字符,c屬于常數(shù),包括以下步驟:
s201、將一灰度圖片預(yù)處理,根據(jù)所述灰度圖片中的像素排列和字符圖形,將所述灰度圖片轉(zhuǎn)化為一個(gè)二維的第一矩陣m1,所述第一矩陣m1的行數(shù)為a,列數(shù)為b,a、b均為大于1的常數(shù),所述第一矩陣m1中的每個(gè)所述元素值的取值范圍為[0,255]之間的整數(shù);
s202、將所述第一矩陣轉(zhuǎn)化為一個(gè)一維的第二矩陣m2,所述第二矩陣m2的行數(shù)為a×b,列數(shù)為1,所述第二矩陣m2中的每個(gè)所述元素值的取值范圍為[0,255]之間的整數(shù);
s203、通過同一隨機(jī)種子生成二值化的隨機(jī)編碼矩陣來建立一個(gè)二維的第三矩陣m3,所述第三矩陣m3的行數(shù)為d,d屬于大于0的整數(shù),列數(shù)為a×b,所述第三矩陣m3中的每個(gè)所述元素值為1或-1;
s204、將所述第三矩陣m3乘以第二矩陣m2,得到一個(gè)一維的第四矩陣m4,所述第四矩陣m4的行數(shù)為d,列數(shù)為1,所述第四矩陣m4中的每個(gè)所述元素值的取值范圍為[-255×(a×b),+255×(a×b)]的整數(shù);
s205、通過激活函數(shù)調(diào)整所述第四矩陣m4,并且將每個(gè)所述元素值移位縮小2n倍后只保留整數(shù)位,n為可變參數(shù),n屬于整數(shù),得到一個(gè)一維的第六矩陣m6,所述第六矩陣m6的行數(shù)為d,列數(shù)為1,所述第六矩陣m6中的每個(gè)所述元素值的取值范圍是
s206、預(yù)設(shè)一二維的第七矩陣m7,所述第七矩陣m7的行數(shù)為c,列數(shù)為d,二值化的所述第七矩陣m7中的每個(gè)所述元素值為-1或+1;并且預(yù)設(shè)一二維的第八矩陣m8,所述第八矩陣m8的行數(shù)為c,列數(shù)為d,所述第八矩陣m8中的每個(gè)所述元素值的取值范圍是[-1,+1]之間的浮點(diǎn)數(shù);
s207、所述第七矩陣m7乘以所述第四矩陣m4,得到一個(gè)一維的第九矩陣m9,所述第九矩陣m9的行數(shù)為c,列數(shù)為1,所述第九矩陣m9中的每個(gè)所述元素值的取值范圍是
s208、判斷所述預(yù)測字符是否等于當(dāng)前所述灰度圖片的字符,若是,則預(yù)測字符準(zhǔn)確,若否,則預(yù)測字符錯(cuò)誤。
優(yōu)選地,所述步驟s201包括:所述第一矩陣中的每個(gè)元素各自對應(yīng)所述灰度圖片中的一個(gè)像素點(diǎn),每個(gè)所述像素點(diǎn)對應(yīng)的所述第一矩陣中的元素值為取值范圍為[0,255]之間的整數(shù)。優(yōu)選地,所述步驟s202包括:將二維的第一矩陣中每一行首尾相連形成一維的第二矩陣,其中所述第一矩陣的每一行的尾端銜接下一行的首端。
優(yōu)選地,d=a×b×e,e的取值范圍是[5,20]之間的整數(shù)。
優(yōu)選地,d=a×b×10。
優(yōu)選地,所述步驟s205包括:根據(jù)以下四個(gè)激活函數(shù)中的任意一種激活所述第四矩陣m4的每一個(gè)元素,所述激活函數(shù)包括:
relu(x)=max(0,x);以及sta(x)=max(0,|x|-α);
然后將激活后的每個(gè)元素移位縮小2n倍,得到一個(gè)一維的第五矩陣m5,所述第五矩陣m5的行數(shù)為d,列數(shù)為1,所述第五矩陣m5中的元素值的取值范圍為
將所述第五矩陣m5的每個(gè)元素只保留整數(shù)位,得到所述第六矩陣m6。
優(yōu)選地,所述步驟s205替換為將所述第四矩陣m4的每個(gè)元素移位縮小2n倍后只保留整數(shù)位,得到所述第六矩陣m6,所述第六矩陣m6的行數(shù)為d,列數(shù)為1,所述第六矩陣m6中的每個(gè)所述元素值的取值范圍是
優(yōu)選地,所述步驟s206中包括:所述第七矩陣m7和第八矩陣m8中每個(gè)所述元素值的初始賦值均為0。
本發(fā)明的適用于灰度圖片的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法以及訓(xùn)練方法,克服了現(xiàn)有技術(shù)的困難,能夠通過二值化矩陣和浮點(diǎn)數(shù)矩陣的交替使用,減小了矩陣運(yùn)算時(shí)的字節(jié)數(shù),加快運(yùn)算速度,大大降低了對運(yùn)算設(shè)備的要求。
附圖說明
以下結(jié)合附圖和具體實(shí)施例對本發(fā)明的技術(shù)方案進(jìn)行詳細(xì)的說明,以使本發(fā)明的特性和優(yōu)點(diǎn)更為明顯。
圖1為本發(fā)明的神經(jīng)網(wǎng)絡(luò)示意圖;
圖2為本發(fā)明的學(xué)習(xí)方法中灰度圖片的示意圖;
圖3為本發(fā)明的適用于灰度圖片的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法的流程圖;
圖4為本發(fā)明的學(xué)習(xí)方法中灰度圖片的預(yù)處理的示意圖;
圖5為本發(fā)明的學(xué)習(xí)方法中第一矩陣m1的示意圖;
圖6為本發(fā)明的學(xué)習(xí)方法中第二矩陣m2的示意圖;
圖7為本發(fā)明的學(xué)習(xí)方法中第三矩陣m3的示意圖;
圖8為本發(fā)明的學(xué)習(xí)方法中第四矩陣m4的示意圖;
圖9為本發(fā)明的學(xué)習(xí)方法中第五矩陣m5的示意圖;
圖10為本發(fā)明的學(xué)習(xí)方法中第六矩陣m6的示意圖;
圖11為本發(fā)明的學(xué)習(xí)方法中第七矩陣m7的示意圖;
圖12為本發(fā)明的學(xué)習(xí)方法中第八矩陣m8的示意圖;
圖13為本發(fā)明的學(xué)習(xí)方法中第九矩陣m9的示意圖;
圖14為本發(fā)明的學(xué)習(xí)方法中第十矩陣m10的示意圖;
圖15為本發(fā)明的學(xué)習(xí)方法中第十一矩陣m11的示意圖;
圖16為本發(fā)明的學(xué)習(xí)方法中第十二矩陣m12的示意圖;
圖17為本發(fā)明的學(xué)習(xí)方法中第十三矩陣m13的示意圖;
圖18為本發(fā)明的學(xué)習(xí)方法中第十四矩陣m14的示意圖;
圖19為本發(fā)明的學(xué)習(xí)方法中第十五矩陣m15的示意圖;
圖20為本發(fā)明的學(xué)習(xí)方法中第十六矩陣m16的示意圖;以及
圖21為本發(fā)明的適用于灰度圖片的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法的流程圖。
具體實(shí)施方式
以下將對本發(fā)明的實(shí)施例給出詳細(xì)的說明。盡管本發(fā)明將結(jié)合一些具體實(shí)施方式進(jìn)行闡述和說明,但需要注意的是本發(fā)明并不僅僅只局限于這些實(shí)施方式。相反,對本發(fā)明進(jìn)行的修改或者等同替換,均應(yīng)涵蓋在本發(fā)明的權(quán)利要求范圍當(dāng)中。
另外,為了更好的說明本發(fā)明,在下文的具體實(shí)施方式中給出了眾多的具體細(xì)節(jié)。本領(lǐng)域技術(shù)人員將理解,沒有這些具體細(xì)節(jié),本發(fā)明同樣可以實(shí)施。在另外一些實(shí)例中,對于大家熟知的結(jié)構(gòu)和部件未作詳細(xì)描述,以便于凸顯本發(fā)明的主旨。
圖1為本發(fā)明的神經(jīng)網(wǎng)絡(luò)示意圖,如圖1所示,本發(fā)明中的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)圖片樣本。其中,神經(jīng)網(wǎng)絡(luò)可以分為輸入層10,隱藏層20和輸出層30。神經(jīng)網(wǎng)絡(luò)是一種模仿生物神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的計(jì)算模型,由大量的神經(jīng)元按一定的拓?fù)溥B接構(gòu)成,每個(gè)神經(jīng)元代表著一個(gè)激勵(lì)函數(shù),神經(jīng)元之間的連接稱為權(quán)值(例如:圖1中的a、b、c、d、e、f、g、h、i、j、k、l、m,但不以此為限)。輸入數(shù)據(jù)從神經(jīng)網(wǎng)絡(luò)的輸入層10進(jìn)入,從神經(jīng)網(wǎng)絡(luò)的輸出層30輸出結(jié)果。通過對已知的數(shù)據(jù)進(jìn)行訓(xùn)練,改變神經(jīng)網(wǎng)絡(luò)的權(quán)值,從而使其對未知的數(shù)據(jù)有預(yù)測的結(jié)果。
本實(shí)施例子通過讓神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí)大量帶有不同阿拉伯?dāng)?shù)字(即分別帶有數(shù)字“0”、“1”、“2”、“3”、“4”、“5”、“6”、“7”、“8”、“9”十個(gè)數(shù)字為例)的灰度圖片,來教會(huì)神經(jīng)網(wǎng)絡(luò)如何從圖片中識(shí)別這十個(gè)阿拉伯?dāng)?shù)字。具體來說,本實(shí)施例中所指的灰度圖片是指使用黑色調(diào)表示物體,即用黑色為基準(zhǔn)色,不同的飽和度的黑色來顯示圖像,其中每個(gè)像素點(diǎn)的灰度值的范圍都是由0至255,但不以此為限。帶有“0”字符圖案的灰度圖片的字符是0,帶有“1”字符圖案的灰度圖片的字符是1,帶有“2”字符圖案的灰度圖片的字符是2……以此類推。相當(dāng)于讓神經(jīng)元知道哪些圖片是帶有“0”的灰度圖片;哪些圖片是帶有“1”的灰度圖片;哪些圖片是帶有“2”的灰度圖片…等等。
本發(fā)明中神經(jīng)網(wǎng)絡(luò)包括大量的神經(jīng)元,將大量帶有字符圖形的灰度圖片分別提供給神經(jīng)元進(jìn)行學(xué)習(xí),灰度圖片中包含c種字符,c屬于常數(shù),本發(fā)明首先建立對應(yīng)灰度圖片尺寸的神經(jīng)網(wǎng)絡(luò)?;叶葓D片包括a行、b列像素,神經(jīng)網(wǎng)絡(luò)至少包括a×b個(gè)神經(jīng)元構(gòu)成的輸入層、c個(gè)神經(jīng)元構(gòu)成的輸出層以及d個(gè)神經(jīng)元構(gòu)成的隱藏層。圖2為本發(fā)明的學(xué)習(xí)方法中灰度圖片的示意圖。帶有字符圖形的灰度圖片代表阿拉伯?dāng)?shù)字字符、英文字母字符、中文字符、日文字符、韓文字符中的至少一類,以下以阿拉伯?dāng)?shù)字字符為例,本發(fā)明的神經(jīng)網(wǎng)絡(luò)進(jìn)行阿拉伯?dāng)?shù)字字符的學(xué)習(xí)。如圖2所示,以灰度圖片是一張28×28個(gè)像素的帶有“2”字符圖案150的灰度圖片100為例但不以此為限。(在其他變形例中,灰度圖片也可以是24×24個(gè)像素、32×32個(gè)像素、40×40個(gè)像素等)神經(jīng)網(wǎng)絡(luò)都包含輸入層,一層隱藏層和輸出層。神經(jīng)網(wǎng)絡(luò)的輸入層的維度為784*1(以一維矩陣形式輸入,對應(yīng)28*28的矩陣)28*28。本發(fā)明中的隱藏層神經(jīng)元個(gè)數(shù)可以是輸入層的10倍,例如:7840,但不以此為限。輸出層有10個(gè)神經(jīng)元,用來識(shí)別10個(gè)阿拉伯?dāng)?shù)字,判斷該灰度圖片中的具體數(shù)字是10個(gè)阿拉伯?dāng)?shù)字中的哪一個(gè)。
圖3為本發(fā)明的適用于灰度圖片的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法的流程圖。如圖3所示,本發(fā)明的適用于灰度圖片的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法包括以下步驟:
s101、將一代表阿拉伯?dāng)?shù)字”2”的灰度圖片預(yù)處理。圖4為本發(fā)明的學(xué)習(xí)方法中灰度圖片的預(yù)處理的示意圖。如圖4所示,根據(jù)灰度圖片100中的像素排列和字符圖形,其中,第一矩陣中的每個(gè)元素各自對應(yīng)灰度圖片中的一個(gè)像素點(diǎn),若像素點(diǎn)屬于字符圖形(屬于阿拉伯?dāng)?shù)字”2”的點(diǎn)),則該像素點(diǎn)對應(yīng)的第一矩陣中的元素值較高(如虛線內(nèi)區(qū)域160內(nèi)絕大部分元素值都大于等于190,但不以此為限)。若像素點(diǎn)不屬于字符圖形(不屬于阿拉伯?dāng)?shù)字”2”的點(diǎn)),則該像素點(diǎn)對應(yīng)的第一矩陣中的元素值較低,(如虛線外與實(shí)線框之間的區(qū)域160之間絕大部分元素值小于190,但不以此為限)。從而將灰度圖片轉(zhuǎn)化為一個(gè)二維的第一矩陣m1。圖5為本發(fā)明的學(xué)習(xí)方法中第一矩陣m1的示意圖,如圖5所示,第一矩陣m1的行數(shù)為a,列數(shù)為b,a、b均為大于1的常數(shù),第一矩陣m1中的每個(gè)元素值的取值范圍為[0,255]之間的整數(shù),這里的[0,255]是對應(yīng)該像素點(diǎn)的灰度值。由于灰度圖片具有28×28個(gè)像素,所以第一矩陣m1的行數(shù)為28,列數(shù)為28。
s102、將第一矩陣轉(zhuǎn)化為一個(gè)一維的第二矩陣m2。圖6為本發(fā)明的學(xué)習(xí)方法中第二矩陣m2的示意圖,如圖6所示,第二矩陣m2的行數(shù)為a×b=784,列數(shù)為1,第二矩陣m2中的每個(gè)元素值的取值范圍為[0,255]之間的整數(shù)。本發(fā)明中將二維的第一矩陣中每一行首尾相連形成一維的第二矩陣,其中第一矩陣的每一行的尾端銜接下一行的首端,但不以此為限。
s103、通過同一隨機(jī)種子生成二值化的隨機(jī)編碼矩陣來建立一個(gè)二維的第三矩陣m3。圖7為本發(fā)明的學(xué)習(xí)方法中第三矩陣m3的示意圖,如圖7所示,第三矩陣m3的行數(shù)為d,d屬于大于0的整數(shù),列數(shù)為a×b=784,第三矩陣m3中的每個(gè)元素值為1或-1。本發(fā)明中的d=a×b×e,e為大于1的整數(shù)。在一個(gè)優(yōu)選方案中,e的取值范圍是[5,20]之間的整數(shù)。本實(shí)施例中e=10,則d=a×b×10=7840。則第三矩陣m3的行數(shù)為7840,列數(shù)為784。
s104、將第三矩陣m3乘以第二矩陣m2,得到一個(gè)一維的第四矩陣m4。圖8為本發(fā)明的學(xué)習(xí)方法中第四矩陣m4的示意圖,如圖8所示,第四矩陣m4的行數(shù)為d=7840,列數(shù)為1,第四矩陣m4中的每個(gè)元素值的取值范圍為[-255×(a×b),+255×(a×b)]的整數(shù),即取值范圍等于[-199920,+199920]。
s105、通過激活函數(shù)調(diào)整第四矩陣m4,并且將每個(gè)元素值移位縮小2n倍后只保留整數(shù)位,n為可變參數(shù),n屬于整數(shù),得到一個(gè)一維的第六矩陣m6,第六矩陣m6的行數(shù)為d=7840,列數(shù)為1,第六矩陣m6中的每個(gè)元素值的取值范圍是
relu(x)=max(0,x)。以及
sta(x)=max(0,|x|-α)。
然后將激活后的每個(gè)元素移位縮小2n倍,得到一個(gè)一維的第五矩陣m5。第五矩陣m5的行數(shù)為d=7840,列數(shù)為1,第五矩陣m5中的元素值的取值范圍為
本實(shí)施例中,n=5,則將每個(gè)元素值移位縮小25倍后只保留整數(shù)位,并且選擇用sta(x)=max(0,|x|-α)來激活第四矩陣m4,α=0,得到第五矩陣m5。圖9為本發(fā)明的學(xué)習(xí)方法中第五矩陣m5的示意圖,如圖9所示,第五矩陣m5的行數(shù)為d=7840,列數(shù)為1。將第五矩陣m5的每個(gè)元素只保留整數(shù)位,得到第六矩陣m6。圖10為本發(fā)明的學(xué)習(xí)方法中第六矩陣m6的示意圖,如圖10所示,第六矩陣m6的行數(shù)為d=7840,列數(shù)為1。本發(fā)明可以通過移位縮小2n倍,將元素值的小數(shù)點(diǎn)右移后,再通過激活函數(shù)轉(zhuǎn)化為浮點(diǎn)數(shù),最后只保留整數(shù)位,通過這個(gè)轉(zhuǎn)化過程,將第四矩陣m4中每個(gè)元素值進(jìn)行了有效地縮小,并且最后依然保留了整數(shù)位,以便于后續(xù)的矩陣乘法計(jì)算,減小了矩陣運(yùn)算時(shí)的字節(jié)數(shù),加快運(yùn)算速度,大大降低了對運(yùn)算設(shè)備的要求。
在一個(gè)優(yōu)選例中,步驟s105替換為將第四矩陣m4的每個(gè)元素移位縮小2n倍后只保留整數(shù)位,得到第六矩陣m6,第六矩陣m6的行數(shù)為d=7840,列數(shù)為1,第六矩陣m6中的每個(gè)元素值的取值范圍是
s106、圖11為本發(fā)明的學(xué)習(xí)方法中第七矩陣m7的示意圖。如圖11所示,建立一二維的第七矩陣m7,第七矩陣m7的行數(shù)為c=10,列數(shù)為d=7840,二值化的第七矩陣m7中的每個(gè)元素值為-1或+1。并且圖12為本發(fā)明的學(xué)習(xí)方法中第八矩陣m8的示意圖。如圖12所示,建立一二維的第八矩陣m8,第八矩陣m8的行數(shù)為c=10,列數(shù)為d=7840,第八矩陣m8中的每個(gè)元素值的取值范圍是[-1,+1]之間的浮點(diǎn)數(shù)。第七矩陣m7和第八矩陣m8中每個(gè)元素值的初始賦值均為0。
s107、第七矩陣m7乘以第四矩陣m4,得到一個(gè)一維的第九矩陣m9。圖13為本發(fā)明的學(xué)習(xí)方法中第九矩陣m9的示意圖。如圖13所示,第九矩陣m9的行數(shù)為c=10,列數(shù)為1,第九矩陣m9中的每個(gè)元素值的取值范圍是
s108、得到代表當(dāng)前灰度圖片的字符的一維的第十矩陣m10,第十矩陣m10的行數(shù)為c=10,列數(shù)為1,第十矩陣m10中的每一行的元素代表一種字符,第十矩陣m10中代表當(dāng)前灰度圖片的字符的行的元素值為0或2m,m為可變參數(shù),m屬于整數(shù),其余行的元素值為0。步驟s107第九矩陣m9中的和步驟s108中的第十矩陣m10中的每一行的元素所代表的字符按照相同的字符順序沿列方向自上而下進(jìn)行排列,例如:第九矩陣m9和第十矩陣m10中都是第一行代表阿拉伯?dāng)?shù)字”0”;第二行代表阿拉伯?dāng)?shù)字“1”;第三行代表阿拉伯?dāng)?shù)字“2”;第四行代表阿拉伯?dāng)?shù)字“3”;第五行代表阿拉伯?dāng)?shù)字“4”;第六行代表阿拉伯?dāng)?shù)字“5”;第七行代表阿拉伯?dāng)?shù)字“6”;第八行代表阿拉伯?dāng)?shù)字“7”;第九行代表阿拉伯?dāng)?shù)字“8”;第十行代表阿拉伯?dāng)?shù)字“9”。并且,本實(shí)施例中,m=7,圖14為本發(fā)明的學(xué)習(xí)方法中第十矩陣m10的示意圖。如圖14所示,因?yàn)榈谑仃噈10的第四行的元數(shù)值是27=128,其余行的元數(shù)值都是0,所以當(dāng)前灰度圖片的字符是阿拉伯?dāng)?shù)字的“2”(圖14中只有第三行有數(shù)字“128”,其余每行都是“0”,第三行代表阿拉伯?dāng)?shù)字“2”)。
s109、將第十矩陣m10減去第九矩陣m9,得到一個(gè)表示誤差的一維的第十一矩陣m11。圖15為本發(fā)明的學(xué)習(xí)方法中第十一矩陣m11的示意圖。如圖15所示,第十一矩陣m11的行數(shù)為c=10,列數(shù)為1,第十一矩陣m11中的每個(gè)元素值的取值范圍是
s110、計(jì)算第六矩陣m6的轉(zhuǎn)置矩陣,得到一個(gè)一維的第十二矩陣m12。圖16為本發(fā)明的學(xué)習(xí)方法中第十二矩陣m12的示意圖。如圖16所示,第十二矩陣m12的行數(shù)為1,列數(shù)為d=7840,第十二矩陣m12中的元素值的取值范圍為
s111、將第六矩陣m6乘以第十二矩陣m12得到一過程參數(shù)num,過程參數(shù)num屬于整數(shù)。本實(shí)施例中,過程參數(shù)num=m12*m6=101269224461.000。
s112、將第十二矩陣m12除以過程參數(shù)num得到一個(gè)一維的第十三矩陣m13。圖17為本發(fā)明的學(xué)習(xí)方法中第十三矩陣m13的示意圖。如圖17所示,第十三矩陣m13的行數(shù)為1,列數(shù)為d=7840,第十三矩陣m13中的元素值的取值范圍為
s113、將第十一矩陣m11乘以第十三矩陣m13,得到一個(gè)二維的第十四矩陣m14。圖18為本發(fā)明的學(xué)習(xí)方法中第十四矩陣m14的示意圖。如圖18所示,第十四矩陣m14的行數(shù)為c=10,列數(shù)為d=7840,第十四矩陣m14中的元素值的取值范圍為
s114、將第十四矩陣m14與第八矩陣m8相加,得到一個(gè)第十五矩陣m15,圖19為本發(fā)明的學(xué)習(xí)方法中第十五矩陣m15的示意圖。如圖19所示,將當(dāng)前的第八矩陣m8更新為第十五矩陣m15,第十五矩陣m15的行數(shù)為c=10,列數(shù)為d=7840,第十五矩陣m15中的元素值的取值范圍為
s115、將第十五矩陣m15進(jìn)行二值化,將第十五矩陣m15中大于0的元素值轉(zhuǎn)化為1,將第十五矩陣m15中小于等于0的元素值轉(zhuǎn)化為-1,得到一個(gè)第十六矩陣m16。圖20為本發(fā)明的學(xué)習(xí)方法中第十六矩陣m16的示意圖。如圖20所示,第十六矩陣m16的行數(shù)為c=10,列數(shù)為d=7840,第十六矩陣m16中的元素值為-1或1。將當(dāng)前的第七矩陣m7更新為第十六矩陣m16,至此完成了一次的學(xué)習(xí)過程,返回步驟s107,通過不斷循環(huán)步驟s107至步驟s115,第七矩陣m7和第八矩陣m8會(huì)被不斷更新,使得通過第七矩陣m7計(jì)算得到的第九矩陣m9越來越接近當(dāng)前灰度圖片所代表的阿拉伯?dāng)?shù)字”2”。在步驟s106開始始終都存在二維的第七矩陣m7(二值化“1”和“-1”)和二維的第八矩陣m8(浮點(diǎn)數(shù)),并且后續(xù)計(jì)算中,僅僅使用第七矩陣m7來進(jìn)行乘積,而第八矩陣m8(浮點(diǎn)數(shù))不會(huì)進(jìn)行直接進(jìn)行乘法或是加法運(yùn)算,第十五矩陣m15(浮點(diǎn)數(shù))僅僅用于通過二值化轉(zhuǎn)化為新的第七矩陣m7。從而避免了帶有大量浮點(diǎn)數(shù)的矩陣相乘而產(chǎn)生的大數(shù)據(jù)量的運(yùn)算,通過二值化矩陣和浮點(diǎn)數(shù)矩陣的交替使用,減小了矩陣運(yùn)算時(shí)的字節(jié)數(shù),加快運(yùn)算速度,大大降低了對運(yùn)算設(shè)備的要求。
相對地,在本方法中如果不設(shè)置相對應(yīng)的二值化矩陣(第七矩陣m7)和浮點(diǎn)數(shù)矩陣(第八矩陣m8),就會(huì)在步驟s107中進(jìn)行帶有大量浮點(diǎn)數(shù)的矩陣相乘而產(chǎn)生的大數(shù)據(jù)量的運(yùn)算,大大增加了矩陣運(yùn)算時(shí)的字節(jié)數(shù),減慢了運(yùn)算速度。
在本發(fā)明的適用于灰度圖片的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法的基礎(chǔ)上,進(jìn)行計(jì)算變形或是計(jì)算順序的調(diào)整的技術(shù)方案也了落在本發(fā)明的保護(hù)范圍之內(nèi)。
圖21為本發(fā)明的適用于灰度圖片的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法的流程圖。如圖21所示,本發(fā)明的適用于灰度圖片的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法包括以下步驟:
s201、將一代表阿拉伯?dāng)?shù)字“2”的灰度圖片預(yù)處理。圖4為本發(fā)明的學(xué)習(xí)方法中灰度圖片的預(yù)處理的示意圖。如圖4所示,根據(jù)灰度圖片100中的像素排列和字符圖形,其中,第一矩陣中的每個(gè)元素各自對應(yīng)灰度圖片中的一個(gè)像素點(diǎn),若像素點(diǎn)屬于字符圖形(屬于阿拉伯?dāng)?shù)字”2”的點(diǎn)),則該像素點(diǎn)對應(yīng)的第一矩陣中的元素值較高(如虛線內(nèi)區(qū)域160內(nèi)絕大部分元素值都大于等于190,但不以此為限)。若像素點(diǎn)不屬于字符圖形(不屬于阿拉伯?dāng)?shù)字”2”的點(diǎn)),則該像素點(diǎn)對應(yīng)的第一矩陣中的元素值較低,(如虛線外與實(shí)線框之間的區(qū)域160之間絕大部分元素值小于190,但不以此為限)。從而將灰度圖片轉(zhuǎn)化為一個(gè)二維的第一矩陣m1。圖5為本發(fā)明的學(xué)習(xí)方法中第一矩陣m1的示意圖,如圖5所示,第一矩陣m1的行數(shù)為a,列數(shù)為b,a、b均為大于1的常數(shù),第一矩陣m1中的每個(gè)元素值的取值范圍為[0,255]之間的整數(shù)。由于灰度圖片具有28×28個(gè)像素,所以第一矩陣m1的行數(shù)為28,列數(shù)為28。
s202、將第一矩陣轉(zhuǎn)化為一個(gè)一維的第二矩陣m2。圖6為本發(fā)明的學(xué)習(xí)方法中第二矩陣m2的示意圖,如圖6所示,第二矩陣m2的行數(shù)為a×b=784,列數(shù)為1,第二矩陣m2中的每個(gè)元素值的取值范圍為[0,255]之間的整數(shù)。本發(fā)明中將二維的第一矩陣中每一行首尾相連形成一維的第二矩陣,其中第一矩陣的每一行的尾端銜接下一行的首端,但不以此為限。
s203、通過同一隨機(jī)種子生成二值化的隨機(jī)編碼矩陣來建立一個(gè)二維的第三矩陣m3。圖7為本發(fā)明的學(xué)習(xí)方法中第三矩陣m3的示意圖,如圖7所示,第三矩陣m3的行數(shù)為d=7840,d屬于大于0的整數(shù),列數(shù)為a×b=784,第三矩陣m3中的每個(gè)元素值為1或-1。本發(fā)明中的d=a×b×e,e為大于1的整數(shù)。在一個(gè)優(yōu)選方案中,e的取值范圍是[5,20]之間的整數(shù)。本實(shí)施例中e=10,則d=a×b×10=7840。則第三矩陣m3的行數(shù)為7840,列數(shù)為784。
s204、將第三矩陣m3乘以第二矩陣m2,得到一個(gè)一維的第四矩陣m4。圖8為本發(fā)明的學(xué)習(xí)方法中第四矩陣m4的示意圖,如圖8所示,第四矩陣m4的行數(shù)為d=7840,列數(shù)為1,第四矩陣m4中的每個(gè)元素值的取值范圍為[-255×(a×b),+255×(a×b)]的整數(shù),即取值范圍等于[-199920,+199920]。
s205、通過激活函數(shù)調(diào)整第四矩陣m4,并且將每個(gè)元素值移位縮小2n倍后只保留整數(shù)位,n為可變參數(shù),n屬于整數(shù),得到一個(gè)一維的第六矩陣m6,第六矩陣m6的行數(shù)為d=7840,列數(shù)為1,第六矩陣m6中的每個(gè)元素值的取值范圍是
relu(x)=max(0,x)。以及
sta(x)=max(0,|x|-α)。
然后將激活后的每個(gè)元素移位縮小2n倍,得到一個(gè)一維的第五矩陣m5。第五矩陣m5的行數(shù)為d=7840,列數(shù)為1,第五矩陣m5中的元素值的取值范圍為
本實(shí)施例中,n=5,則將每個(gè)元素值移位縮小25倍后只保留整數(shù)位,并且選擇用sta(x)=max(0,|x|-α)來激活第四矩陣m4,α=0,得到第五矩陣m5。圖9為本發(fā)明的學(xué)習(xí)方法中第五矩陣m5的示意圖,如圖9所示,第五矩陣m5的行數(shù)為d=7840,列數(shù)為1。將第五矩陣m5的每個(gè)元素只保留整數(shù)位,得到第六矩陣m6。圖10為本發(fā)明的學(xué)習(xí)方法中第六矩陣m6的示意圖,如圖10所示,第六矩陣m6的行數(shù)為d=7840,列數(shù)為1。本發(fā)明可以通過移位縮小2n倍,將元素值的小數(shù)點(diǎn)右移后,再通過激活函數(shù)轉(zhuǎn)化為浮點(diǎn)數(shù),最后只保留整數(shù)位,通過這個(gè)轉(zhuǎn)化過程,將第四矩陣m4中每個(gè)元素值進(jìn)行了有效地縮小,并且最后依然保留了整數(shù)位,以便于后續(xù)的矩陣乘法計(jì)算,減小了矩陣運(yùn)算時(shí)的字節(jié)數(shù),加快運(yùn)算速度,大大降低了對運(yùn)算設(shè)備的要求。
在一個(gè)優(yōu)選例中,步驟s205替換為將第四矩陣m4的每個(gè)元素移位縮小2n倍后只保留整數(shù)位,得到第六矩陣m6,第六矩陣m6的行數(shù)為d=7840,列數(shù)為1,第六矩陣m6中的每個(gè)元素值的取值范圍是
s206、圖11為本發(fā)明的學(xué)習(xí)方法中第七矩陣m7的示意圖。如圖11所示,建立一二維的第七矩陣m7,第七矩陣m7的行數(shù)為c=10,列數(shù)為d=7840,二值化的第七矩陣m7中的每個(gè)元素值為-1或+1。并且圖12為本發(fā)明的學(xué)習(xí)方法中第八矩陣m8的示意圖。如圖12所示,建立一二維的第八矩陣m8,第八矩陣m8的行數(shù)為c=10,列數(shù)為d=7840,第八矩陣m8中的每個(gè)元素值的取值范圍是[-1,+1]之間的浮點(diǎn)數(shù)。第七矩陣m7和第八矩陣m8中每個(gè)元素值的初始賦值均為0。
s207、第七矩陣m7乘以第四矩陣m4,得到一個(gè)一維的第九矩陣m9。圖13為本發(fā)明的學(xué)習(xí)方法中第九矩陣m9的示意圖。如圖13所示,第九矩陣m9的行數(shù)為c=10,列數(shù)為1,第九矩陣m9中的每個(gè)元素值的取值范圍是
s208、判斷預(yù)測字符是否等于當(dāng)前灰度圖片的字符,若是,則預(yù)測字符準(zhǔn)確,若否,則預(yù)測字符錯(cuò)誤。本實(shí)施例中,第九矩陣m9中數(shù)值最大元素值“42044135”所在的第三行所代表的字符“2”作為預(yù)測字符,則預(yù)測字符準(zhǔn)確。
本發(fā)明的適用于灰度圖片的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法是適用于灰度圖片的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法的分布過程,可以在利用當(dāng)前第七矩陣m7的情況下進(jìn)行算法的驗(yàn)證,而不需要跟新第七矩陣m7和第八矩陣m8。本發(fā)明的適用于灰度圖片的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法可以不依賴于本發(fā)明的適用于灰度圖片的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法而獨(dú)立進(jìn)行,在本發(fā)明的適用于灰度圖片的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法的基礎(chǔ)上,進(jìn)行計(jì)算變形或是計(jì)算順序的調(diào)整的技術(shù)方案也了落在本發(fā)明的保護(hù)范圍之內(nèi)。
綜上可知,本發(fā)明的適用于灰度圖片的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法以及訓(xùn)練方法,克服了現(xiàn)有技術(shù)的困難,能夠通過二值化矩陣和浮點(diǎn)數(shù)矩陣的交替使用,減小了矩陣運(yùn)算時(shí)的字節(jié)數(shù),加快運(yùn)算速度,大大降低了對運(yùn)算設(shè)備的要求。
以上僅是本發(fā)明的具體應(yīng)用范例,對本發(fā)明的保護(hù)范圍不構(gòu)成任何限制。除上述實(shí)施例外,本發(fā)明還可以有其它實(shí)施方式。凡采用等同替換或等效變換形成的技術(shù)方案,均落在本發(fā)明所要求保護(hù)的范圍之內(nèi)。