1.一種手寫滿文字母識別方法,其特征在于,包括:
分別采用方向特征提取方法和粗網絡特征提取方法對待識別的滿文字母圖像提取特征,得到滿文字母特征值;
采用LDA線性判決分析的方法對所述滿文字母特征值進行降維,得到降維后的滿文字母特征值;
采用K‐近鄰方法對所述降維后的滿文字母特征值進行分類處理,得到所述待識別的滿文字母圖像對應的滿文字母。
2.如權利要求1所述的手寫滿文字母識別方法,其特征在于,所述分別采用方向特征提取方法和粗網絡特征提取方法對待識別的滿文字母圖像提取特征,得到滿文字母特征值的方法,包括:
待識別的滿文字母圖像進行8方向特征提取,得到滿文字母的方向特征值;
對待識別的滿文字母圖像進行粗網絡特征提取,得到滿文字母的網格特征值;
將滿文字母的方向特征值和網格特征值組合為一列,得到滿文字母特征值。
3.如權利要求1所述的手寫滿文字母識別方法,其特征在于,所述采用K‐近鄰方法對所述降維后的滿文字母特征值進行分類處理,得到所述待識別的滿文字母圖像對應的滿文字母的方法,包括:
維護一個大小為k的按距離由大到小的優(yōu)先級隊列,用于存儲待識別元組。隨機從待識別元組中選取k個元組作為初始的最近鄰元組,分別計算測試元組到這k個元組的距離,將待識別元組標號和距離存入優(yōu)先級隊列;
遍歷訓練元組集,計算當前待識別元組與測試元組的距離,比較所得距離L與優(yōu)先級隊列中的最大距離Lmax,得到最終的優(yōu)先級隊列;
遍歷完畢,計算優(yōu)先級隊列中k個元組的多數(shù)類,并將其作為測試元組的類別。
4.如權利要求1所述的手寫滿文字母識別方法,其特征在于,所述采用LDA線性判決分析的方法對所述滿文字母特征值進行降維,得到降維后的滿文字母特征值的步驟中,降維矩陣的獲取方法,包括:
建立存儲滿文數(shù)據樣本的手寫滿文庫;
分別采用方向特征提取方法和粗網絡特征提取方法對手寫滿文庫中的滿文字母圖像提取特征,得到滿文字母特征值;分配數(shù)據空間存儲滿文字母特征值和標簽;
計算各類樣本期望以及總樣本期望;
計算類間協(xié)方差矩陣Sb及類內協(xié)方差矩陣Sw;
求矩陣Sw-1Sb的特征向量,得到投影向量。
5.如權利要求1所述的手寫滿文字母識別方法,其特征在于,所述采用K‐近鄰方法對所述降維后的滿文字母特征值進行分類處理,得到所述待識別的滿文字母圖像對應的滿文字母,k‐近鄰方法中的k值確定方法,包括:
建立存儲滿文數(shù)據樣本的手寫滿文庫;
分別采用方向特征提取方法和粗網絡特征提取方法對手寫滿文庫中的滿文字母圖像提取特征,得到滿文字母特征值;
采用LDA線性判決分析的方法對所述滿文字母特征值進行降維,得到降維后的滿文字母特征值;
分配數(shù)據空間分別存儲訓練數(shù)據和測試元組,預設參數(shù)K;
維護一個大小為k的按距離由大到小的優(yōu)先級隊列,用于存儲待識別元組,隨機從待識別元組中選取k個元組作為初始的最近鄰元組,分別計算測試元組到這k個元組的距離,將待識別元組標號和距離存入優(yōu)先級隊列;
遍歷訓練元組集,計算當前待識別元組與測試元組的距離,比較所得距離L與優(yōu)先級隊列中的最大距離Lmax,得到最終的優(yōu)先級隊列;
遍歷完畢,計算優(yōu)先級隊列中k個元組的多數(shù)類,并將其作為測試元組的類別。
測試元組集測試完畢后計算誤差率,繼續(xù)設定不同的K值重新訓練,最后取誤差率最小的K值。
6.如權利要求5所述的手寫滿文字母識別方法,其特征在于,k‐近鄰方法中的k值確定方法中的,所述對所述滿文字母特征值進行降維的步驟中,使用的降維矩陣的獲取方法,包括:
分配數(shù)據空間存儲滿文字母特征值和標簽;
計算各類樣本期望以及總樣本期望;
計算類間協(xié)方差矩陣Sb及類內協(xié)方差矩陣Sw;
求矩陣Sw-1Sb的特征向量,得到投影向量。
7.如權利要求3或5所述的手寫滿文字母識別方法,其特征在于,所述比較所得距離L與優(yōu)先級隊列中的最大距離Lmax,得到最終的優(yōu)先級隊列的方法,包括:
當所述所得距離L大于優(yōu)先級隊列中的最大距離Lmax時,則舍棄該元組,遍歷下一個元組。
當所述所得距離L小于優(yōu)先級隊列中的最大距離Lmax時,則刪除優(yōu)先級隊列中最大距離的元組,將當前訓練元組存入優(yōu)先級隊列。
8.如權利要求1‐7中任一項所述手寫滿文字母識別方法,其特征在于,所述對待識別的滿文字母圖像提取特征前,具有對待識別的滿文字母圖像樣本進行預處理的步驟。
9.如權利要求8中任一項所述手寫滿文字母識別方法,其特征在于,所述預處理,包括對滿文字母圖像進行字符大小的線性歸一化、加虛擬筆劃、字符的非線性歸一化、筆劃上的點的重采樣、筆劃上的點的平滑中的一種以上。