一種基于機器學習的數(shù)字式表計識別方法
【技術領域】
[0001] 本發(fā)明屬于電表設備技術領域,特別涉及一種基于機器學習的數(shù)字式表計識別方 法。
【背景技術】
[0002] 變電站是輸電和配電的集合點,是電力系統(tǒng)的重要組成部分。變電站需要記錄各 表計的讀數(shù)并監(jiān)測其相關狀態(tài)以保障電變站的正常運作和電力數(shù)據(jù)的收集、統(tǒng)計。變電站 中各種表計數(shù)目繁多,傳統(tǒng)人工抄表方式下,工作量大,效率低,不安全,不利于數(shù)據(jù)統(tǒng)計和 查詢,同時也無法實時對變電站中基礎電力設施進行監(jiān)控,造成了一定的安全隱患。
[0003] 隨著電子信息技術高速發(fā)展,各行各業(yè)都在走向數(shù)字化和智能化的今天,利用現(xiàn) 代化設備和識別算法,針對復雜的實際工業(yè)環(huán)境,實現(xiàn)自然場景下表計的智能讀數(shù)并記錄, 以高效安全的方式代替落后的傳統(tǒng)抄表方式有著非常重要的意義。
[0004] 實時監(jiān)控變電站中基礎電力設施,在第一時間發(fā)現(xiàn)并解決供電故障,以保證民用 和工業(yè)的穩(wěn)定供電十分重要。但是,現(xiàn)有的表計智能識別系統(tǒng)也大多基于ARM嵌入式系統(tǒng), 硬件成本高,通用性低,可移植性較差。
【發(fā)明內容】
[0005] 為了解決上述問題,本發(fā)明提供一種可在復雜環(huán)境下對數(shù)字式表計進行快速、可 靠、精確地遠程智能讀數(shù)的智能識別方法,采用如下技術方案:
[0006] 一種基于機器學習的數(shù)字式表計識別方法,其特征在于,包括以下步驟:
[0007] (1)對數(shù)字式表計的圖像進行預處理,得到有效區(qū)域;
[0008] (2)對有效區(qū)域進行圖像分割,獲得單個數(shù)字的圖像;
[0009] (3)使用支持向量機模型對單個數(shù)字樣本進行訓練;
[0010] (4)用訓練后的支持向量機模型為待識別的數(shù)字進行識別,得到數(shù)字表計的智能 讀數(shù)。
[0011]進一步地,步驟(4)中所述的為待識別的數(shù)字進行識別包括以下內容:
[0012] al.標定圖像有效識別區(qū)域;
[0013]a2.對有效區(qū)域進行分割,將圖像分割為統(tǒng)一大小的獨立數(shù)字圖像;
[0014]a3.將分割后的各圖像進行矩陣重組;
[0015]a4.用訓練后的支持向量機模型依次進行預測;
[0016]a5.計算即得到識別結果。
[0017] 本發(fā)明產生的有益效果如下:
[0018] 傳統(tǒng)的人工抄表方式,工作量大,效率低,不安全,不利于數(shù)據(jù)統(tǒng)計和查詢,同時也 無法實時對變電站中基礎電力設施進行監(jiān)控,造成了一定的安全隱患。而本發(fā)明提供的基 于機器學習的數(shù)字式表計識別方法,可以復雜環(huán)境下對機械式電表進行快速、可靠、精確地 遠程智能讀數(shù),可在變電站中進行廣泛的運用。
【附圖說明】
[0019] 圖1為訓練過程流程示意圖;
[0020] 圖2為預測過程流程示意圖。
【具體實施方式】
[0021] 下面參照附圖對本發(fā)明的實施方式進行詳細說明,但不限制本發(fā)明的保護范圍。
[0022] 實施例1
[0023] -種基于機器學習的數(shù)字式表計識別方法,主要采用如下方法:
[0024] 基于變電站的實際情況,對表計圖像預處理,用支持向量機對樣本圖像進行訓練, 并用于判斷待識別的表計圖像中的數(shù)字。對數(shù)字表計的識別主要分為訓練,預測兩個部分; 訓練數(shù)據(jù)集生成SVM模型,圖1所示為訓練過程流程示意圖。
[0025] 用訓練好的SVM模型對數(shù)字表計圖像進行預測(即識別),并給出預測結果,圖2 所示為識別過程流程示意圖:
[0026] 實施例2
[0027] 一種基于機器學習的數(shù)字式表計識別方法(基于SVM分類器),包括以下步驟:
[0028] (1)對數(shù)字式表計的圖像進行預處理,得到有效區(qū)域;
[0029] 對數(shù)字表計圖像進行標定,用配置工具獲得圖像中特定點的坐標值并存入xml配 置文件,在程序中讀入xml配置文件,獲得有效區(qū)域。
[0030] (2)對有效區(qū)域進行圖像分割,獲得單個數(shù)字的圖像;
[0031] 對有效區(qū)域進行分割,讀入特定點的坐標值,將有效區(qū)域分割為統(tǒng)一大小50*61 的三個獨立數(shù)字圖像,并對這些圖像文件進行分類整理,分別存入標簽為0-9的文件夾,作 為訓練樣本。
[0032] (3)使用支持向量機模型對單個數(shù)字樣本進行訓練;
[0033] 批量讀取用于訓練的數(shù)據(jù)圖像及其標簽,對圖像做平滑降噪處理。訪問圖像數(shù)據(jù), 獲得矩陣,遍歷圖像的每個像素點,對矩陣值做歸一化處理。將處理后的數(shù)據(jù)存為一個3050 維的行向量,作為訓練數(shù)據(jù)。關鍵代碼如下表所示:
[0035]
[0036]設置訓練參數(shù),包括SVM的類型,迭代終止準則,核函數(shù)類型,以及核函數(shù)的參數(shù) 等。SVM的類型參數(shù)有如下幾種:C_SVC是C類支持向量分類機,n類分組(n彡2),允許用 異常值懲罰因子C進行不完全分類,本文訓練采用的為C類支持向量機;EPS_SVR是e類支 持向量回歸機。訓練集中的特征向量和擬合出來的超平面的距離需要小于P,異常值懲罰因 子C被采用;NU_SVCv類支持向量分類機,n類似然不完全分類的分類器,參數(shù)為v取代C。 參數(shù)ternucrit是SVM的迭代訓練過程的中止條件,解決部分受約束二次最優(yōu)問題。引入 核函數(shù)用于減少(2. 13)式中因點積運算而產生的巨大的計算量和開銷。結果表明,訓練元 組中需點積運算的非線性映射函數(shù)完全等價于將核函數(shù)K(Xi,Xp應用于原輸入數(shù)據(jù)的效 果。即:
[0038] 所以,每次訓練時都可用K(Xi,Xj代替點積運算攀0;) ?◎(Ay),可供使用的核函 數(shù)有h次多項式核函數(shù),高級徑向基函數(shù)核函數(shù)(RBF)和S型核函數(shù)等。其中較為常用的是RBF核函數(shù),引入核函數(shù)的好處是可以將訓練樣本映射到更有利于可線性分割的樣本集,即 增加樣本向量的維度,核函數(shù)的參數(shù)有懲罰因子c和Y。幾種常用的核函數(shù)如1. 2式到1. 5 式所示:
[0043]a5.將訓練好的SVM模型保存為xml文件。
[0044] (4)用訓練后的支持向量機模型為待識別的數(shù)字進行識別,得到數(shù)字表計的智能 讀數(shù)。
[0045] 在已經(jīng)訓練并生成SVM模型的基礎上,對數(shù)字表計讀數(shù)的預測步驟如下:
[0046]al.對數(shù)字表計圖像進行標定,用配置工具獲得圖像中特定點的坐標值,此過程作 為圖片配置工作,將配置結果存入xml文件。
[0047]a2.讀入待識別表計圖像和xml配置文件,根據(jù)配置信息對圖像進行分割,分割為 統(tǒng)一大小50*61的三個獨立數(shù)字圖像。
[0048] a3.依次將三個待識別圖像作為測試數(shù)據(jù)輸入,用SVM模型對其進行預測,獲得三 個響應值,并計算得到最終預測結果。如1. 6式所示:
[0049]result=ResponsetestF*100+Responsetests*10+ResponsetestT (1. 6)
[0050]其中,ResponsetestF,ResponsetestdPlResponse加"分別是用SVM模型預測第一,二, 三個數(shù)字獲得的響應值,result是最后計算得到的結果,即表計識別結果。
[0051] 實施例3
[0052] 數(shù)字表計識別結果與分析如下:
[0053] 隨機選取40個數(shù)字表計圖像,分割后獲得120個訓練樣本,對這120個樣本進行 訓練,獲得支持向量機模型,并保存訓練數(shù)據(jù)。用其余40個表計圖像作測試樣本,測試結果 如下表所示:
[0055] 由上表可看出,RBF核函數(shù)較適合做支持向量機訓練所用核函數(shù)。通過對終止條 件,迭代次數(shù)及核函數(shù)參數(shù)的實驗,最終確定了最合適的參數(shù),即在保證了識別準確率的前 提下,訓練時間最短的參數(shù)組。
[0056] 無法準確識別的圖像大都是由于強烈光照或過于扭曲的拍攝角度獲取到的質量 較差的圖像。實驗發(fā)現(xiàn),當加入一些同等低質量的圖像做樣本集訓練后,此類質量較差的圖 像也可以被正確識別。即對于失敗案例的解決方法有兩種:一是不在強光照等惡劣環(huán)境下 采集圖像;二是可以在惡劣環(huán)境中采集適當圖像加入樣本集參與訓練,這樣訓練生成的支 持向量機模型可對此類低質量圖片準確識別。
【主權項】
1. 一種基于機器學習的數(shù)字式表計識別方法,其特征在于,包括以下步驟: (1) 對數(shù)字式表計的圖像進行預處理,得到有效區(qū)域; (2) 對有效區(qū)域進行圖像分割,獲得單個數(shù)字的圖像; (3) 使用支持向量機模型對單個數(shù)字樣本進行訓練; (4) 用訓練后的支持向量機模型為待識別的數(shù)字進行識別,得到數(shù)字表計的智能讀數(shù)。2. 根據(jù)權利要求1所述的基于機器學習的數(shù)字式表計識別方法,其特征在于,步驟(4) 中所述的為待識別的數(shù)字進行識別包括以下內容: al.標定圖像有效識別區(qū)域; a2.對有效區(qū)域進行分割,將圖像分割為統(tǒng)一大小的獨立數(shù)字圖像; a3.將分割后的各圖像進行矩陣重組; a4.用訓練后的支持向量機模型依次進行預測; a5.計算即得到識別結果。
【專利摘要】本發(fā)明提供一種基于機器學習的數(shù)字式表計識別方法,屬于電表設備技術領域。為了解決傳統(tǒng)的人工抄表方式,工作量大,效率低,不安全,不利于數(shù)據(jù)統(tǒng)計和查詢的問題。本發(fā)明提供一種基于機器學習的數(shù)字式表計識別方法,主要包括以下內容:首先對表計圖像預處理得到有效區(qū)域,進而對有效區(qū)域進行圖像分割,獲得單個數(shù)字的圖像。使用支持向量機模型對單個數(shù)字樣本進行訓練,用訓練后的支持向量機模型為待識別的數(shù)字進行識別,從而完成數(shù)字表計的智能讀數(shù)。本發(fā)明提供的基于機器學習的數(shù)字式表計識別方法,可以在復雜環(huán)境下對數(shù)字式表計進行快速、可靠、精確地遠程智能讀數(shù),可在變電站中進行廣泛的運用。
【IPC分類】G06K9/62, G06K9/34
【公開號】CN104899587
【申請?zhí)枴緾N201510342718
【發(fā)明人】張蕾, 章毅
【申請人】四川大學
【公開日】2015年9月9日
【申請日】2015年6月19日