本發(fā)明屬于停車檢測技術(shù)領(lǐng)域,尤其涉及一種停車檢測系統(tǒng)及檢測方法。
背景技術(shù):
目前的停車檢測系統(tǒng)大概可以分為兩種:一種是封閉式的停車場,在進出時通過rfid卡片來進行計時;另一種是開放式的路邊停車場,大多通過人工計時來進行收費管理。這些停車檢測方式都存在著耗費人工、計時不準(zhǔn)確等問題。隨著技術(shù)的發(fā)展和進步,地磁傳感器開始逐漸應(yīng)用到停車檢測系統(tǒng)中,地磁傳感器通過對地磁變化的敏銳感知能夠及時準(zhǔn)確地捕捉到車位是否有車輛停泊的信息,同時能夠?qū)囕v停車時間進行準(zhǔn)確計算,大大減少了人工操作成本和失誤。如圖1所示,為現(xiàn)有地磁傳感器的檢測原理圖?,F(xiàn)有地磁傳感器的檢測原理為:對地磁值設(shè)定上下兩個閾值:當(dāng)?shù)卮胖档陀诘烷撝禃r判定為車輛出庫,地磁值高于高閾值時判定為車輛入庫。
現(xiàn)有的基于地磁傳感器的停車檢測系統(tǒng)存在的缺陷在于:介于兩個閾值之間的閥值無法對車位狀態(tài)做出判斷。同時,由于受地磁周邊物理環(huán)境的影響(例如地磁漂移等),導(dǎo)致現(xiàn)有的基于地磁傳感器的停車檢測系統(tǒng)存在檢測誤差,例如,當(dāng)車輛出庫時,該車位 地磁值依然停留在有車閾值以上;車輛入庫時,該車位地磁值并沒有下降到無車閾值以下。
技術(shù)實現(xiàn)要素:
本發(fā)明提供了一種停車檢測系統(tǒng)及檢測方法,旨在至少在一定程度上解決現(xiàn)有技術(shù)中的上述問題。
本發(fā)明實現(xiàn)方式如下,一種停車檢測系統(tǒng),包括地磁傳感器,所述地磁傳感器用于獲取當(dāng)前車位地磁值、一定范圍內(nèi)周邊車位地磁值以及周邊車位地磁值的變化幅值,所述停車檢測系統(tǒng)還包括數(shù)據(jù)量化模塊和狀態(tài)判斷模塊,所述數(shù)據(jù)量化模塊用于對將地磁傳感器獲取的數(shù)據(jù)進行量化處理,所述狀態(tài)判斷模塊用于根據(jù)當(dāng)前車位的地磁值及預(yù)設(shè)的地磁高低閥值判斷當(dāng)前車位狀態(tài),如果當(dāng)前車位的地磁值低于預(yù)設(shè)的低閾值,判定車輛出庫,如果當(dāng)前車位的地磁值高于預(yù)設(shè)的高閾值,判定車輛入庫;如果當(dāng)前車位的地磁值介于預(yù)設(shè)的高低閾值之間,將采集并量化的當(dāng)前車位的地磁值、周圍車位地磁變化幅值與原地磁值的比值輸入構(gòu)造的機器模型進行判斷,根據(jù)機器模型得出車位狀態(tài)結(jié)果。
本發(fā)明實施例采取的技術(shù)方案還包括:所述停車檢測系統(tǒng)還包括樣本訓(xùn)練模塊、模型訓(xùn)練模塊和機器學(xué)習(xí)模塊,所述樣本訓(xùn)練模塊用于根據(jù)周邊車位地磁值的變化幅值及對應(yīng)車位的原地磁值計算車位的地磁變化比值,并根據(jù)地磁變化比值建立樣本訓(xùn)練模型,所述模型訓(xùn)練模塊用于對樣本訓(xùn)練模型中的樣本訓(xùn)練數(shù)據(jù)進行量化處 理,將連續(xù)的地磁變化比值量化為離散值;所述機器學(xué)習(xí)模塊用于根據(jù)上述量化后的訓(xùn)練數(shù)據(jù)集建立決策樹,并根據(jù)決策樹構(gòu)造機器模型。
本發(fā)明實施例采取的技術(shù)方案還包括:所述機器模型為隨機森林模型。
本發(fā)明實施例采取的技術(shù)方案還包括:所述機器學(xué)習(xí)模塊包括參數(shù)確定單元、決策樹構(gòu)造單元和模型構(gòu)造單元,所述參數(shù)確定單元用于確定隨機森林模型中決策樹的數(shù)目以及每棵決策樹中的屬性數(shù)目m;所述決策樹構(gòu)造單元用于對決策樹數(shù)目及屬性個數(shù)進行數(shù)據(jù)采樣,分別獲得每棵決策樹的數(shù)據(jù)訓(xùn)練集,并根據(jù)數(shù)據(jù)訓(xùn)練集構(gòu)造多棵決策樹;所述模型構(gòu)造單元用于根據(jù)所有決策樹構(gòu)造隨機森林模型。
本發(fā)明實施例采取的技術(shù)方案還包括:所述決策樹構(gòu)造單元采用id3算法構(gòu)造決策樹。
本發(fā)明實施例采取的技術(shù)方案還包括:所述狀態(tài)判斷模塊獲取隨機森林模型決策樹的所有判斷結(jié)果,根據(jù)結(jié)果的眾數(shù)判定為車位狀態(tài)。
本發(fā)明實施例采取的另一技術(shù)方案為:一種停車檢測方法,包括:
步驟a:獲取當(dāng)前車位地磁值、一定范圍內(nèi)周邊車位地磁值以及周邊車位地磁值的變化幅值;
步驟b:將當(dāng)前車位地磁值與預(yù)先設(shè)定的地磁高低閥值進行比較,如果當(dāng)前車位地磁值大于地磁高閾值,則判斷車位狀態(tài)為車輛入庫,如果當(dāng)前車位地磁值小于地磁低閾值,則判斷車位狀態(tài)為車輛出庫,如果當(dāng)前車位的地磁值介于預(yù)設(shè)的高低閾值之間,則進入步驟c;
步驟c:將采集并量化的當(dāng)前車位的地磁值、周圍車位地磁變化幅值與原地磁值的比值輸入構(gòu)造的機器模型進行判斷,根據(jù)機器模型得出車位狀態(tài)結(jié)果。
本發(fā)明實施例采取的技術(shù)方案還包括:在所述步驟c中,構(gòu)造的機器模型為隨機森林模型。
本發(fā)明實施例采取的技術(shù)方案還包括:在所述步驟c中,構(gòu)建隨機森林模型具體包括:獲取停車位的訓(xùn)練數(shù)據(jù)集;對停車位訓(xùn)練數(shù)據(jù)集進行篩選并量化成指定格式;根據(jù)量化后的數(shù)據(jù)集確定隨機森林中決策樹的個數(shù)以及每棵決策樹中的屬性數(shù)目;分別采樣獲得每棵決策樹的訓(xùn)練集然后構(gòu)造決策樹,得到隨機森林模型。
本發(fā)明實施例采取的技術(shù)方案還包括:在所述步驟c中,所述根據(jù)機器模型得出車位狀態(tài)結(jié)果包括:獲取隨機森林模型決策樹的所有判斷結(jié)果,根據(jù)結(jié)果的眾數(shù)判定為車位狀態(tài)。
本發(fā)明實施例的停車檢測系統(tǒng)及檢測方法通過利用周邊車位地磁信息建立隨機森林模型,通過構(gòu)建的隨機森林模型對地磁值處于模糊區(qū)的車位狀態(tài)做出準(zhǔn)確判斷;另外,在隨機森林模型中構(gòu)造多顆決策樹,用決策結(jié)果的眾數(shù)來判斷最終的車位狀態(tài)而不是某一棵 樹的決策結(jié)果,有效避免由于某一個節(jié)點的誤差而對最終結(jié)果造成的影響,大幅提高判斷精確度。
附圖說明
圖1本發(fā)明實施例的停車檢測系統(tǒng)的結(jié)構(gòu)示意圖;
圖2是本發(fā)明實施例的停車檢測系統(tǒng)井字形停車場場景示意圖;
圖3本發(fā)明實施例的停車檢測系統(tǒng)當(dāng)前車位及所能影響的周邊車位的模型效果圖;
圖4是本發(fā)明實施例的停車檢測系統(tǒng)采用id3算法構(gòu)造的決策樹的示意圖;
圖5是本發(fā)明實施例的停車檢測系統(tǒng)隨機森林模型示意圖;
圖6是本發(fā)明實施例的停車檢測方法的流程圖。
具體實施方式
為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及實施例,對本發(fā)明進行進一步詳細說明。應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
請參閱圖1,是本發(fā)明實施例的停車檢測系統(tǒng)的結(jié)構(gòu)示意圖。本發(fā)明實施例的停車檢測系統(tǒng)包括地磁傳感器、樣本訓(xùn)練模塊、模型訓(xùn)練模塊、機器學(xué)習(xí)模塊、數(shù)據(jù)量化模塊和狀態(tài)判斷模塊;具體地:
地磁傳感器用于獲取當(dāng)前車位地磁值、一定范圍內(nèi)周邊車位地磁值以及周邊車位地磁值的變化幅值。由于當(dāng)前車位的地磁值介于預(yù)設(shè)的高低閾值之間而無法檢測出真實車位狀態(tài),本發(fā)明實施例通過當(dāng)前車位周邊的車位地磁傳感器的檢測結(jié)果為當(dāng)前車位狀態(tài)判斷提供新的判斷依據(jù),通過車位間地磁傳感器的部署和實驗發(fā)現(xiàn),當(dāng)前車位狀態(tài)為車輛入庫時,當(dāng)前車位周邊車位的地磁傳感器的地磁值會同時產(chǎn)生有規(guī)律的變化(例如,平行車位地磁值下降10%),周邊車位與當(dāng)前車位的相對位置和距離對周邊車位地磁變化具有顯著相關(guān)性。請一并參閱圖2,設(shè)定1號車位為所需要判斷車位狀態(tài)的車位,采用周圍的2,3,4,5,6,7,8,9號車位來作為輔助判斷車位,則采用周邊車位地磁值變化幅度而不是地磁值來作為判斷依據(jù)。由于周邊車位地磁值與當(dāng)前車位狀態(tài)并沒有直接關(guān)聯(lián),而是周邊車位地磁值的變化幅值(并且這個變化必須滿足一定條件)與當(dāng)前車位狀態(tài)關(guān)聯(lián),且由于周邊車位狀態(tài)的組合會有很多種情況,比如可能某幾號車位無車,某幾號車位有車,那么周邊車位地磁值的取值范圍會很廣泛,無疑會使數(shù)據(jù)變得復(fù)雜。而經(jīng)實驗發(fā)現(xiàn),對于不同的停車場場景,當(dāng)前車位所能影響的周邊車位數(shù)目以及位置都是不一樣的,具體可以總結(jié)為三種模型,即:一字型、十字形和井字形,具體如圖3所示,為本發(fā)明實施例的停車檢測系統(tǒng)當(dāng)前車位及所能影響的周邊車位的模型效果圖。
樣本訓(xùn)練模塊用于根據(jù)周邊車位地磁值的變化幅值及對應(yīng)車位的原地磁值計算車位的地磁變化比值,并根據(jù)地磁變化比值建立樣 本訓(xùn)練模型;其中,樣本訓(xùn)練模型具體包括當(dāng)前車位地磁值、地磁變化比值數(shù)據(jù)和車位狀態(tài)標(biāo)簽。地磁變化比值數(shù)據(jù)即周邊車位的地磁變化幅度與原地磁值的比值;車位狀態(tài)標(biāo)簽包括兩種類別:車輛入庫和車輛出庫。具體如下表1所示:
表1
模型訓(xùn)練模塊用于對樣本訓(xùn)練模型中的樣本訓(xùn)練數(shù)據(jù)進行量化處理,將連續(xù)的地磁變化比值量化為離散值,剔除不在給定范圍內(nèi)的樣本訓(xùn)練數(shù)據(jù),得到規(guī)范后的訓(xùn)練數(shù)據(jù)集;其中,對樣本訓(xùn)練數(shù)據(jù)進行量化處理是指將在某個區(qū)間內(nèi)的所有值都量化為某一數(shù)字。如上表所示,當(dāng)有車輛出庫時,2號車位地磁值總會有一個-0.15左右的下降比例;當(dāng)有車輛入庫時,2號車位地磁值總會有一個0.05左右的上升比例。該下降比或上升比是較為穩(wěn)定的,因為2號車位相對于當(dāng)前車位的距離與方位都是固定的。于是,可以將2號車位地磁值的下降比例在(-0.2,-0.1)區(qū)間內(nèi)的地磁變化比值量化為-1,上升比例在(+0.05,+0.1)區(qū)間內(nèi)的地磁變化比值量化為+1。對其它所有不在這兩個區(qū)間內(nèi)的所有地磁變化比值都量化為0,舍棄所有量化后的地磁變化比值為0的訓(xùn)練樣本,并對所有訓(xùn)練樣本數(shù)據(jù)都進行上述量化處理,舍去量化后的含有地磁變化比值為0的周邊車位,即不考慮 該周邊車位此次地磁值變化與當(dāng)前車位的關(guān)系,得到規(guī)范后的訓(xùn)練數(shù)據(jù)集,具體如下表2和表3所示:
表2
舍棄表2中含有0值的訓(xùn)練樣本,得到下表3中的規(guī)范的訓(xùn)練數(shù)據(jù)集:
表3
其中,在當(dāng)前車位的地磁值介于預(yù)設(shè)的高低閾值之間而無法檢測出真實車位狀態(tài)時,當(dāng)前車位周邊的車位地磁設(shè)備檢測結(jié)果為當(dāng)前車位狀態(tài)判斷提供了新的判斷依據(jù)。通過車位間地磁設(shè)備的部署和實驗發(fā)現(xiàn),當(dāng)前車位狀態(tài)為車輛入庫時,當(dāng)前車位周邊車位的地磁設(shè)備的地磁值會同時產(chǎn)生有規(guī)律的變化(例如,平行車位地磁值下降10%),周邊車位與當(dāng)前車位的相對位置和距離對周邊車位地磁變化具有顯著相關(guān)性。
機器學(xué)習(xí)模塊用于根據(jù)上述量化后的訓(xùn)練數(shù)據(jù)集建立決策樹,并根據(jù)決策樹構(gòu)造隨機森林模型;具體地,機器學(xué)習(xí)模塊包括參數(shù)確定單元、決策樹構(gòu)造單元和模型構(gòu)造單元;
參數(shù)確定單元用于確定隨機森林模型中決策樹的數(shù)目以及每棵決策樹中的屬性數(shù)目m;其中,決策樹是一個判斷模型,代表了對象屬性與對象值之間的一種映射關(guān)系。樹中每個節(jié)點表示某個對象,而每個分叉路徑則代表的某個可能的屬性值,而每個葉結(jié)點則對應(yīng)從根節(jié)點到該葉節(jié)點所經(jīng)歷的路徑所表示的對象的值。決策樹僅有單一輸出,若欲有復(fù)數(shù)輸出,可以建立獨立的決策樹以處理不同輸出。數(shù)據(jù)挖掘中決策樹是一種常用技術(shù),可以用于分析數(shù)據(jù),也可以用于判斷或者預(yù)測。當(dāng)前車位狀態(tài)對周邊車位的地磁值影響強度是隨著距離、方向的變化而變化的,很好地符合了決策樹的屬性選擇特征。在決策樹中,不同的屬性(對應(yīng)不同的周邊車位的地磁信息)對決策結(jié)果造成的影響力是不一樣的,以便能夠構(gòu)造出性能最好的決策樹。對停車檢測系統(tǒng)來說,當(dāng)前車位車輛入庫、出庫對當(dāng)前車位的地磁值影響必定最大,對緊鄰的車位地磁值影響次之,對再遠的車位影響更次之(或許不單單是距離的影響,還有方位等的影響,此處僅是舉例說明),但是決策樹仍然存在著一些問題。隨著考慮的周邊臨近車位的增多,決策樹會變得越來越深越來越復(fù)雜,在加大決策模型復(fù)雜度的同時降低決策樹的決策準(zhǔn)確度。決策樹是一種環(huán)環(huán)相扣的模型,某一個節(jié)點出現(xiàn)偏差就會導(dǎo)致結(jié)果的錯誤,深度的決策網(wǎng)絡(luò)出錯的概率顯然大于較淺的決策網(wǎng)絡(luò)。我們減小每棵樹中節(jié)點的個數(shù)(對應(yīng)于所選擇的輔助車位數(shù)目),每次只隨機抽樣某m個車位作為輔助車位(嚴(yán)格意義的隨機森林要求m<<m,m為全部屬性數(shù)目),以減小決策樹深度。構(gòu)造多棵決策 樹,用多棵決策樹決策結(jié)果的眾數(shù)來判斷最終的車位狀態(tài),能夠有效避免由于某一個節(jié)點的誤差而對最終結(jié)果造成的影響,提高檢測精確度。
決策樹構(gòu)造單元用于對決策樹數(shù)目及屬性個數(shù)進行數(shù)據(jù)采樣,分別獲得每棵決策樹的數(shù)據(jù)訓(xùn)練集,并根據(jù)數(shù)據(jù)訓(xùn)練集構(gòu)造多棵決策樹;其中,在隨機森林中,隨機性體現(xiàn)在兩個方面:一是屬性的選擇隨機,每棵決策樹都隨機從m個屬性中隨機選擇m個(m<<m,一般取m=sqrt(m))來進行構(gòu)造,相當(dāng)于進行數(shù)據(jù)訓(xùn)練集采樣;二是樣本的選擇隨機。構(gòu)造每棵決策樹所需的訓(xùn)練數(shù)據(jù)都隨機從n個總樣本中有放回地抽取n個;有效地避免了over-fitting(過度擬合)的產(chǎn)生。本發(fā)明實施例中,假設(shè)設(shè)定決策樹數(shù)目為5,屬性個數(shù)m為3,隨機采樣出來的五組屬性組合為
{(2,5,6),(3,4,9),(6,4,1),(7,3,8),(9,4,2)}
分別對這五組屬性組合進行訓(xùn)練數(shù)據(jù)采樣,有放回地抽取n次(n為總訓(xùn)練集大小),假設(shè)對于屬性組合(2,5,6),隨機采樣得到的訓(xùn)練集如下表4所示:
表4
根據(jù)該訓(xùn)練集構(gòu)造決策樹,基本的決策樹構(gòu)造算法包括id3和c4.5,本發(fā)明采用id3算法來進行決策樹構(gòu)造,對(2,5,6)屬性值采用id3算法構(gòu)造的決策樹如圖4所示,具體構(gòu)造過程本發(fā)明不再贅 述。依照上述方式,依次構(gòu)造所有的決策樹,即可得到隨機森林模型。其中,隨機森林是一個包含多個決策樹的分類器,并且其輸出的類別是由個別樹輸出的類別的眾數(shù)而定。隨機森林相比于決策樹具有以下優(yōu)點:對訓(xùn)練數(shù)據(jù)的容錯能力,是一種有效地估計缺失數(shù)據(jù)的一種方法,當(dāng)數(shù)據(jù)集中有大比例的數(shù)據(jù)缺失時仍然可以保持精度不變;能夠有效地處理大的數(shù)據(jù)集;可以處理沒有刪減的成千上萬的變量;能夠在分類的過程中可以生成一個泛化誤差的內(nèi)部無偏估計;能夠檢測到特征之間的相互影響以及重要性程度;不過出現(xiàn)過度擬合;實現(xiàn)簡單容易并行化。
模型構(gòu)造單元用于根據(jù)所有決策樹構(gòu)造隨機森林模型;具體如圖6所示,為本發(fā)明實施例的停車檢測系統(tǒng)隨機森林模型示意圖。
數(shù)據(jù)量化模塊用于對將地磁傳感器獲取的新數(shù)據(jù)進行量化處理。
狀態(tài)判斷模塊用于根據(jù)當(dāng)前車位的地磁值及預(yù)設(shè)的地磁高低閥值判斷當(dāng)前車位狀態(tài),如果當(dāng)前車位的地磁值低于預(yù)設(shè)的低閾值,判定車輛出庫,如果當(dāng)前車位的地磁值高于預(yù)設(shè)的高閾值,判定車輛入庫;如果當(dāng)前車位的地磁值介于預(yù)設(shè)的高低閾值之間,將采集并量化的當(dāng)前車位的地磁值、周圍車位地磁變化幅值與原地磁值的比值輸入構(gòu)造的隨機森林模型進行判斷,由隨機森林模型決策樹得出車位狀態(tài)結(jié)果,并取結(jié)果的眾數(shù)為最終判定的車位狀態(tài)。
例如,當(dāng)前車位地磁值和周邊車位地磁變化幅值與原地磁值的比值如下表5所示:
表5
將表5中的周邊車位地磁變化幅值與原地磁值的比值量化處理后如下表6所示:
表6
然后輸入隨機森林網(wǎng)絡(luò)進行判斷,這五顆決策樹得出的結(jié)果為(出庫,出庫,入庫,出庫,出庫),取結(jié)果的眾數(shù)“出庫”,所以最終判定車位狀態(tài)為“車輛出庫”。
請參閱圖6,是本發(fā)明實施例的停車檢測方法的流程圖。本發(fā)明實施例的停車檢測方法包括:
步驟100:獲取當(dāng)前車位地磁值、一定范圍內(nèi)周邊車位地磁值以及周邊車位地磁值的變化幅值;
在步驟100中,通過地磁感應(yīng)器采集當(dāng)前車位地磁值、一定范圍內(nèi)周邊車位地磁值以及周邊車位地磁值的變化幅值。
步驟200:將當(dāng)前車位地磁值與預(yù)先設(shè)定的地磁閾值進行比較,其中所述地磁閾值包括有車閾值和無車閾值,如果當(dāng)前車位地磁值大于有車閾值,則進入步驟300,如果當(dāng)前車位地磁值不大于有車閾值,則進入步驟400;
步驟300:判斷車位狀態(tài)為車輛入庫;
步驟400:判斷當(dāng)前車位地磁值是否小于無車閾值,如果當(dāng)前車位地磁值小于無車閾值則進入步驟500,否則進入步驟600;
步驟500:判斷車位狀態(tài)為車輛出庫;
步驟600:對采集的當(dāng)前車位地磁值、一定范圍內(nèi)周邊車位地磁值以及周邊車位地磁值的變化幅值數(shù)據(jù)進行量化處理;
在步驟600中,量化指把在某個區(qū)間內(nèi)的所有值都規(guī)定為某一數(shù)字。假設(shè)有一組新來的數(shù)據(jù)如下所示:
對數(shù)據(jù)量化處理變?yōu)椋?/p>
步驟700:將量化后的數(shù)據(jù)輸入機器學(xué)習(xí)模型進行判斷,得到車位狀態(tài)的判定結(jié)果。
在步驟700中,機器學(xué)習(xí)模型采用隨機森林模型,隨機森林是一個包含多個決策樹的分類器,并且其輸出的類別是由個別樹輸出的類別的眾數(shù)而定。在隨機森林中,隨機性體現(xiàn)在兩個方面:一是屬性的選擇隨機,二是樣本的選擇隨機。輸入隨機森林網(wǎng)絡(luò)進行判斷,這五顆決策樹得出的結(jié)果為(出庫,出庫,入庫,出庫,出庫),取結(jié)果的眾數(shù)“出庫”,所以最終判定車位狀態(tài)為“車輛出庫”,至此,整個判定過程完畢。
構(gòu)建本發(fā)明實施例的隨機森林模型具體包括:
步驟710:獲取停車位的訓(xùn)練數(shù)據(jù)集;
在步驟710中,通過實驗采集訓(xùn)練數(shù)據(jù),訓(xùn)練數(shù)據(jù)包含數(shù)據(jù)和標(biāo)簽兩部分,數(shù)據(jù)是指周圍車位的地磁變化幅度與原來地磁值的比值;標(biāo)簽有兩種類別:車輛入庫和車輛出庫。現(xiàn)有一份采集的數(shù)據(jù)集如下表1所示:
表1
步驟720:對停車位訓(xùn)練數(shù)據(jù)集進行篩選并量化成指定格式;
在步驟720中,量化指把在某個區(qū)間內(nèi)的所有值都規(guī)定為某一數(shù)字。例如,通過對上述訓(xùn)練集觀察可以發(fā)現(xiàn),當(dāng)有車輛出庫時,2號車位地磁值總會有一個-0.15左右的下降比例;當(dāng)有車輛入庫時,2號車位地磁值總會有一個0.05左右的上升比例。這個下降比(上升比)是較為穩(wěn)定的,因為2號車位相對于當(dāng)前車位的距離與方位都是固定的。于是,可以將2號車位地磁值的下降比例在(-0.2,-0.1)區(qū)間內(nèi)量化為-1,上升比例在(+0.05,+0.1)之間規(guī)定為+1。對其它所有不在這兩個區(qū)間內(nèi)的所有值我們都量化為0,舍棄所有含有0值的訓(xùn)練樣本。在測試集當(dāng)中,若含有量化后的地磁變化比值為0的周邊車位,則舍去該周邊車位的地磁信息,即不考慮該周邊車位此次地磁值變化與當(dāng)前車位的關(guān)系。同時,在隨機森林中含有該周邊車位的決策樹也都被舍去。對所有訓(xùn)練數(shù)據(jù)都進行上述量化處理,我們可以得到規(guī)范后的訓(xùn)練數(shù)據(jù)集如下所示:
舍棄含有0值的樣本后變成:
步驟730:根據(jù)量化后的數(shù)據(jù)集確定隨機森林中決策樹的個數(shù)以及每棵決策樹中的屬性數(shù)目;
在步驟730中,在隨機森林中,隨機性體現(xiàn)在兩個方面:一是屬性的選擇隨機,每棵決策樹都隨機從m個屬性中隨機選擇m個(m<<m,一般取m=sqrt(m))來進行構(gòu)造,這相當(dāng)于對訓(xùn)練集進行列采樣;二是樣本的選擇隨機。構(gòu)造每棵決策樹所需的訓(xùn)練數(shù)據(jù)隨機從n個總樣本中有放回地抽取n個。這兩個隨機性有效地避免了over-fitting的產(chǎn)生。隨機森林中,有兩個參數(shù)需要認(rèn)為確定:決策樹的數(shù)目和每棵決策樹的屬性個數(shù)m。在此,設(shè)定決策樹數(shù)目為5,屬性個數(shù)m為3。隨機采樣出來的五組屬性組合為
{(2,5,6),(3,4,9),(6,4,1),(7,3,8),(9,4,2)}
分別對這五組屬性組合進行訓(xùn)練數(shù)據(jù)采樣,又放回地抽取n次(n為總訓(xùn)練集大小),假設(shè)對于屬性組合(2,5,6),隨機采樣得到的訓(xùn)練集如下表所示:
根據(jù)這個數(shù)據(jù)集來構(gòu)造決策樹,基本的決策樹算法有id3和c4.5兩種,在本發(fā)明實施例中,采用id3算法來進行決策樹構(gòu)造,假設(shè)對(2,5,6)屬性值采用id3算法構(gòu)造的決策樹:
步驟740:分別采樣獲得每棵決策樹的訓(xùn)練集然后構(gòu)造決策樹,得到隨機森林模型。
以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。