本發(fā)明涉及一種道路交通事故預(yù)警方法。
背景技術(shù):
交通是城市經(jīng)濟(jì)發(fā)展的基礎(chǔ),是經(jīng)濟(jì)社會(huì)活動(dòng)中最活躍的因素,與居民的生活息息相關(guān);伴隨著經(jīng)濟(jì)社會(huì)的飛速發(fā)展、城市化的快速推進(jìn)以及機(jī)動(dòng)化程度的迅速發(fā)展,道路交通需求顯著增加,道路交通安全問(wèn)題日益凸顯;因此,迫切需要基于交通大數(shù)據(jù)挖掘的交通事故成因分析,對(duì)事故高發(fā)人群預(yù)估、事故發(fā)生地點(diǎn)、時(shí)間、天氣的預(yù)判;實(shí)現(xiàn)交通事故未發(fā)先防、發(fā)后快處、處理客觀的目標(biāo);
目前,研究交通事故成因分析方面所在的觀察角度、側(cè)重對(duì)象、研究方法上各有不同,但總的來(lái)說(shuō)都是從駕駛?cè)?、駕駛車輛、道路路況、環(huán)境因素這幾個(gè)方面來(lái)分析事故成因。內(nèi)容上大同小異,大部分研究結(jié)果都側(cè)重于事故中司機(jī)年齡、駕齡、性別以及受傷部位的統(tǒng)計(jì)分析,而對(duì)于如何結(jié)合事故發(fā)生地點(diǎn)、時(shí)間等環(huán)境因素進(jìn)行司機(jī)駕駛多維度、差異化分析,從而做到有針對(duì)性的采取措施并未涉及。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是提供一種道路交通事故預(yù)警方法,從交通違法數(shù)據(jù)和交通事故數(shù)據(jù)以及環(huán)境變量中得到交通事故成因并應(yīng)用到實(shí)際情況中;對(duì)交通事故高發(fā)人群預(yù)估、交通事故發(fā)生類型預(yù)判、判斷事故多發(fā)路段治理的重點(diǎn)和及其優(yōu)先等級(jí),對(duì)交通事故高發(fā)時(shí)間、天氣等的統(tǒng)計(jì)規(guī)律。實(shí)現(xiàn)交通事故未發(fā)先防、發(fā)后快處、處理客觀的目標(biāo),解決如何結(jié)合事故發(fā)生地點(diǎn)、時(shí)間等環(huán)境因素進(jìn)行司機(jī)駕駛多維度、差異化分析,從而做到有針對(duì)性的采取措施的問(wèn)題。
本發(fā)明的技術(shù)解決方案是:
一種道路交通事故預(yù)警方法,包括以下步驟:
S1、通過(guò)司機(jī)身份信息關(guān)聯(lián)交通事故數(shù)據(jù)信息表和交通違法數(shù)據(jù)信息表;
S2、通過(guò)交通事故人員特征分析,得到司機(jī)的交通事故與交通違法在數(shù)量、類型上的聯(lián)系,得到司機(jī)擁有不同車輛數(shù)對(duì)事故發(fā)生率的影響,得到司機(jī)年齡、駕齡與事故發(fā)生率的關(guān)系,得到司機(jī)在事故責(zé)任方上的性別差異;
S3、由S2得到的結(jié)果,進(jìn)行交通事故高發(fā)人員決策樹(shù)判斷,得到事故高發(fā) 人員及其發(fā)生的事故類型;
S4、環(huán)境變量特征分析,使用K中心聚類的方法,依據(jù)路段發(fā)生事故類型比例,得到城市路段聚類結(jié)果;使用統(tǒng)計(jì)的方法,得到事故發(fā)生時(shí)間、天氣、車輛顏色在事故發(fā)生率上分布情況;
S5、依據(jù)S4所得結(jié)果,依據(jù)聚類后的各路段類型的聚類中心,判斷路段事故種類復(fù)雜度,作為第一排序依據(jù);將路段事故數(shù)量作為第二排序依據(jù),得到道路類型及處理等級(jí)表,得到事故高發(fā)時(shí)間、天氣、車輛顏色規(guī)律;
S6、綜合步驟S3、S5得到的結(jié)果,將S3中得到的事故高發(fā)人員及其發(fā)生的事故類型,對(duì)應(yīng)到步驟S5的事故高發(fā)的環(huán)境變量,結(jié)合司機(jī)自身特點(diǎn)和環(huán)境狀況進(jìn)行針對(duì)的行車提醒,同時(shí)進(jìn)行事故預(yù)警。
進(jìn)一步地,步驟S1具體為:交通違法數(shù)據(jù)信息表中的交通違法數(shù)據(jù)的特征向量為As=[A,H],其中A為違法人員身份信息,H為違法人員的違法內(nèi)容;交通事故數(shù)據(jù)信息表中的交通事故數(shù)據(jù)的特征向量為CS=[C,K,V],其中C為事故信息,包括事故發(fā)生類型、時(shí)間、地點(diǎn)、天氣,K為人員信息,包括司機(jī)年齡、性別、責(zé)任歸屬、駕齡、擁有的不同車輛數(shù),V為車輛顏色信息。
進(jìn)一步地,步驟S2具體為:
S21、使用Sperman等級(jí)相關(guān)性的方法,檢驗(yàn)司機(jī)發(fā)生交通事故與交通違法在數(shù)量、類型上的相關(guān)性;
S22、司機(jī)擁有不同車輛數(shù)對(duì)事故發(fā)生率的影響進(jìn)行檢驗(yàn),具體為:從司機(jī)交通事故數(shù)據(jù)中提取其發(fā)生多起事故所用到的不同的車輛數(shù),利用Sperman等級(jí)相關(guān)性檢驗(yàn)二者的相關(guān)性及其系數(shù)大小;
S23、對(duì)于司機(jī)在事故責(zé)任上的性別差異進(jìn)行檢驗(yàn),具體為:從司機(jī)交通事故數(shù)據(jù)中提取司機(jī)發(fā)生事故后,責(zé)任方的歸屬及其性別信息,利用x2檢驗(yàn)的方法,檢驗(yàn)性別在事故責(zé)任方上的差異性水平;
S24、使用統(tǒng)計(jì)的方法,得到司機(jī)年齡、駕齡在事故發(fā)生率上的規(guī)律。
進(jìn)一步地,步驟S21中,司機(jī)發(fā)生交通事故與交通違法在數(shù)量、類型上的關(guān)系檢驗(yàn)方法為:
S211、從交通事故數(shù)據(jù)和交通違法數(shù)據(jù)表格中,對(duì)應(yīng)并統(tǒng)計(jì)每位司機(jī)發(fā)生交通事故的次數(shù)、交通違法的次數(shù),利用Sperman等級(jí)相關(guān)性檢驗(yàn)二者數(shù)量上的相 關(guān)性及其系數(shù)大??;
S212、按照交通事故類型,分類事故人員;
S213、在交通違法數(shù)據(jù)里對(duì)應(yīng)出這些事故人員的違法信息,統(tǒng)計(jì)每一事故類型司機(jī)各類違法次數(shù);
S214、根據(jù)統(tǒng)計(jì)后的各類違法數(shù)量,舍棄違法數(shù)量小于p次的違法類型;得到司機(jī)發(fā)生交通事故類型-司機(jī)交通違法類型表格;
S215、將所得司機(jī)發(fā)生交通事故類型-司機(jī)交通違法類型表格中的每一類型交通事故對(duì)應(yīng)的各種交通違法的次數(shù),比上每一類型交通違法的總次數(shù),得到司機(jī)發(fā)生交通事故類型-司機(jī)交通違法類型比例的表格;計(jì)算公式如下:
交通事故A={a1,a2,a3…am},am為交通事故類型;
事故人數(shù)K={k1,k2,k3…km},km為發(fā)生交通事故類型am的人數(shù);
違法類型B={b1,b2,b3…bn},bn為交通違法類型;
違法人數(shù)kmbn為司機(jī)交通事故類型是am的,其發(fā)生違法類型為bn的次數(shù);
司機(jī)違法總次數(shù)
司機(jī)違法類型比例矩陣
S216、以司機(jī)交通違法的比例為縱坐標(biāo),司機(jī)交通違法類型為橫坐標(biāo),將各類型交通事故的司機(jī)所發(fā)生的各類交通違法的比例繪制在此坐標(biāo)系中,通過(guò)觀察司機(jī)各類違法的比例,進(jìn)而判斷其發(fā)生的事故的類型。
進(jìn)一步地,所述步驟S24中檢驗(yàn)司機(jī)年齡、駕齡在事故發(fā)生率上的差異,具體為:
S241、從司機(jī)交通事故數(shù)據(jù)中提取事故責(zé)任方司機(jī)的年齡和駕齡,統(tǒng)計(jì)事故責(zé)任方的司機(jī)年齡、駕齡分布頻次,得到責(zé)任方司機(jī)發(fā)生交通事故的頻次-司機(jī)年齡、駕齡頻數(shù)表;
S242、以事故發(fā)生頻次為縱坐標(biāo),司機(jī)年齡和駕齡為橫坐標(biāo),將各年齡、駕 齡段的司機(jī)發(fā)生的交通事故頻次繪制在該坐標(biāo)系上,判斷事故高發(fā)司機(jī)其駕齡、年齡分布段。
進(jìn)一步地,步驟S3中事故高發(fā)人員決策樹(shù)判斷具體為:根據(jù)步驟S2中結(jié)論,由交通事故人員的事故數(shù)量、違法次數(shù)、擁有不同的車輛數(shù)、駕齡、年齡信息,使用決策樹(shù)模型的CHAID算法進(jìn)行事故高危人群分類判斷,得到事故高發(fā)人員及其發(fā)生的事故類型。
進(jìn)一步地,步驟S4中事故多發(fā)路段事故類型聚類分析步驟為:
S411、在交通事故數(shù)據(jù)中提取事故地點(diǎn)、事故類型、事故數(shù)量,篩選出事故數(shù)大于等于n次的事故高發(fā)地點(diǎn);
S412、計(jì)算出事故地點(diǎn)發(fā)生的每一類交通事故類型在所有交通事故類型中的比例,得到事故地點(diǎn)-發(fā)生各類事故類型數(shù)量的百分比表;
S413、使用K中心聚類的方法,將城市路段分成3類,得到城市路段事故類型聚類表。
進(jìn)一步地,步驟S4中事故發(fā)生時(shí)間分析的步驟為:
S421、從事故數(shù)據(jù)中提取事故發(fā)生日期、時(shí)間,其中日期分為工作日、休息日;
S422、以一小時(shí)為時(shí)間段,統(tǒng)計(jì)該時(shí)間短內(nèi)的交通事故次數(shù),得到每一天24小時(shí)內(nèi),每小時(shí)的事故比例表;
S423、以事故數(shù)量比例為縱坐標(biāo),以事故發(fā)生時(shí)間為橫坐標(biāo),建立坐標(biāo)系,繪制統(tǒng)計(jì)時(shí)間段內(nèi),不同日期類型的24小時(shí)的事故發(fā)生的數(shù)量比例;通過(guò)圖表對(duì)比,得到交通事故發(fā)生與日期、時(shí)間的關(guān)系。
進(jìn)一步地,步驟S4中事故發(fā)生天氣分析步驟為:
S431、從交通事故數(shù)據(jù)中提取事發(fā)時(shí)天氣類型;
S432、計(jì)算事發(fā)時(shí)各類型天氣發(fā)生事故次數(shù)在所有事故次數(shù)中的比例分布;
S433、對(duì)照組數(shù)據(jù),使用事發(fā)時(shí)各類型天氣,在統(tǒng)計(jì)時(shí)段內(nèi),所有事發(fā)天氣上的分布比例;
S434、計(jì)算步驟S432與步驟S433的差值;計(jì)算公式如下:
統(tǒng)計(jì)時(shí)段內(nèi),各類交通事故天氣出現(xiàn)的次數(shù)KA={ka1,ka2,ka3…kam},
am為天氣類型;
各類交通事故天氣下,發(fā)生的交通事故數(shù)量KB={kb1,kb2,kb3…kbn},bn為交通事故天氣類型;
S435、以百分比為縱坐標(biāo),天氣類型為橫坐標(biāo)建立坐標(biāo)系,將步驟S432與步驟S433的差值繪制在該坐標(biāo)系中,直觀的展現(xiàn)出事故易發(fā)天氣類型。
進(jìn)一步地,步驟S4中事故車輛顏色分析步驟為:
S441、從事故數(shù)據(jù)中提取事故車輛顏色信息、是否為肇事車輛信息;
S442、計(jì)算出肇事車輛顏色在所有車輛顏色中的比例分布;
S443、計(jì)算出非肇事車輛顏色在所有車輛顏色中的比例分布;
S444、計(jì)算非肇事車輛的百分比與肇事車輛的百分比差值;
S445、以車輛顏色為橫坐標(biāo),百分比為縱坐標(biāo),建立坐標(biāo)系,繪制非肇事車輛顏色百分比與肇事車輛顏色百分比的差值圖;得到車輛顏色在交通事故發(fā)生率上的規(guī)律。
進(jìn)一步地,步驟S5中得到事故高發(fā)天氣、時(shí)間、車輛顏色規(guī)律,具體為:依據(jù)S423、S435、S445得到的統(tǒng)計(jì)圖表,定量化確定事故高發(fā)天氣、時(shí)間、路段及車輛顏色規(guī)律。
本發(fā)明的有益效果是:該種道路交通事故預(yù)警方法,將事故高危司機(jī)和事故高發(fā)路段結(jié)合,加入時(shí)間、天氣等環(huán)境因素的影響,以達(dá)到事故高發(fā)司機(jī)判斷、司機(jī)發(fā)生事故類型判斷、多發(fā)事故路段對(duì)應(yīng)特定司機(jī)類型,將事故人員、事故類型、事故路段有機(jī)結(jié)合的目的,從而實(shí)現(xiàn)有針對(duì)化的行車提醒,同時(shí)能夠?qū)崿F(xiàn)讓交通管理部門進(jìn)行事故預(yù)警;能夠作為市政管理部門進(jìn)行道路管養(yǎng)的參考。
附圖說(shuō)明
圖1為本發(fā)明實(shí)施例道路交通事故預(yù)警方法的流程示意圖。
圖2為實(shí)施例中事故類型及其對(duì)應(yīng)的違法類型的示意圖。
圖3為實(shí)施例中司機(jī)擁有的不同類型的車輛(異車率)對(duì)其故發(fā)生次數(shù)的影響的示意圖。
圖4為實(shí)施例中事故責(zé)任方司機(jī)駕齡分布直方圖。
圖5為實(shí)施例中事故責(zé)任方司機(jī)年齡分布直方圖。
圖6為實(shí)施例中事故高危人群判斷樹(shù)形圖。
圖7為實(shí)施例中事故數(shù)量在不同日期類型的一天內(nèi)的分布的示意圖。
圖8為實(shí)施例中事故天氣與正常天氣種類分布比例差值的示意圖。
圖9為實(shí)施例中被肇事車輛顏色百分比與肇事車輛顏色百分比差值的示意圖。
具體實(shí)施方式
下面結(jié)合附圖詳細(xì)說(shuō)明本發(fā)明的優(yōu)選實(shí)施例。
實(shí)施例
實(shí)施例的方法中所做的數(shù)據(jù)分析處理,主要使用EXCEL和IBM SPSS Statistics 22.0統(tǒng)計(jì)分析軟件。涉及到EXCEL的篩選、比對(duì)、數(shù)據(jù)透視表等基礎(chǔ)處理手段以及SPSS中的χ2檢驗(yàn)、聚類分析、斯皮爾曼等級(jí)相關(guān)性檢驗(yàn)、曲線估計(jì)、決策樹(shù)模型等數(shù)據(jù)統(tǒng)計(jì)分析方法;
如圖1所示,一種道路交通事故預(yù)警方法,該方法包括如下步驟。
S1、通過(guò)司機(jī)身份信息關(guān)聯(lián)交通事故數(shù)據(jù)信息表和交通違法數(shù)據(jù)信息表,交通違法數(shù)據(jù)的特征向量為As=[A,H],其中A為違法人員身份信息,H為違法人員的違法內(nèi)容。交通事故數(shù)據(jù)的特征向量為CS=[C,K,V],其中C為事故信息,包括事故發(fā)生類型、時(shí)間、地點(diǎn)、天氣,K為人員信息,包括司機(jī)年齡、性別、責(zé)任歸屬、駕齡、擁有的不同車輛數(shù),V為車輛顏色信息。
其中,交通違法數(shù)據(jù)包括違法人員身份信息、違法人員的違法內(nèi)容;交通事故數(shù)據(jù)包括:事故發(fā)生類型、時(shí)間、地點(diǎn)、天氣,司機(jī)身份信息、年齡、性別、責(zé)任歸屬、駕齡、擁有的不同車輛數(shù)、車輛顏色信息。
實(shí)施例案例數(shù)據(jù)包含了某市2015年上半年的18042起交通事故數(shù)據(jù)以及2014—2016間的61473起交通違法數(shù)據(jù)。涉及人員70324人,其中屬于事故責(zé)任方且在2014—2016期間內(nèi)違法的共計(jì)14436人。其中事故數(shù)據(jù)主要包括涉及事故人員身份信息,即身份證號(hào)、性別、出生日期、初次領(lǐng)證日期、事故發(fā)生地點(diǎn)、事故發(fā)生時(shí)間、事發(fā)當(dāng)天天氣狀況、事故發(fā)生類型、事故責(zé)任歸屬情況、事故車輛牌照。違法數(shù)據(jù)包括駕駛證號(hào)(身份證號(hào))、違法行為、違法內(nèi)容。經(jīng)過(guò) 數(shù)據(jù)二次處理將事故數(shù)據(jù)和違法數(shù)據(jù)比對(duì)得到事故人員違法次數(shù)及類型、事故人員發(fā)生事故次數(shù)及類型、事故中所使用的不同的車輛數(shù)。
S2、交通事故人員特征分析,使用Sperman等級(jí)相關(guān)性的方法,檢驗(yàn)司機(jī)交通事故與交通違法在數(shù)量上相關(guān)性,確定其相關(guān)性大小;使用統(tǒng)計(jì)的方法,得到司機(jī)交通事故與交通違法在類型上的相關(guān)性;使用Sperman等級(jí)相關(guān)性的方法,檢驗(yàn)司機(jī)擁有不同車輛數(shù)對(duì)事故發(fā)生率的相關(guān)性影響及其大小;使用χ2檢驗(yàn)的方法,得到司機(jī)在事故責(zé)任方上的性別差異;使用統(tǒng)計(jì)的方法,得到司機(jī)年齡、駕齡在事故發(fā)生率上的規(guī)律。
在步驟S2中,通過(guò)司機(jī)身份證信息,關(guān)聯(lián)交通事故數(shù)據(jù)信息表和交通違法數(shù)據(jù)信息表后,得到事故責(zé)任方在一段時(shí)間內(nèi)的事故發(fā)生次數(shù)及其在更長(zhǎng)時(shí)間內(nèi)的違法次數(shù)。在Excel第一列輸入駕駛員身份證號(hào),第二列輸入該駕駛員事故次數(shù),第三列輸入該駕駛員違法次數(shù),導(dǎo)入表格到IBM SPSS Statistics 22.0中,使用sperman等級(jí)相關(guān)性檢驗(yàn),檢驗(yàn)結(jié)果如表1所示:
表1.事故頻數(shù)與違法次數(shù)斯皮爾曼等級(jí)相關(guān)性檢驗(yàn)表
表1中,**.相關(guān)性在0.01級(jí)別顯著(雙尾)。
結(jié)果顯示:交通事故發(fā)生頻數(shù)和交通違法次數(shù)在顯著性水平為0.01標(biāo)準(zhǔn)下,漸進(jìn)顯著性水平為0,具有等級(jí)相關(guān)性。
通過(guò)EXCEL表格處理將事故發(fā)生類型為同一類的司機(jī)及其違法類型數(shù)據(jù)合并提取,得到發(fā)生某類事故的司機(jī)其常發(fā)性違法類型情況;依據(jù)某種違法類型的發(fā)生數(shù)量將200種違法數(shù)據(jù)篩選到20種,具體分布情況如圖2所示。
對(duì)比事故中負(fù)有責(zé)任的駕駛員與其兩年內(nèi)違法情況發(fā)現(xiàn),其違法類型集中在 某幾類;并且發(fā)現(xiàn)不同的事故類型對(duì)應(yīng)著不同的違法高發(fā)類型,即發(fā)生某一類交通事故的人經(jīng)常性的違法某一種類型;圖2顯示了發(fā)生9類交通事故類型的司機(jī)對(duì)應(yīng)的發(fā)生20類高發(fā)交通違法類型所占的比例;比如說(shuō)發(fā)生追尾事故的人其發(fā)生”進(jìn)入導(dǎo)向車道、不按規(guī)定方向行駛的”這一違法類型就比其他違法類型都要高(占比22.29%);事故發(fā)生類型是違反交通信號(hào)的司機(jī),其發(fā)生“駕駛機(jī)動(dòng)車在高速公路、城市快速路以外的道路上不按規(guī)定車道行駛的”這一事故類型占比高達(dá)60.66%是否可以通過(guò)司機(jī)違法行為預(yù)先判斷可能發(fā)生的事故類型,以便有針對(duì)性的防范交通事故的發(fā)生;綜合以上兩種研究方法我們可以做到事先預(yù)判事故高發(fā)人群的高發(fā)事故類型。
駕駛員在多起事故中所駕駛的不同車輛數(shù)也會(huì)影響交通事故發(fā)生率。利用斯皮爾曼等級(jí)相關(guān)性檢驗(yàn)如表2所示:交通事故發(fā)生頻數(shù)與交通違法次數(shù)具有顯著相關(guān)性(sig=0),并且相關(guān)系數(shù)=0.620,具有較強(qiáng)的相關(guān)性;
表2.異車率與事故發(fā)生次數(shù)斯皮爾曼等級(jí)相關(guān)性檢驗(yàn)表
表2中,**.相關(guān)性在0.01級(jí)別顯著(雙尾).
根據(jù)表2得到的結(jié)論是:發(fā)生交通事故數(shù)量≥2次的,其事故車輛擁有率大致隨著事故次數(shù)而增加。即駕駛?cè)笋{駛不同類型的車輛數(shù)越多,交通事故的發(fā)生頻率也越高;具體分布如圖3所示:隨著交通事故率的增加,平均每人擁有的不同車輛數(shù)(異車率)也在增加。
對(duì)步驟2中事故責(zé)任方司機(jī)性別差異的檢驗(yàn)如下,首先對(duì)36082位交通事故涉及人員的事故責(zé)任歸屬先用EXCEL進(jìn)行簡(jiǎn)單的統(tǒng)計(jì),之后用spss中χ2檢驗(yàn)的方法確定了在事故責(zé)任方上,存在著顯著的性別差異,得到表3、表4;如表3所示:皮爾遜卡方漸進(jìn)顯著性<0.05;因此,在事故責(zé)任方上存在顯著的性別差異;具體差異情況見(jiàn)表4。
表3.性別*事故責(zé)任情況卡方檢驗(yàn)表
表3中,a.0個(gè)單元格(0.0%)具有的預(yù)期計(jì)數(shù)少于5。最小預(yù)期計(jì)數(shù)為1171.84。b.僅為2x2表格計(jì)算。
表4可以看出:在交通事故中,事故責(zé)任方上存在顯著的性別差,漸進(jìn)顯著性為0;表現(xiàn)為事故中男性是責(zé)任方的概率更大;而女性為責(zé)任方的概率更小。
表4.性別*事故責(zé)任情況交叉表
對(duì)步驟S2中事故責(zé)任方的年齡、駕齡Excel統(tǒng)計(jì)結(jié)果如圖4。
從圖4可得:駕齡在1—12年的,其事故發(fā)生次數(shù)隨著駕齡的增長(zhǎng)而增長(zhǎng),到12年達(dá)到最大值,其后,隨著駕齡的增加,事故發(fā)生次數(shù)不斷降低;事故高發(fā)駕齡區(qū)間為8—15年和3—5年。
從事故責(zé)任方年齡分布直方圖5來(lái)看,因?yàn)椴煌挲g段擁有的車輛基數(shù)不同,因此不具有重要的統(tǒng)計(jì)意義。
S3、由S2得到的結(jié)果,使用決策樹(shù)對(duì)交通事故高發(fā)人員判斷,得到事故高發(fā)人員及其發(fā)生的事故類型。
對(duì)上述步驟S3中關(guān)于事故高發(fā)人群的特征進(jìn)行決策樹(shù)分析,利用SPSS中分類-樹(shù)模型,分析結(jié)果如下:
表5.模型摘要
使用CHAID(chi-squared automatic interaction detection,卡方自動(dòng)交互檢測(cè))決策樹(shù)算法進(jìn)行樹(shù)生長(zhǎng),因?yàn)镃HAID會(huì)防止數(shù)據(jù)被過(guò)度套用并讓判定樹(shù)停止分割,依據(jù)的衡量標(biāo)準(zhǔn)是計(jì)算節(jié)點(diǎn)中類別的P值大小,以此決定判定是否繼續(xù)分割,所以不需要做樹(shù)剪枝。模型中因變量是事故發(fā)生次數(shù),其賦值如上表所示;自變量是司機(jī)年齡、駕齡、性別、違法次數(shù)、司機(jī)名下的車輛數(shù)(異車率)。利用交叉驗(yàn)證的方法對(duì)風(fēng)險(xiǎn)評(píng)估有效性驗(yàn)證;模型結(jié)果顯示:司機(jī)名下車輛數(shù)(異車率)、違法次數(shù)、司機(jī)駕齡三個(gè)自變量被選入并按重要性依次遞減;其余自變量對(duì)模型沒(méi)有顯著貢獻(xiàn),自動(dòng)從模型中排出;
表6.風(fēng)險(xiǎn)評(píng)估與分類
表6中,生長(zhǎng)法:CHAID。因變量:事故發(fā)生次數(shù):0=不負(fù)責(zé)任的、1=事故責(zé)任1-2次;2=事故責(zé)任3-5次。
從表6的風(fēng)險(xiǎn)評(píng)估表中可以看出,0.283風(fēng)險(xiǎn)估計(jì)表示按照模型(無(wú)事故責(zé)任、事故責(zé)任1-2次、事故責(zé)任3-5次),預(yù)測(cè)分類錯(cuò)誤率為28.3%;分類表中給 出的結(jié)果與風(fēng)險(xiǎn)估計(jì)一致;分類表顯示司機(jī)正確的分類約為72%;
圖6是本決策樹(shù)模型的具體樹(shù)表,主要是因變量在每個(gè)分類中個(gè)案的數(shù)量和百分比;從圖6中可以得到因變量的預(yù)測(cè)分類??梢钥吹剿緳C(jī)名下的車輛數(shù),顯著影響交通事故發(fā)生次數(shù)的百分比;因此,第一次分類指標(biāo)就是司機(jī)名下車輛數(shù),在兩種不同的類別里,司機(jī)事故發(fā)生比例具有明顯的差異,依次類推。最終得到的結(jié)果必然是完全分類后司機(jī)事故次數(shù)差異化最明顯。
S4、環(huán)境變量特征分析,使用K中心聚類的方法,依據(jù)路段發(fā)生事故類型比例,得到城市路段聚類結(jié)果;使用統(tǒng)計(jì)的方法,得到事故發(fā)生時(shí)間、天氣、車輛顏色在事故發(fā)生率上分布情況。其中,環(huán)境變量包括研究時(shí)段內(nèi)事故發(fā)生地的天氣數(shù)據(jù)。
S5、應(yīng)用S4的結(jié)果,依據(jù)聚類后的各路段類型的聚類中心,判斷路段事故種類復(fù)雜度,作為第一排序依據(jù);將路段事故數(shù)量作為第二排序依據(jù);得到道路類型及處理等級(jí)表;得到事故高發(fā)時(shí)間、天氣、車輛顏色規(guī)律。
對(duì)于步驟S4中的事故地點(diǎn)聚類分析,將事故高發(fā)地發(fā)生的事故類型進(jìn)行EXCEL統(tǒng)計(jì)后,篩選出事故發(fā)生數(shù)量≥20次的地點(diǎn);依據(jù)該地點(diǎn)事故發(fā)生類型比例,進(jìn)行聚類分析,結(jié)果如表7。
表7.事故高發(fā)地發(fā)生事故類型聚類ANOVA方差分析表
根據(jù)ANOVA分析表可得:事故因素是“逆行的”、“開(kāi)關(guān)車門的”、“違反交通信號(hào)的”這三類對(duì)于事故地點(diǎn)聚類結(jié)果沒(méi)有顯著性影響。
表8.事故高發(fā)地發(fā)生事故類型最終聚類中心及聚類數(shù)
根據(jù)最終聚類中心表8可得:對(duì)于所有路段來(lái)說(shuō),事故類型為“追尾的”和“未按規(guī)定讓行的”是其主要事故發(fā)生類型;路段1、2、3的事故類型為“追尾的”的比例依次遞增,與此同時(shí)事故類型為“未按規(guī)定讓行的”的比例依次遞減;對(duì)于路段1和2來(lái)說(shuō)事故發(fā)生主要類型是“未按規(guī)定讓行的”;對(duì)于路段3來(lái)說(shuō),事故發(fā)生主要類型是“追尾的”;因此可以集中精力解決某一路段的主要事故發(fā)生類型。
相比來(lái)說(shuō),路段2的事故發(fā)生類型相對(duì)路段1和3較全面多樣;因此推測(cè)路段2的道路狀況更加復(fù)雜,治理難度相對(duì)較大,而路段1和路段3的事故發(fā)生類型更加單一,所以治理難度相對(duì)較小;
根據(jù)事故類型復(fù)雜度,路段治理難度排序?yàn)?、3、2依次遞增。再按照各地點(diǎn)事故發(fā)生次數(shù),將該市部分路段交通事故采取預(yù)防措施優(yōu)先等級(jí)列出表9以供交通管理人員參考。
表9貴陽(yáng)市事故常發(fā)性路段分類及優(yōu)先等級(jí)
對(duì)步驟S4中事故發(fā)生時(shí)間的分析,實(shí)施例中統(tǒng)計(jì)2015年1月2日到2015年5月30日內(nèi)的不同日期類型一天內(nèi)的事故數(shù)量,從圖7可以看出,工作日和休息日的事故時(shí)間分布存在著顯著的差異,工作日的事故發(fā)生高峰期在早上八點(diǎn)到九點(diǎn)之間,對(duì)應(yīng)著上班高峰期;次高峰出現(xiàn)在17點(diǎn)到18點(diǎn)左右,對(duì)應(yīng)著下班高峰期;而節(jié)假日事故發(fā)生時(shí)段較分散,集中在9點(diǎn)到18點(diǎn)之間。
這期間內(nèi)總計(jì)151天,發(fā)生事故18151起,勞動(dòng)節(jié)、清明節(jié)共計(jì)6天,發(fā)生事故858起;其中假日時(shí)間占總時(shí)間3.97%,假日事故數(shù)量占總數(shù)量4.73%;因此,假日期間是事故高發(fā)時(shí)間。
對(duì)于步驟S4中事故發(fā)生天氣的分析,本例中統(tǒng)計(jì)2015年1月2日到2015年5月30日內(nèi)的18151起事故發(fā)生時(shí)的天氣分布情況,與期間內(nèi)天氣分布對(duì)比,用事故發(fā)生時(shí)的天氣分布比例減去實(shí)際天氣分布比例,再按大小進(jìn)行排序,得到圖8;圖8顯示,前十種天氣類型下,事故發(fā)生比例比不發(fā)生事故的比例要高,并且逐次遞減至多云/陣雨,從此種天氣后往后的天氣下,不發(fā)生事故的比例要比發(fā)生事故的比例高并且逐次遞增至陣雨轉(zhuǎn)陣雨的天氣達(dá)到最大值。
對(duì)于步驟S4中事故發(fā)生車輛顏色的分析,本例中統(tǒng)計(jì)2015年1月2日到2015年5月30日內(nèi)的18151起事故的36302輛車,剔除壞數(shù)據(jù),最終剩下36060輛車,其中包括18873輛肇事車輛和17187輛被肇事車輛,涉及車輛顏色9種;我們用被肇事車輛顏色的百分比分布減去肇事車輛顏色的百分比分布;如圖9所示:在事故中,白色、銀色、紅色的車輛更多的是肇事車輛,更少的是被肇事車輛。而現(xiàn)實(shí)中,司機(jī)發(fā)生交通事故與否與自身駕駛的車輛顏色無(wú)關(guān),而與對(duì)方車輛的顏色有一些關(guān)系;所以,車身顏色為白色、銀色、紅色的車輛相對(duì)較安全,不容易被肇事。
S6、綜合步驟S3、S5得到的結(jié)論,結(jié)合司機(jī)自身特點(diǎn)及其所處的環(huán)境狀況,有針對(duì)化的行車提醒,同時(shí)讓交通管理部門進(jìn)行事故預(yù)警;作為市政管理部門進(jìn)行道路管養(yǎng)的參考。