本發(fā)明涉及圖像處理及智能交通監(jiān)控技術(shù)領(lǐng)域,具體而言,涉及一種駕駛員手持電話行為檢測方法及裝置。
背景技術(shù):
駕駛員在駕駛過程中,需要雙手握住方向盤,并且集中注意力觀察路況及周圍環(huán)境,如果駕駛員在駕駛過程中有手持電話行為,這時駕駛員就會單手握方向盤,這會對駕駛員駕駛車輛形成較大障礙;并且,駕駛員在駕駛車輛時接打電話容易分散注意力,妨礙駕駛員對路況及周圍環(huán)境的觀察,降低對外圍視覺的感知能力,危害駕駛員的行車安全,因此,對駕駛員行車過程中的手持電話行為進(jìn)行檢測和警報就顯得尤為重要。
相關(guān)技術(shù)中的駕駛員手持電話行為檢測方法,大都是建立人臉檢測的基礎(chǔ)上,即檢測駕駛員的臉部位置,根據(jù)駕駛員的臉部位置確定出手持電話在左右臉部的位置,通過特征檢測的方法檢測駕駛員是否有手持電話行為。
但是相關(guān)技術(shù)中的方法,由于受到光照、分辨率的影響,可能無法從采集的駕駛員的圖像中檢測到駕駛員的人臉,從而導(dǎo)致無法檢測到駕駛員是否有手持電話行為。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本發(fā)明實(shí)施例的目的在于提供一種駕駛員手持電話行為檢測方法及裝置,以解決現(xiàn)有技術(shù)中依賴于駕駛員的臉部位置來檢測駕駛員是否有手持電話行為時,當(dāng)受到光照、分辨率的影響時,可能無法從采集的駕駛員的圖像中檢測到駕駛員的臉部位置,從而導(dǎo)致無法檢測到駕駛員是否有手持電話行為的問題。
第一方面,本發(fā)明實(shí)施例提供了一種駕駛員手持電話行為檢測方法,其中,所述方法包括:
采集待檢測駕駛員所在車輛圖像;
從采集的車輛圖像中獲取車輛的外接矩形區(qū)域圖像;
從所述外接矩形區(qū)域圖像中定位所述待檢測駕駛員的駕駛區(qū)域,得到駕駛區(qū)域圖像;
根據(jù)所述駕駛區(qū)域圖像、預(yù)先訓(xùn)練的舉手行為檢測模型及預(yù)先訓(xùn)練的舉手行為分類模型對所述待檢測駕駛員進(jìn)行手持電話行為檢測。
結(jié)合第一方面,本發(fā)明實(shí)施例提供了上述第一方面的第一種可能的實(shí)現(xiàn)方式,其中,所述從所述外接矩形區(qū)域圖像中定位所述待檢測駕駛員的駕駛區(qū)域,得到駕駛區(qū)域圖像,包括:
根據(jù)所述外接矩形區(qū)域圖像,對所述車輛的車前窗進(jìn)行粗定位,得到粗定位的車前窗區(qū)域圖像;
從所述粗定位的車前窗區(qū)域圖像中,定位所述車前窗的上下邊緣,得到確定上下邊緣的車前窗區(qū)域圖像;
從所述確定上下邊緣的車前窗區(qū)域圖像中,定位所述車前窗的左右邊緣,得到車前窗區(qū)域圖像;
將所述車前窗區(qū)域圖像劃分為左半?yún)^(qū)域和右半?yún)^(qū)域,將所述右半?yún)^(qū)域確定為所述待檢測駕駛員的駕駛區(qū)域,得到所述駕駛區(qū)域圖像。
結(jié)合第一方面的第一種可能的實(shí)現(xiàn)方式,本發(fā)明實(shí)施例提供了上述第一方面的第二種可能的實(shí)現(xiàn)方式,其中,所述從所述粗定位的車前窗區(qū)域圖像中,定位所述車前窗的上下邊緣,包括:
獲取所述粗定位的車前窗區(qū)域圖像的邊緣強(qiáng)度的二值化圖;
將所述邊緣強(qiáng)度的二值化圖進(jìn)行水平投影,得到水平邊緣投影圖;
將所述水平邊緣投影圖中的投影點(diǎn)按照邊緣響應(yīng)強(qiáng)度進(jìn)行排序;
從排序后的投影點(diǎn)中,按照邊緣響應(yīng)強(qiáng)度從強(qiáng)到弱的順序依次選取兩個投影點(diǎn),將所述兩個投影點(diǎn)之間的距離與預(yù)設(shè)距離范圍進(jìn)行比對,將滿足所述預(yù)設(shè)距離范圍的兩個投影點(diǎn)對應(yīng)的邊緣確定為所述車前窗的上下邊緣。
結(jié)合第一方面的第一種可能的實(shí)現(xiàn)方式,本發(fā)明實(shí)施例提供了上述第一方面的第三種可能的實(shí)現(xiàn)方式,其中,所述從所述確定上下邊緣的車前窗區(qū)域圖像中,定位所述車前窗的左右邊緣,包括:
按照預(yù)設(shè)比例將所述確定上下邊緣的車前窗區(qū)域圖像劃分為左部區(qū)域圖像和右部區(qū)域圖像;
計(jì)算所述左部區(qū)域圖像中每個像素點(diǎn)的梯度方向角,根據(jù)所述梯度方向角獲取所述左部區(qū)域圖像的二值化圖像;
對所述二值化圖像中的像素點(diǎn)進(jìn)行垂直投影,得到垂直投影圖;
確定出所述垂直投影圖中的投影峰值點(diǎn),根據(jù)所述投影峰值點(diǎn)確定所述車前窗的左邊緣;
根據(jù)所述右部區(qū)域圖像確定所述車前窗的右邊緣。
結(jié)合第一方面的第一種可能的實(shí)現(xiàn)方式,本發(fā)明實(shí)施例提供了上述第一方面的第四種可能的實(shí)現(xiàn)方式,其中,所述根據(jù)所述外接矩形區(qū)域圖像,對所述車輛的車前窗進(jìn)行粗定位,得到粗定位的車前窗區(qū)域圖像,包括:
將距離所述外接矩形區(qū)域圖像的上邊界下方第一預(yù)設(shè)距離的位置確定為粗定位的車前窗的下邊緣;
將距離所述外接矩形區(qū)域圖像的上邊界上方第二預(yù)設(shè)距離的位置確定為粗定位的車前窗的上邊緣;
將所述粗定位的車前窗的上邊緣與所述粗定位的車前窗的下邊緣之間的區(qū)域確定為粗定位的車前窗區(qū)域,得到粗定的車前窗區(qū)域圖像。
結(jié)合第一方面,本發(fā)明實(shí)施例提供了上述第一方面的第五種可能的實(shí)現(xiàn)方式,其中,所述根據(jù)所述駕駛區(qū)域圖像、預(yù)先訓(xùn)練的舉手行為檢測模型及預(yù)先訓(xùn)練的舉手行為分類模型對所述待檢測駕駛員進(jìn)行手持電話行為檢測,包括:
根據(jù)所述駕駛區(qū)域圖像及所述舉手行為檢測模型對所述待檢測駕駛員進(jìn)行舉手行為檢測;
當(dāng)舉手行為檢測結(jié)果指示所述待檢測駕駛員存在舉手行為時,根據(jù)所述駕駛區(qū)域圖像及所述舉手行為分類模型對所述待檢測駕駛員進(jìn)行手持電話行為檢測。
結(jié)合第一方面的第五種可能的實(shí)現(xiàn)方式,本發(fā)明實(shí)施例提供了上述第一方面的第六種可能的實(shí)現(xiàn)方式,其中,所述根據(jù)所述駕駛區(qū)域圖像及所述舉手行為檢測模型對所述待檢測駕駛員進(jìn)行舉手行為檢測,包括:
對所述駕駛區(qū)域圖像進(jìn)行歸一化處理,得到第一預(yù)設(shè)尺寸的駕駛區(qū)域圖像;
從所述第一預(yù)設(shè)尺寸的駕駛區(qū)域圖像中提取所述待檢測駕駛員手臂的第一聚合通道特征,所述第一聚合通道特征包括灰度特征、梯度幅值及六個梯度方向特征;
通過所述舉手行為檢測模型及所述第一聚合通道特征計(jì)算所述待檢測駕駛員手臂不同位置的得分,根據(jù)所述得分判斷所述待檢測駕駛員是否有舉手行為。
結(jié)合第一方面的第六種可能的實(shí)現(xiàn)方式,本發(fā)明實(shí)施例提供了上述第一方面的第七種可能的實(shí)現(xiàn)方式,其中,所述當(dāng)舉手行為檢測結(jié)果指示所述待檢測駕駛員存在舉手行為時,根據(jù)所述駕駛區(qū)域圖像及所述舉手行為分類模型對所述待檢測駕駛員進(jìn)行手持電話行為檢測,包括:
根據(jù)舉手行為檢測結(jié)果,將得分最高的手臂位置確定為手持電話行為檢測的位置;
從所述駕駛區(qū)域圖像中提取所述待檢測駕駛員得分最高的手臂位置的第二聚合通道特征,所述第二聚合通道特征包括灰度特征、梯度幅值及12個梯度方向特征;
分別通過預(yù)先訓(xùn)練的舉手行為模型及所述第二聚合通道特征計(jì)算每個舉手行為模型的得分,根據(jù)所述每個舉手行為模型的得分判斷所述待檢測駕駛員是否有手持電話行為。
第二方面,本發(fā)明實(shí)施例提供了一種駕駛員手持電話行為檢測裝置,其中,所述裝置包括:
采集模塊,用于采集待檢測駕駛員所在車輛圖像;
獲取模塊,用于從采集的車輛圖像中獲取車輛的外接矩形區(qū)域圖像;
定位模塊,用于從所述外接矩形區(qū)域圖像中定位所述待檢測駕駛員的駕駛區(qū)域,得到駕駛區(qū)域圖像;
手持電話行為檢測模塊,用于根據(jù)所述駕駛區(qū)域圖像、預(yù)先訓(xùn)練的舉手行為檢測模型及預(yù)先訓(xùn)練的舉手行為分類模型對所述待檢測駕駛員進(jìn)行手持電話行為檢測。
結(jié)合第二方面,本發(fā)明實(shí)施例提供了上述第二方面的第一種可能的實(shí)現(xiàn)方式,其中,所述定位模塊包括:
第一定位單元,用于根據(jù)所述外接矩形區(qū)域圖像,對所述車輛的車前窗進(jìn)行粗定位,得到粗定位的車前窗區(qū)域圖像;
第二定位單元,用于從所述粗定位的車前窗區(qū)域圖像中,定位所述車前窗的上下邊緣,得到確定上下邊緣的車前窗區(qū)域圖像;
第三定位單元,用于從所述確定上下邊緣的車前窗區(qū)域圖像中,定位所述車前窗的左右邊緣,得到車前窗區(qū)域圖像;
確定單元,用于將所述車前窗區(qū)域圖像劃分為左半?yún)^(qū)域和右半?yún)^(qū)域,將所述右半?yún)^(qū)域確定為所述待檢測駕駛員的駕駛區(qū)域,得到所述駕駛區(qū)域圖像。
結(jié)合第二方面的第一種可能的實(shí)現(xiàn)方式,本發(fā)明實(shí)施例提供了上述第二方面的第二種可能的實(shí)現(xiàn)方式,其中,所述第二定位單元,用于獲取所述粗定位的車前窗區(qū)域圖像的邊緣強(qiáng)度的二值化圖;將所述邊緣強(qiáng)度的二值化圖進(jìn)行水平投影,得到水平邊緣投影圖;將所述水平邊緣投影圖中的投影點(diǎn)按照邊緣響應(yīng)強(qiáng)度進(jìn)行排序;從排序后的投影點(diǎn)中,按照邊緣響應(yīng)強(qiáng)度從強(qiáng)到弱的順序依次選取兩個投影點(diǎn),將所述兩個投影點(diǎn)之間的距離與預(yù)設(shè)距離范圍進(jìn)行比對,將滿足所述預(yù)設(shè)距離范圍的兩個投影點(diǎn)對應(yīng)的邊緣確定為所述車前窗的上下邊緣。
結(jié)合第二方面的第一種可能的實(shí)現(xiàn)方式,本發(fā)明實(shí)施例提供了上述第二方面的第三種可能的實(shí)現(xiàn)方式,其中,所述第三定位單元,用于按照預(yù)設(shè)比例將所述確定上下邊緣的車前窗區(qū)域圖像劃分為左部區(qū)域圖像和右部區(qū)域圖像;計(jì)算所述左部區(qū)域圖像中每個像素點(diǎn)的梯度方向角,根據(jù)所述梯度方向角獲取所述左部區(qū)域圖像的二值化圖像;對所述二值化圖像中的像素點(diǎn)進(jìn)行垂直投影,得到垂直投影圖;確定出所述垂直投影圖中的投影峰值點(diǎn),根據(jù)所述投影峰值點(diǎn)確定所述車前窗的左邊緣;根據(jù)所述右部區(qū)域圖像確定所述車前窗的右邊緣。
結(jié)合第二方面的第一種可能的實(shí)現(xiàn)方式,本發(fā)明實(shí)施例提供了上述第二方面的第四種可能的實(shí)現(xiàn)方式,其中,所述第一定位單元,用于將距離所述外接矩形區(qū)域圖像的上邊界下方第一預(yù)設(shè)距離的位置確定為粗定位的車前窗的下邊緣;將距離所述外接矩形區(qū)域圖像的上邊界上方第二預(yù)設(shè)距離的位置確定為粗定位的車前窗的上邊緣;將所述粗定位的車前窗的上邊緣與所述粗定位的車前窗的下邊緣之間的區(qū)域確定為粗定位的車前窗區(qū)域,得到粗定的車前窗區(qū)域圖像。
結(jié)合第二方面,本發(fā)明實(shí)施例提供了上述第二方面的第五種可能的實(shí)現(xiàn)方式,其中,所述手持電話行為檢測模塊包括:
舉手行為檢測單元,用于根據(jù)所述駕駛區(qū)域圖像及所述舉手行為檢測模型對所述待檢測駕駛員進(jìn)行舉手行為檢測;
手持電話行為檢測單元,用于當(dāng)舉手行為檢測結(jié)果指示所述待檢測駕駛員存在舉手行為時,根據(jù)所述駕駛區(qū)域圖像及所述舉手行為分類模型對所述待檢測駕駛員進(jìn)行手持電話行為檢測。
結(jié)合第二方面的第五種可能的實(shí)現(xiàn)方式,本發(fā)明實(shí)施例提供了上述第二方面的第六種可能的實(shí)現(xiàn)方式,其中,所述舉手行為檢測單元,用于對所述駕駛區(qū)域圖像進(jìn)行歸一化處理,得到第一預(yù)設(shè)尺寸的駕駛區(qū)域圖像;從所述第一預(yù)設(shè)尺寸的駕駛區(qū)域圖像中提取所述待檢測駕駛員手臂的第一聚合通道特征,所述第一聚合通道特征包括灰度特征、梯度幅值及六個梯度方向特征;通過所述舉手行為檢測模型及所述第一聚合通道特征計(jì)算所述待檢測駕駛員手臂不同位置的得分,根據(jù)所述得分判斷所述待檢測駕駛員是否有舉手行為。
結(jié)合第二方面的第六種可能的實(shí)現(xiàn)方式,本發(fā)明實(shí)施例提供了上述第二方面的第七種可能的實(shí)現(xiàn)方式,其中,所述手持電話行為檢測單元,用于根據(jù)舉手行為檢測結(jié)果,將得分最高的手臂位置確定為手持電話行為檢測的位置;從所述駕駛區(qū)域圖像中提取所述待檢測駕駛員得分最高的手臂位置的第二聚合通道特征,所述第二聚合通道特征包括灰度特征、梯度幅值及12個梯度方向特征;分別通過預(yù)先訓(xùn)練的舉手行為模型及所述第二聚合通道特征計(jì)算每個舉手行為模型的得分,根據(jù)所述每個舉手行為模型的得分判斷所述待檢測駕駛員是否有手持電話行為。
本發(fā)明實(shí)施例提供的駕駛員手持電話行為檢測方法及裝置,不依賴于檢測待檢測駕駛員的臉部位置,能夠準(zhǔn)確的檢測出駕駛員是否有手持電話行為,避免了由于受到光照、分辨率的影響無法檢測出臉部位置,進(jìn)而無法檢測駕駛員是否有手持電話行為的情況。
為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能更明顯易懂,下文特舉較佳實(shí)施例,并配合所附附圖,作詳細(xì)說明如下。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例的技術(shù)方案,下面將對實(shí)施例中所需要使用的附圖作簡單地介紹,應(yīng)當(dāng)理解,以下附圖僅示出了本發(fā)明的某些實(shí)施例,因此不應(yīng)被看作是對范圍的限定,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他相關(guān)的附圖。
圖1示出了本發(fā)明實(shí)施例1所提供的一種駕駛員手持電話行為檢測方法的流程圖;
圖2示出了本發(fā)明實(shí)施例2所提供的一種駕駛員手持電話行為檢測裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。通常在此處附圖中描述和示出的本發(fā)明實(shí)施例的組件可以以各種不同的配置來布置和設(shè)計(jì)。因此,以下對在附圖中提供的本發(fā)明的實(shí)施例的詳細(xì)描述并非旨在限制要求保護(hù)的本發(fā)明的范圍,而是僅僅表示本發(fā)明的選定實(shí)施例。基于本發(fā)明的實(shí)施例,本領(lǐng)域技術(shù)人員在沒有做出創(chuàng)造性勞動的前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
考慮到相關(guān)技術(shù)中的駕駛員的手持電話行為檢測方法,大都是建立在人臉檢測的基礎(chǔ)上,即先檢測駕駛員的臉部位置,根據(jù)駕駛員的臉部位置確定出手持電話在左右臉的位置,通過特征檢測的方法檢測駕駛員是否有手持電話行為。但是,相關(guān)技術(shù)中的檢測方法,容易受到光照、分辨率的影響,從容無法從采集的駕駛員的圖像中檢測到駕駛員的人臉,從而導(dǎo)致無法檢測到駕駛員是否有手持電話行為?;诖?,本發(fā)明實(shí)施例提供了一種駕駛員手持電話行為檢測方法及裝置,下面通過實(shí)施例進(jìn)行描述。
實(shí)施例1
本發(fā)明實(shí)施例提供了一種駕駛員手持電話行為檢測方法,該方法通過從駕駛員所在車輛圖像中檢測駕駛員的駕駛區(qū)域,得到駕駛區(qū)域圖像,并根據(jù)駕駛區(qū)域圖像對待檢測駕駛員進(jìn)行舉手行為檢測和舉手行為分類,從而識別待檢測駕駛員是否有手持電話行為,本方法不依賴于駕駛員的臉部位置就可以對駕駛員是否有手持電話行為進(jìn)行檢測。
在使用本發(fā)明實(shí)施例提供的方法檢測駕駛員是否有手持電話行為之前,需要采用Adaboost(通過迭代弱分類器產(chǎn)生強(qiáng)分類器)學(xué)習(xí)方法,對駕駛員的舉手行為特征進(jìn)行學(xué)習(xí),訓(xùn)練舉手行為檢測模型和舉手行為分類模型。
其中,上述訓(xùn)練的舉手行為檢測模型為一組大小不同的舉手行為檢測模型,上述訓(xùn)練的舉手行為分類模型為三類,分別為駕駛員打手機(jī)的行為模型,駕駛員面部動作行為模型及駕駛員頭部動作行為模型,在駕駛員打手機(jī)行為模型中,駕駛員的手放在頭部的側(cè)面,在駕駛員面部動作行為模型中,駕駛員的手放在前臉面部,在駕駛員頭部動作行為模型中,駕駛員的手放在頭部。
采用本發(fā)明實(shí)施例提供的方法檢測駕駛員是否有手持電話行為,如圖1所示,包括步驟S110-S140。
S110,采集待檢測駕駛員所在車輛圖像。
可以通過交通卡口攝像機(jī)采集待檢測駕駛員所在車輛圖像,當(dāng)車輛在路上行駛時,當(dāng)進(jìn)入到交通卡口攝像機(jī)的采集區(qū)域時,交通卡口的攝像機(jī)會以一定的幀率連續(xù)采集經(jīng)過的車輛圖像。
S120,從采集的車輛圖像中獲取車輛的外接矩形區(qū)域圖像。
當(dāng)交通卡口的攝像機(jī)采集到行駛車輛的車輛圖像后,采用Adaboost算法從采集的每幀車輛圖像中檢測出該圖像中車輛的位置坐標(biāo),車輛的位置坐標(biāo)指的是車輛外接矩形的四個端點(diǎn)坐標(biāo),根據(jù)車輛外接矩形的四個端點(diǎn)坐標(biāo)可以確定出車輛外接矩形的四個端點(diǎn),將四個端點(diǎn)連接起來可以得到車輛的外接矩形區(qū)域圖像。
S130,從上述外接矩形區(qū)域圖像中定位待檢測駕駛員的駕駛區(qū)域,得到駕駛區(qū)域圖像。
在本發(fā)明實(shí)施例中,從外接矩形區(qū)域圖像中定位出待檢測駕駛員的駕駛區(qū)域,可以首先從外接矩形區(qū)域圖像中定位出車前窗區(qū)域,將車前窗區(qū)域的右半?yún)^(qū)域確定為駕駛區(qū)域,具體過程包括:根據(jù)外接矩形區(qū)域圖像,對車輛的車前窗進(jìn)行粗定位,得到粗定位的車前窗區(qū)域圖像;從粗定位的車前窗區(qū)域圖像中,定位車前窗的上下邊緣,得到確定上下邊緣的車前窗區(qū)域圖像;從確定上下邊緣的車前窗區(qū)域圖像中,定位車前窗的左右邊緣,得到車前窗區(qū)域圖像;將車前窗區(qū)域圖像劃分為左半?yún)^(qū)域和右半?yún)^(qū)域,將右半?yún)^(qū)域確定為待檢測駕駛員的駕駛區(qū)域,得到駕駛區(qū)域圖像。
上述過程中,首先需要對車前窗進(jìn)行粗定位,具體包括:將距離外接矩形區(qū)域圖像的上邊界下方第一預(yù)設(shè)距離的位置確定為粗定位的車前窗的下邊緣;將距離外接矩形區(qū)域圖像的上邊界上方第二預(yù)設(shè)距離的位置確定為粗定位的車前窗的上邊緣;將粗定位的車前窗的上邊緣與粗定位的車前窗的下邊緣之前的區(qū)域確定為粗定位的車前窗區(qū)域。
上述第一預(yù)設(shè)距離可以是車輛的外接矩形圖像高度的3/5,上述第二預(yù)設(shè)距離為0到車輛的外接矩形圖像高度的1/4之間的任意數(shù)值,當(dāng)然,上述第一預(yù)設(shè)距離和第二預(yù)設(shè)距離還可以是其它的數(shù)值,本發(fā)明實(shí)施例并不限定上述第一預(yù)設(shè)距離和第二預(yù)設(shè)距離的具體數(shù)值,只要第一預(yù)設(shè)距離和第二預(yù)設(shè)距離的取值能夠保證車前窗在粗定位的區(qū)域范圍內(nèi)即可。
上述粗定位的車前窗區(qū)域比實(shí)際的車前窗區(qū)域大,目的是保證車前窗能夠完全包含在粗定位的車前窗區(qū)域內(nèi),由于粗定位的車前窗區(qū)域比實(shí)際的車前窗大,因此,獲取了粗定位的車前窗區(qū)域后,還需要根據(jù)粗定位的車前窗區(qū)域?qū)嚽按斑M(jìn)行精確定位,即獲取實(shí)際的車前窗的上下邊緣及左右邊緣。
首先根據(jù)粗定位的車前窗區(qū)域,定位出車前窗的上下邊緣,具體包括:獲取粗定位的車前窗區(qū)域的邊緣強(qiáng)度的二值化圖;將邊緣強(qiáng)度的二值化圖進(jìn)行水平投影,得到水平邊緣投影圖;將水平邊緣投影圖中的投影點(diǎn)按照邊緣響應(yīng)強(qiáng)度進(jìn)行排序;從排序后的投影點(diǎn)中,按照邊緣響應(yīng)強(qiáng)度從強(qiáng)到弱的順序依次選取兩個投影點(diǎn),將上述兩個投影點(diǎn)之間的距離與預(yù)設(shè)距離范圍進(jìn)行比對,將滿足預(yù)設(shè)距離范圍的兩個投影點(diǎn)對應(yīng)的邊緣確定為車前窗的上下邊緣。
在本發(fā)明實(shí)施例中,當(dāng)?shù)玫酱侄ㄎ坏能嚽按皡^(qū)域圖像后,對粗定位的車前窗區(qū)域圖像進(jìn)行直方圖均衡化處理,即采用直方圖對粗定位的車前窗區(qū)域圖像進(jìn)行預(yù)處理,以調(diào)整粗定位的車前窗區(qū)域圖像的前景層和背景層的對比度,增強(qiáng)粗定位的車前窗區(qū)域圖像的前景層和背景層之間的對比度,在對粗定位的車前窗區(qū)域圖像進(jìn)行直方圖均衡化處理后,對處理后的粗定位的車前窗區(qū)域圖像進(jìn)行邊緣檢測,得到粗定位的車前窗區(qū)域圖像的邊緣強(qiáng)度圖,在對粗定位的車前窗區(qū)域圖像進(jìn)行邊緣檢測時,可以使用Sobel(索貝爾)等邊緣檢測算子,也可以使用[-1 0 1]T模板等等,本發(fā)明并不限定上述進(jìn)行邊緣檢測時具體使用的邊緣檢測算子。
得到粗定位的車前窗區(qū)域圖像的邊緣強(qiáng)度圖后,對上述邊緣強(qiáng)度圖進(jìn)行二值化處理,設(shè)定像素值的閾值T,將邊緣強(qiáng)度圖中的像素值小于T的像素點(diǎn)的像素值設(shè)置為零,將邊緣強(qiáng)度圖中像素值大于或等于T的像素點(diǎn)的像素值設(shè)置為1,這樣,上述邊緣強(qiáng)度圖中像素點(diǎn)的像素值只有0和1兩個數(shù)值,得到邊緣強(qiáng)度圖的二值化圖,其中,上述閾值T的取值范圍為[20,50],上述閾值的具體取值可以根據(jù)實(shí)際應(yīng)用進(jìn)行設(shè)置。
得到邊緣強(qiáng)度的二值化圖后,將邊緣強(qiáng)度的二值化圖進(jìn)行水平投影,即將邊緣強(qiáng)度的二值化圖中的像素點(diǎn)均投影到豎直方向上,得到邊緣強(qiáng)度的二值化圖的水平邊緣投影圖,為了減少上述水平邊緣投影圖中的噪聲,可以通過[1 2 1]T模板對上述水平邊緣投影圖進(jìn)行平滑處理,平滑處理之后,通過非極大值抑制的方法獲取每個鄰域內(nèi)的局部邊緣相應(yīng)強(qiáng)度最大的投影點(diǎn),并將得到的邊緣響應(yīng)強(qiáng)度最大的投影點(diǎn)按照邊緣響應(yīng)強(qiáng)度進(jìn)行排序,可以按照邊緣響應(yīng)強(qiáng)度從強(qiáng)到弱的順序排序,也可以按照邊緣響應(yīng)強(qiáng)度從弱到強(qiáng)的順序進(jìn)行排序,得到排序后的投影點(diǎn)序列,本發(fā)明實(shí)施例并不限定上述投影點(diǎn)的具體排序順序。
當(dāng)?shù)玫缴鲜鏊竭吘壨队皥D中投影點(diǎn)序列后,從上述投影點(diǎn)序列中,按照響應(yīng)強(qiáng)度由強(qiáng)到弱的順序選取兩個投影點(diǎn),比如說,上述投影點(diǎn)按照響應(yīng)強(qiáng)度從強(qiáng)到弱的順序?yàn)镵1,K2,K3,K4…KN,其中,K1、K2、K3…KN均表示的是投影點(diǎn),則首先從上述投影點(diǎn)序列中選取投影點(diǎn)K1和K2進(jìn)行匹配,在進(jìn)行匹配的過程中,獲取投影點(diǎn)K1和K2之間的距離D12,判斷D12是否落在預(yù)設(shè)距離范圍內(nèi),如果D12落在預(yù)設(shè)距離范圍內(nèi),則說明投影點(diǎn)K1和K2匹配成功,將K1、K2對應(yīng)的邊緣線確定為車前窗的上下邊緣,如果D12沒有落在預(yù)設(shè)距離范圍內(nèi),則說明投影點(diǎn)K1和K2匹配不成功,則再選取投影點(diǎn)K1和K3進(jìn)行匹配,獲取邊緣點(diǎn)K1和K3之間的距離D13,判斷D13是否在預(yù)設(shè)距離范圍內(nèi),如果是,則判斷為投影點(diǎn)K1和K3匹配成功,即將投影點(diǎn)K1和K3對應(yīng)的邊緣線確定為車前窗的上下邊緣,如果投影點(diǎn)K1和K3匹配不成功,則滿繼續(xù)從上述投影點(diǎn)序列中選取邊緣點(diǎn)進(jìn)行匹配,直至確定出車前窗的上下邊緣為止,其中,上述預(yù)設(shè)距離范圍為(Dmin,Dmax),即當(dāng)D12滿足Dmin<D12<Dmax時,判斷為投影線K1和K2匹配成功,上述Dmin指的是車前窗上下邊緣之間的最小距離,Dmax指的是車前窗上下邊緣之間的最大距離,對于不同的車輛,Dmin和Dmax的取值可能不相同。
通過上述過程確定了車前窗的上下邊緣,得到確定上下邊緣的車前窗區(qū)域圖像,之后根據(jù)確定上下邊緣的車前窗區(qū)域圖像中,定位出車前窗的左右邊緣,具體包括:按照預(yù)設(shè)比例將確定上下邊緣的車前窗區(qū)域圖像劃分為左部區(qū)域圖像和右部區(qū)域圖像;計(jì)算左部區(qū)域圖像中每個像素點(diǎn)的梯度方向角,根據(jù)梯度方向角獲取左部區(qū)域圖像的二值化圖像;對上述二值化圖像中的像素點(diǎn)進(jìn)行垂直投影,得到垂直投影圖;確定出垂直投影圖中的投影峰值點(diǎn),根據(jù)上述投影峰值點(diǎn)確定車前窗的左邊緣;根據(jù)右部區(qū)域圖像確定車前窗的右邊緣。
在本發(fā)明實(shí)施例中,上述預(yù)設(shè)比例的范圍可以為1/2到1范圍內(nèi)的任意比例值,即上述左部區(qū)域圖像的大小可以是整個確定上下邊緣的車前窗區(qū)域圖像的1/3-1/2之間的任意數(shù)值,本發(fā)明實(shí)施例并不限定上述預(yù)設(shè)比例的具體數(shù)值。
根據(jù)預(yù)設(shè)比例將上述確定上下邊緣的車前窗區(qū)域圖像劃分為左部區(qū)域圖像和右部區(qū)域圖像后,根據(jù)左部區(qū)域圖像確定車前窗的左邊緣,根據(jù)右部區(qū)域圖像確定車前窗的右邊緣,車前窗的左邊緣與右邊緣的確定方法相同,因此,接下來將以根據(jù)左部區(qū)域圖像確定車前窗的左邊緣為例,詳細(xì)介紹確定車前窗的左邊緣的具體過程:
由于上述左部區(qū)域圖像是二維圖像,因此圖像中每個像素點(diǎn)的坐標(biāo)也是二維坐標(biāo),每個像素點(diǎn)的坐標(biāo)可以表示為(x,y),因此,可以通過公式計(jì)算出每個像素點(diǎn)的梯度,其中,在上述公式中,是第i個像素點(diǎn)的梯度,每個像素點(diǎn)的梯度是一個二維矢量,因此可以分解為水平方向的分量及豎直方向上的分量,梯度的水平分量為gx,垂直分量為gy。
每個像素點(diǎn)的梯度方向角是每個像素點(diǎn)的梯度的垂直分量與該梯度的水平分量之間的夾角,即其中,θi是第i個像素點(diǎn)的梯度方向角,gy是第i個像素點(diǎn)梯度的垂直分量,gx是第i個像素點(diǎn)梯度的水平分量,對上述公式進(jìn)行變形,可以得到根據(jù)該公式可以計(jì)算出每個像素點(diǎn)的梯度方向角。
當(dāng)計(jì)算出左部區(qū)域圖像中每個像素點(diǎn)的梯度方向角后,將上述梯度方向角進(jìn)行歸一化處理,將每個梯度方向角均歸一化到[0°,90°]的區(qū)域范圍內(nèi),設(shè)定方向閾值O1和O2,根據(jù)方向閾值O1和O2,對左部區(qū)域圖像進(jìn)行二值化處理,具體過程包括:當(dāng)左部區(qū)域圖像中的像素點(diǎn)的梯度方向角滿足O1<θi<O2時,將該像素點(diǎn)對應(yīng)的像素值設(shè)置為1,當(dāng)左部區(qū)域圖像中的像素點(diǎn)不滿足O1<θi<O2時,將該像素點(diǎn)對應(yīng)的像素值設(shè)置為0,這樣,左部區(qū)域圖像中的像素點(diǎn)的像素值只有0和1兩個數(shù)值,得到左部區(qū)域圖像的二值化圖像,其中,上述閾值O1的取值范圍為上述閾值O2的取值范圍為當(dāng)然,上述閾值O1和閾值O2的取值范圍可以根據(jù)具體應(yīng)用場景進(jìn)行設(shè)置,本發(fā)明實(shí)施例并不限定上述閾值O1和O2的具體取值范圍。
當(dāng)?shù)玫阶蟛繀^(qū)域圖像的二值圖像后,將該二值圖像中的像素值不為零的像素點(diǎn)進(jìn)行垂直投影,將像素值不為零的像素點(diǎn)投影到水平方向上,在本發(fā)明實(shí)施例中,可以將像素值不為零的像素點(diǎn)投影到車前窗下邊緣上,通過公式計(jì)算上述二值圖像中像素點(diǎn)不為零的每個像素點(diǎn)在水平方向上的偏移量,即該點(diǎn)投影到水平方向上的對應(yīng)位置,其中,在上述公式中,x是像素點(diǎn)投影到水平方向上的偏移量,θ是像素點(diǎn)的梯度方向角,ph是像素點(diǎn)到車窗下邊緣的距離。
當(dāng)將上述二值圖像中像素值不為零的點(diǎn)投影到水平方向上,得到該二值圖像的垂直投影圖,為了減少垂直投影圖中的噪聲,對該垂直投影圖進(jìn)行平滑處理,在進(jìn)行平滑處理時,可以采用[1 2 1]模板對上述垂直投影出進(jìn)行平滑處理,進(jìn)行平滑處理后,從平滑處理后的垂直投影圖中找到像素點(diǎn)的投影峰值點(diǎn),過該投影峰值點(diǎn)做與車前窗下邊緣垂直的直線,將該直線確定為車前窗的左邊緣。
采用與上述確定車前窗左邊緣相同的方法,根據(jù)右部區(qū)域確定出車前窗的右邊緣,當(dāng)確定了車前窗的右邊緣后,將車前窗的上下邊緣、左右邊緣圍城的區(qū)域確定為車前窗區(qū)域,得到車前窗區(qū)域圖像,而本發(fā)明實(shí)施例確定出的車前窗區(qū)域?yàn)榫匦螀^(qū)域。
上述確定出了車前窗的區(qū)域圖像,將車前窗的區(qū)域圖像劃分為左半?yún)^(qū)域和右半?yún)^(qū)域,將右半?yún)^(qū)域確定為駕駛區(qū)域,這樣得到了駕駛員的駕駛區(qū)域圖像。
S140,根據(jù)駕駛區(qū)域圖像、預(yù)先訓(xùn)練的舉手行為檢測模型及預(yù)先訓(xùn)練的舉手行為分類模型對待檢測駕駛員進(jìn)行手持電話行為檢測。
在對待檢測駕駛員進(jìn)行手持電話行為檢測時,首先檢測待檢測駕駛員是否有舉手行為,如果判斷出待檢測駕駛員有舉手行為時,在判斷待檢測駕駛員的舉手行為的類別,具體過程包括:根據(jù)駕駛區(qū)域圖像及舉手行為檢測模型對待檢測駕駛員進(jìn)行舉手行為檢測;當(dāng)舉手行為檢測結(jié)果指示待檢測駕駛員存在舉手行為時,根據(jù)駕駛區(qū)域圖像及舉手行為分類模型對所述待檢測駕駛員進(jìn)行手持電話行為檢測。
根據(jù)駕駛區(qū)域圖像及舉手行為檢測模型對待檢測駕駛員進(jìn)行舉手行為檢測,具體包括:對駕駛區(qū)域圖像進(jìn)行歸一化處理,得到第一預(yù)設(shè)尺寸的駕駛區(qū)域圖像;從第一預(yù)設(shè)尺寸的駕駛區(qū)域圖像中提取待檢測駕駛員手臂的第一聚合通道特征,第一聚合通道特征包括灰度特征、梯度幅值及六個梯度方向特征;通過舉手行為檢測模型及第一聚合通道特征計(jì)算待檢測駕駛員手臂不同位置的得分,根據(jù)得分判斷待檢測駕駛員是否有舉手行為。
由于交通卡口攝像機(jī)在拍攝待檢測駕駛員所在車輛圖像時,可能在車輛距離卡口攝像機(jī)一定距離的時候,卡口攝像機(jī)就開始采集車輛圖像,所以采集的車輛圖像大小不等,即確定的駕駛區(qū)域圖像大小不等,所以上述舉手行為檢測模型為預(yù)先訓(xùn)練的一組大小不同的駕駛員舉手行為檢測模型。
為了防止駕駛區(qū)域圖像過大,首先對駕駛區(qū)域圖像進(jìn)行歸一化處理,將駕駛區(qū)域圖像歸一化到固定的尺寸,得到第一預(yù)設(shè)尺寸的駕駛區(qū)域圖像,上述第一預(yù)設(shè)尺寸可以是預(yù)先設(shè)置的一個尺寸數(shù)值,該尺寸的大小可以根據(jù)實(shí)際情況進(jìn)行設(shè)置,本發(fā)明實(shí)施例并不限定上述第一預(yù)設(shè)尺寸的具體大小。
當(dāng)對駕駛區(qū)域圖像進(jìn)行歸一化處理后,從第一預(yù)設(shè)尺寸的駕駛區(qū)域圖像中提取待檢測駕駛員手臂的第一聚合通道特征,駕駛員手臂的第一聚合特征包括駕駛員手臂的灰度特征,即使用黑色調(diào)表示駕駛員的手臂,用黑色作為基準(zhǔn)色,不同的飽和度的黑色來顯示駕駛員的手臂,上述第一聚合通道特征還包括待駕駛區(qū)域圖像中待檢測駕駛員的手臂部位像素點(diǎn)的梯度幅值,以及六個梯度方向特征。
上述六個梯度方向特征指的是將180°平均劃分為六個區(qū)間。
當(dāng)提取了待檢測駕駛員手臂的第一聚合通道特征后,用預(yù)先訓(xùn)練好的一組大小不同的舉手行為檢測模型分別在提取的待檢測駕駛員的第一聚合通道特征圖上進(jìn)行遍歷檢測,檢測結(jié)果為駕駛員手臂不同位置的得分,該得分是通過駕駛員手臂不同位置的第一聚合通道特征和預(yù)先訓(xùn)練的舉手行為檢測模型中各特征的權(quán)重所得的和值,上述駕駛員手臂位置的得分表示的是該位置與舉手行為檢測模型上對應(yīng)位置的匹配程度,得分越高,說明該得分對應(yīng)的位置與舉手行為檢測模型上對應(yīng)位置的匹配程度越高,根據(jù)上述得分可以判斷出駕駛員是否有舉手行為。
同時,在對駕駛員進(jìn)行舉手行為檢測的過程中,可以確定出駕駛區(qū)域圖像的尺寸,因此,在對待檢測駕駛員進(jìn)行舉手行為分類檢測時,直接將駕駛區(qū)域圖像歸一化到與舉手行為分類模型大小一致的尺寸。
當(dāng)舉手行為檢測過程檢測出待檢測駕駛員有舉手行為時,接下來根據(jù)駕駛區(qū)域圖像及舉手行為分類模型,檢測駕駛員是否有手持電話行為,具體包括:根據(jù)舉手行為檢測結(jié)果,將得分最高的手臂位置確定為手持電話行為檢測的位置;從駕駛區(qū)域圖像中提取待檢測駕駛員得分最高的手臂位置的第二聚合通道特征,第二聚合通道特征包括灰度特征、梯度幅值及12個梯度方向特征;分別通過預(yù)先訓(xùn)練的舉手行為模型及第二聚合通道特征計(jì)算每個舉手行為模型的得分,根據(jù)每個舉手行為模型的得分判斷所述待檢測駕駛員是否有手持電話行為。
其中,上述預(yù)先訓(xùn)練的舉手行為分類模型包括三類,分別為駕駛員打手機(jī)行為模型、駕駛員面部動作行為模型及駕駛員頭部動作行為模型,在駕駛員打手機(jī)行為模型中,駕駛員的手放在頭部的側(cè)面,在駕駛員面部動作行為模型中,駕駛員的手放在前臉面部,在駕駛員頭部動作行為模型中,駕駛員的手放在頭部,并且,上述舉手行為分類模型為固定尺寸的模型。
當(dāng)對待檢測駕駛員進(jìn)行舉手行為分類判斷時,將待檢測駕駛員舉手行為檢測中,待檢測駕駛員手臂上得分位置最高的位置作為舉手行為分類檢測的位置,該位置為一個矩形區(qū)域,為了防止該矩形區(qū)域過小不能準(zhǔn)確的對待檢測駕駛員進(jìn)行舉手行為分類判斷,因此,在對待檢測駕駛員進(jìn)行舉手行為分類判斷時,先將該位置區(qū)域外擴(kuò),即將該位置區(qū)域向四周擴(kuò)大一定的比例,外擴(kuò)的寬度可以為原來位置區(qū)域?qū)挾鹊?/2,外擴(kuò)的高度可以為原來位置區(qū)域高度的1/2,并且將得到外擴(kuò)后的駕駛區(qū)域圖像進(jìn)行歸一化處理,歸一化到與舉手行為分類模型的尺寸一致。
從上述外擴(kuò)后的駕駛區(qū)域圖像中提取待檢測駕駛員的上述外擴(kuò)的位置區(qū)域的第二聚合通道特征,提取的第二聚合通道特征包括待檢測駕駛員該位置的灰度特征、梯度幅值和12個梯度方向特征。
上述12個梯度方向特征指的是將180°平均劃分為12個區(qū)間。
當(dāng)提取了待檢測駕駛員的第二聚合通道特征后,用預(yù)先訓(xùn)練好的三組舉手行為分類模型分別在提取的待檢測駕駛員的第二聚合通道特征圖上進(jìn)行遍歷檢測,檢測結(jié)果為三個舉手行為分類模型的得分,將每個舉手行為分類模型的最高得分作為該舉手行為分類模型的最終得分,該得分是通過駕駛員上述位置的第二聚合通道特征和預(yù)先訓(xùn)練的舉手行為分類模型中各特征的權(quán)重所得的和值,上述每個舉手行為分類模型的得分表示的是待檢測駕駛員的舉手行為與該舉手行為分類模型的匹配程度,將得分最高的模型的舉手行為確定為待檢測駕駛員的舉手行為,如果上述得分最高的是駕駛員打手機(jī)行為模型,則判斷為待檢測駕駛員有手持電話行為。
當(dāng)檢測出待檢測駕駛員有手持電話行為時,則執(zhí)行報警操作,并且在執(zhí)行報警操作的同時保存該時刻交通卡口采集的圖像。
本發(fā)明實(shí)施例提供的駕駛員手持電話行為檢測方法,不依賴于檢測待檢測駕駛員的臉部位置,能夠準(zhǔn)確的檢測出駕駛員是否有手持電話行為,避免了由于受到光照、分辨率的影響無法檢測出臉部位置,進(jìn)而無法檢測駕駛員是否有手持電話行為的情況。
實(shí)施例2
本發(fā)明實(shí)施例提供了一種駕駛員手持電話行為檢測裝置,該裝置用于執(zhí)行上述實(shí)施例1提供的駕駛員手持電話行為檢測方法。
如圖2所示,本發(fā)明實(shí)施例提供的駕駛員手持電話行為檢測裝置包括:采集模塊210、獲取模塊220、定位模塊230及手持電話行為檢測模塊240;
上述采集模塊210,用于采集待檢測駕駛員所在車輛圖像;
上述獲取模塊220,用于從采集的車輛圖像中獲取車輛的外接矩形區(qū)域圖像;
上述定位模塊230,用于從上述外接矩形區(qū)域圖像中定位待檢測駕駛員的駕駛區(qū)域,得到駕駛區(qū)域圖像;
上述手持電話行為檢測模塊240,用于根據(jù)上述駕駛區(qū)域圖像、預(yù)先訓(xùn)練的舉手行為檢測模型及預(yù)先訓(xùn)練的舉手行為分類模型對待檢測駕駛員進(jìn)行手持電話行為檢測。
可以通過交通卡口攝像機(jī)采集待檢測駕駛員所在車輛圖像,當(dāng)車輛在路上行駛時,當(dāng)進(jìn)入到交通卡口攝像機(jī)的采集區(qū)域時,交通卡口的攝像機(jī)會以一定的幀率連續(xù)采集經(jīng)過的車輛圖像。
當(dāng)交通卡口的攝像機(jī)采集到行駛車輛的車輛圖像后,采用Adaboost(通過迭代弱分類器產(chǎn)生強(qiáng)分類器)算法從采集的每幀車輛圖像中檢測出該圖像中車輛的位置坐標(biāo),車輛的位置坐標(biāo)指的是車輛外接矩形的四個端點(diǎn)坐標(biāo),根據(jù)車輛外接矩形的四個端點(diǎn)坐標(biāo)可以確定出車輛外接矩形的四個端點(diǎn),將四個端點(diǎn)連接起來可以得到車輛的外接矩形區(qū)域圖像。
上述定位模塊230從外接矩形區(qū)域圖像中定位待檢測駕駛員的駕駛區(qū)域,是通過第一定位單元、第二定位單元、第三定位單元及確定單元來實(shí)現(xiàn)的,具體包括:
上述第一定位單元,用于根據(jù)外接矩形區(qū)域圖像,對車輛的車前窗進(jìn)行粗定位,得到粗定位的車前窗區(qū)域圖像;上述第二定位單元,用于從粗定位的車前窗區(qū)域圖像中,定位車前窗的上下邊緣,得到確定上下邊緣的車前窗區(qū)域圖像;上述第三定位單元,用于從確定上下邊緣的車前窗區(qū)域圖像中,定位車前窗的左右邊緣,得到車前窗區(qū)域圖像;上述確定單元,用于將車前窗區(qū)域圖像劃分為左半?yún)^(qū)域和右半?yún)^(qū)域,將右半?yún)^(qū)域確定為待檢測駕駛員的駕駛區(qū)域,得到駕駛區(qū)域圖像。
上述第二定位單元從粗定位的車前窗區(qū)域圖像中,定位車前窗的上下邊緣,具體包括:獲取粗定位的車前窗區(qū)域圖像的邊緣強(qiáng)度的二值化圖;將邊緣強(qiáng)度的二值化圖進(jìn)行水平投影,得到水平邊緣投影圖;將水平邊緣投影圖中的投影點(diǎn)按照邊緣響應(yīng)強(qiáng)度進(jìn)行排序;從排序后的投影點(diǎn)中,按照邊緣響應(yīng)強(qiáng)度從強(qiáng)到弱的順序依次選取兩個投影點(diǎn),將兩個投影點(diǎn)之間的距離與預(yù)設(shè)距離范圍進(jìn)行比對,將滿足預(yù)設(shè)距離范圍的兩個投影點(diǎn)對應(yīng)的邊緣確定為車前窗的上下邊緣。
上述第三定位單元從確定上下邊緣的車前窗區(qū)域圖像中,定位車前窗的左右邊緣,具體包括:按照預(yù)設(shè)比例將確定上下邊緣的車前窗區(qū)域圖像劃分為左部區(qū)域圖像和右部區(qū)域圖像;計(jì)算左部區(qū)域圖像中每個像素點(diǎn)的梯度方向角,根據(jù)上述梯度方向角獲取左部區(qū)域圖像的二值化圖像;對上述二值化圖像中的像素點(diǎn)進(jìn)行垂直投影,得到垂直投影圖;確定出垂直投影圖中的投影峰值點(diǎn),根據(jù)投影峰值點(diǎn)確定車前窗的左邊緣;根據(jù)右部區(qū)域圖像確定車前窗的右邊緣。
在本發(fā)明實(shí)施例中,上述預(yù)設(shè)比例的范圍可以為1/2到1范圍內(nèi)的任意比例值,即上述左部區(qū)域圖像的大小可以是整個確定上下邊緣的車前窗區(qū)域圖像的1/3-1/2之間的任意數(shù)值,本發(fā)明實(shí)施例并不限定上述預(yù)設(shè)比例的具體數(shù)值。
上述第一定位單元根據(jù)外接矩形區(qū)域圖像,對車輛的前車窗進(jìn)行粗定位,具體包括:將距離外接矩形區(qū)域圖像的上邊界下方第一預(yù)設(shè)距離的位置確定為粗定位的車前窗的下邊緣;將距離外接矩形區(qū)域圖像的上邊界上方第二預(yù)設(shè)距離的位置確定為粗定位的車前窗的上邊緣;將粗定位的車前窗的上邊緣與粗定位的車前窗的下邊緣之間的區(qū)域確定為粗定位的車前窗區(qū)域,得到粗定的車前窗區(qū)域圖像。
上述第一預(yù)設(shè)距離可以是車輛的外接矩形圖像高度的3/5,上述第二預(yù)設(shè)距離為0到車輛的外接矩形圖像高度的1/4之間的任意數(shù)值,當(dāng)然,上述第一預(yù)設(shè)距離和第二預(yù)設(shè)距離還可以是其它的數(shù)值,本發(fā)明實(shí)施例并不限定上述第一預(yù)設(shè)距離和第二預(yù)設(shè)距離的具體數(shù)值,只要第一預(yù)設(shè)距離和第二預(yù)設(shè)距離的取值能夠保證車前窗在粗定位的區(qū)域范圍內(nèi)即可。
其中,上述手持電話行為檢測模塊240對待檢測駕駛員進(jìn)行手持電話行為檢測,是通過舉手行為檢測單元和手持電話行為檢測單元實(shí)現(xiàn)的,具體包括:
上述舉手行為檢測單元,用于根據(jù)駕駛區(qū)域圖像及舉手行為檢測模型對待檢測駕駛員進(jìn)行舉手行為檢測;上述手持電話行為檢測單元,用于當(dāng)舉手行為檢測結(jié)果指示待檢測駕駛員存在舉手行為時,根據(jù)駕駛區(qū)域圖像及舉手行為分類模型對待檢測駕駛員進(jìn)行手持電話行為檢測。
上述舉手行為檢測模型為預(yù)先訓(xùn)練的一組大小不同的駕駛員舉手行為檢測模型。
其中,上述預(yù)先訓(xùn)練的舉手行為分類模型包括三類,分別為駕駛員打手機(jī)行為模型、駕駛員面部動作行為模型及駕駛員頭部動作行為模型,在駕駛員打手機(jī)行為模型中,駕駛員的手放在頭部的側(cè)面,在駕駛員面部動作行為模型中,駕駛員的手放在前臉面部,在駕駛員頭部動作行為模型中,駕駛員的手放在頭部,并且,上述舉手行為分類模型為固定尺寸的模型。
其中,當(dāng)上述舉手行為檢測單元在對待檢測駕駛員進(jìn)行舉手行為檢測時,具體包括對駕駛區(qū)域圖像進(jìn)行歸一化處理,得到第一預(yù)設(shè)尺寸的駕駛區(qū)域圖像;從第一預(yù)設(shè)尺寸的駕駛區(qū)域圖像中提取待檢測駕駛員手臂的第一聚合通道特征,第一聚合通道特征包括灰度特征、梯度幅值及六個梯度方向特征;通過舉手行為檢測模型及第一聚合通道特征計(jì)算待檢測駕駛員手臂不同位置的得分,根據(jù)上述得分判斷待檢測駕駛員是否有舉手行為。
上述手持電話行為檢測單元對待檢測駕駛員進(jìn)行手持電話行為檢測具體包括:根據(jù)舉手行為檢測結(jié)果,將得分最高的手臂位置確定為手持電話行為檢測的位置;從駕駛區(qū)域圖像中提取待檢測駕駛員得分最高的手臂位置的第二聚合通道特征,第二聚合通道特征包括灰度特征、梯度幅值及12個梯度方向特征;分別通過預(yù)先訓(xùn)練的舉手行為模型及第二聚合通道特征計(jì)算每個舉手行為模型的得分,根據(jù)每個舉手行為模型的得分判斷待檢測駕駛員是否有手持電話行為。
本發(fā)明實(shí)施例提供的駕駛員手持電話行為檢測裝置,不依賴于檢測待檢測駕駛員的臉部位置,能夠準(zhǔn)確的檢測出駕駛員是否有手持電話行為,避免了由于受到光照、分辨率的影響無法檢測出臉部位置,進(jìn)而無法檢測駕駛員是否有手持電話行為的情況。
本發(fā)明實(shí)施例所提供的駕駛員手持電話行為檢測裝置可以為設(shè)備上的特定硬件或者安裝于設(shè)備上的軟件或固件等。本發(fā)明實(shí)施例所提供的裝置,其實(shí)現(xiàn)原理及產(chǎn)生的技術(shù)效果和前述方法實(shí)施例相同,為簡要描述,裝置實(shí)施例部分未提及之處,可參考前述方法實(shí)施例中相應(yīng)內(nèi)容。所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,前述描述的系統(tǒng)、裝置和單元的具體工作過程,均可以參考上述方法實(shí)施例中的對應(yīng)過程,在此不再贅述。
在本發(fā)明所提供的實(shí)施例中,應(yīng)該理解到,所揭露裝置和方法,可以通過其它的方式實(shí)現(xiàn)。以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時可以有另外的劃分方式,又例如,多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些通信接口,裝置或單元的間接耦合或通信連接,可以是電性,機(jī)械或其它的形式。
所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目的。
另外,在本發(fā)明提供的實(shí)施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨(dú)物理存在,也可以兩個或兩個以上單元集成在一個單元中。
所述功能如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時,可以存儲在一個計(jì)算機(jī)可讀取存儲介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計(jì)算機(jī)設(shè)備(可以是個人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實(shí)施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:U盤、移動硬盤、只讀存儲器(ROM,Read-Only Memory)、隨機(jī)存取存儲器(RAM,Random Access Memory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
應(yīng)注意到:相似的標(biāo)號和字母在下面的附圖中表示類似項(xiàng),因此,一旦某一項(xiàng)在一個附圖中被定義,則在隨后的附圖中不需要對其進(jìn)行進(jìn)一步定義和解釋,此外,術(shù)語“第一”、“第二”、“第三”等僅用于區(qū)分描述,而不能理解為指示或暗示相對重要性。
最后應(yīng)說明的是:以上所述實(shí)施例,僅為本發(fā)明的具體實(shí)施方式,用以說明本發(fā)明的技術(shù)方案,而非對其限制,本發(fā)明的保護(hù)范圍并不局限于此,盡管參照前述實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),其依然可以對前述實(shí)施例所記載的技術(shù)方案進(jìn)行修改或可輕易想到變化,或者對其中部分技術(shù)特征進(jìn)行等同替換;而這些修改、變化或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明實(shí)施例技術(shù)方案的精神和范圍。都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以所述權(quán)利要求的保護(hù)范圍為準(zhǔn)。