本發(fā)明涉及交通領(lǐng)域,更具體地涉及一種網(wǎng)約車(chē)司機(jī)流失預(yù)警方法。
背景技術(shù):
1、隨著網(wǎng)約車(chē)市場(chǎng)的迅速發(fā)展,越來(lái)越多的網(wǎng)約車(chē)平臺(tái)進(jìn)入該領(lǐng)域,市場(chǎng)競(jìng)爭(zhēng)愈加激烈。網(wǎng)約車(chē)平臺(tái)的司機(jī)數(shù)量和質(zhì)量直接影響著服務(wù)品質(zhì)和乘客體驗(yàn),因此,預(yù)估司機(jī)流失對(duì)于平臺(tái)來(lái)說(shuō)十分重要。
2、當(dāng)司機(jī)流失時(shí),平臺(tái)需要重新招募和培訓(xùn)新司機(jī),并為他們提供優(yōu)惠政策來(lái)吸引他們加入平臺(tái)。這些成本將會(huì)非常高昂,預(yù)估司機(jī)流失可以幫助平臺(tái)及時(shí)發(fā)現(xiàn)司機(jī)流失的趨勢(shì),采取措施來(lái)留住司機(jī),從而減少成本。
3、當(dāng)司機(jī)流失過(guò)多時(shí),平臺(tái)可能無(wú)法及時(shí)滿足用戶(hù)的需求,從而影響服務(wù)水平。對(duì)于那些習(xí)慣于在平臺(tái)上下單的用戶(hù)來(lái)說(shuō),由于缺乏司機(jī)資源,他們可能會(huì)轉(zhuǎn)向其他服務(wù),導(dǎo)致平臺(tái)的用戶(hù)流失。預(yù)估司機(jī)流失可以預(yù)測(cè)未來(lái)的司機(jī)數(shù)量,從而幫助平臺(tái)及時(shí)采取措施,提升服務(wù)水平。
4、預(yù)估司機(jī)流失可以幫助平臺(tái)了解司機(jī)的需求和訴求,及時(shí)調(diào)整政策,提高司機(jī)的滿意度和忠誠(chéng)度,從而增強(qiáng)平臺(tái)的市場(chǎng)競(jìng)爭(zhēng)力。同時(shí),與其他同行業(yè)平臺(tái)相比,留住更多的司機(jī)也是一個(gè)重要的競(jìng)爭(zhēng)優(yōu)勢(shì)。
5、基于以上多種因素,預(yù)估司機(jī)流失在網(wǎng)約車(chē)場(chǎng)景下顯得尤為重要。平臺(tái)可以通過(guò)分析司機(jī)的歷史數(shù)據(jù),了解司機(jī)的服務(wù)質(zhì)量、收入情況、行為偏好等因素,以及調(diào)查司機(jī)的意見(jiàn)和反饋,預(yù)測(cè)未來(lái)的司機(jī)流失率,及時(shí)采取措施來(lái)留住司機(jī),提升服務(wù)水平,降低成本,增強(qiáng)市場(chǎng)競(jìng)爭(zhēng)力。
6、由于模型的局限性,比如使用樹(shù)模型、邏輯回歸模型無(wú)法對(duì)序列信息建模,當(dāng)前技術(shù)方案使用的特征通常是一段時(shí)間內(nèi)的統(tǒng)計(jì)特征,比如司機(jī)歷史1天、7天、30天的平均每日完單量,此時(shí)忽略了歷史一段時(shí)間之內(nèi)每日的序列變化,導(dǎo)致信息丟失,而序列數(shù)據(jù)則反應(yīng)了司機(jī)在該平臺(tái)的流失可能性變化,對(duì)司機(jī)流失的預(yù)測(cè)至關(guān)重要。
7、此外,總體發(fā)單量、司機(jī)行為、平臺(tái)進(jìn)行活動(dòng)等因素是不斷變化的,為了適配這種變化,通常需要每月、或者每周收集最新的樣本數(shù)據(jù),使用最新數(shù)據(jù)重新訓(xùn)練模型,確保模型能夠?qū)W習(xí)到司機(jī)最新的行為變化,來(lái)保證預(yù)估效果。而每周、每月進(jìn)行例行化訓(xùn)練的成本是高昂的,并且涉及數(shù)據(jù)收集、落表、樣本制作、模型優(yōu)化、推送模型等多個(gè)過(guò)程,自動(dòng)化執(zhí)行過(guò)程容易出錯(cuò)。
8、針對(duì)上述問(wèn)題,本發(fā)明提出一種解決方案。
技術(shù)實(shí)現(xiàn)思路
1、為了克服現(xiàn)有技術(shù)的上述缺陷,本發(fā)明提供了一種網(wǎng)約車(chē)司機(jī)流失預(yù)警方法,以解決上述背景技術(shù)中存在的問(wèn)題。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:
3、一種網(wǎng)約車(chē)司機(jī)流失預(yù)警方法,包括以下步驟:
4、s001:收集平臺(tái)司機(jī)特征,所述司機(jī)特征包括城市大盤(pán)、司機(jī)行為以及司機(jī)屬性;
5、所述城市大盤(pán)包括發(fā)單量、匹配量、匹配率、完單量、完單率、gmv以及平均收入;
6、所述司機(jī)行為包括出車(chē)時(shí)長(zhǎng)、空駛時(shí)長(zhǎng)、完單量、取消量、投訴量、訂單收入以及活動(dòng)收入;
7、所述司機(jī)屬性包括注冊(cè)天數(shù)、所在城市、性別以及服務(wù)分;
8、s002:基于注意力機(jī)制設(shè)計(jì)一套特征提取模型,使模型能夠捕捉多個(gè)特征序列的信息,并將多個(gè)特征融合到一起然后映射到高維向量空間,得到高層次的向量特征;
9、s003:收集歷史7天的司機(jī)行為,生成一個(gè)向量描述司機(jī)的天級(jí)行為,七天分別對(duì)應(yīng)vi,1≤vi≤7,使用高層次的特征向量進(jìn)行流失模型的訓(xùn)練,得到最終流失模型;
10、s004:實(shí)時(shí)收集司機(jī)的近7天的行為并通過(guò)特征提取模型得到實(shí)時(shí)高層次的特征向量,并通過(guò)最終流失模型預(yù)估得到司機(jī)流失概率;
11、s005:根據(jù)司機(jī)流失概率進(jìn)行預(yù)警提示,并根據(jù)預(yù)警提示采取相應(yīng)的干預(yù)措施。
12、優(yōu)選的,所述將多個(gè)特征融合到一起然后映射到高維向量空間,得到高層次的向量特征步驟為:
13、收集一批歷史司機(jī)近7天的行為,每天生成一個(gè)向量來(lái)描述司機(jī)的行為,記為初級(jí)天級(jí)向量,針對(duì)初級(jí)天級(jí)向量一個(gè)序列特征i,我們首先將其映射到128維的向量空間中,記為vti;
14、針對(duì)一天的多個(gè)序列特征,我們將多個(gè)特征拼接成一個(gè)高維向量,記為vt;
15、針對(duì)歷史多天的行為特征序列,通過(guò)注意力機(jī)制學(xué)習(xí)司機(jī)和大盤(pán)的歷史行為,得到高層次的向量特征v。
16、優(yōu)選的,所述通過(guò)注意力機(jī)制學(xué)習(xí)司機(jī)和大盤(pán)的歷史行為,得到高層次的向量特征v步驟為:
17、將每個(gè)時(shí)間步的特征通過(guò)嵌入層映射到統(tǒng)一的高維空間;
18、將司機(jī)和大盤(pán)的嵌入特征在時(shí)間維度上融合,形成一個(gè)聯(lián)合特征矩陣;
19、計(jì)算每個(gè)時(shí)間步的注意力得分,其表達(dá)式為et=tanh(waet+ba),其中et表示為時(shí)間t的隱藏狀態(tài),wa為權(quán)重矩陣,ba表示為偏置,tanh表示為雙曲正切函數(shù);
20、通過(guò)softmax函數(shù),將注意力得分轉(zhuǎn)化為注意力權(quán)重,其計(jì)算公式為其中αt表示為注意力權(quán)重,et表示為時(shí)間步t計(jì)算得到的注意力得分,exp(ek)表示為對(duì)注意力得分進(jìn)行指數(shù)運(yùn)算,表示對(duì)所有時(shí)間步的指數(shù)得分求和;
21、使用注意力權(quán)重對(duì)每個(gè)時(shí)間步的聯(lián)合特征進(jìn)行加權(quán)求和,得到全局高層次特征表示,其表達(dá)式為其中v表示為高層次的向量特征。
22、優(yōu)選的,所述收集歷史7天的司機(jī)行為,生成一個(gè)向量描述司機(jī)的天級(jí)行為步驟為:
23、將7天的司機(jī)行為輸入特征矩陣,得到行為向量;
24、將司機(jī)一天之內(nèi)的多個(gè)行為向量通過(guò)拼接,得到當(dāng)天的行為向量vi,則歷史7天行為向量分別為v1、v2、...、v7,并引入分類(lèi)向量cls;
25、分別計(jì)算cls和向量v1的內(nèi)積相似度,得到權(quán)重w1,同理得到w2、...、w7;
26、通過(guò)權(quán)重對(duì)原始向量線性加權(quán)得到cls的輸出向量cls”,其計(jì)算公式為cls”=w1×v1+...+w7×v7。
27、優(yōu)選的,所述使用高層次的特征向量進(jìn)行流失模型的訓(xùn)練,得到最終流失模型步驟為:
28、步驟一:將高層次的特征向量分為訓(xùn)練集與測(cè)試集,并對(duì)每個(gè)高層次的特征向量對(duì)應(yīng)的司機(jī)的流失情況進(jìn)行標(biāo)記;
29、步驟二:選擇卷積神經(jīng)網(wǎng)絡(luò),初始化模型參數(shù),所述參數(shù)包括權(quán)重和偏置;
30、步驟三:將高層次特征向量輸入模型,進(jìn)行前向傳播計(jì)算輸出;
31、步驟四:使用交叉熵?fù)p失函數(shù)計(jì)算預(yù)測(cè)值和真實(shí)值之間的誤差;
32、步驟五:通過(guò)反向傳播算法計(jì)算損失函數(shù)對(duì)模型參數(shù)的梯度;
33、步驟六:使用梯度下降優(yōu)化算法更新模型參數(shù),得到初始化模型;
34、步驟七:在驗(yàn)證集上評(píng)估模型性能,通過(guò)計(jì)算準(zhǔn)確率、召回率以及f1分?jǐn)?shù)指標(biāo),得到模型性能指數(shù),其表達(dá)式為xn=f(n1,n2,n3),其中xn表示為模型性能指數(shù),n1、n2、n3表示為模型的準(zhǔn)確率、召回率以及f1分?jǐn)?shù),將模型性能指數(shù)與預(yù)設(shè)閾值進(jìn)行對(duì)比,若模型性能指數(shù)大于預(yù)設(shè)閾值,則判定當(dāng)前模型性能好,輸出當(dāng)前模型,若模型性能指數(shù)小于預(yù)設(shè)閾值,則判定當(dāng)前模型性能差,則重復(fù)步驟三-步驟六,繼續(xù)進(jìn)行模型訓(xùn)練,直至模型性能指數(shù)大于預(yù)設(shè)閾值。
35、優(yōu)選的,所述根據(jù)司機(jī)流失概率進(jìn)行預(yù)警提示步驟為,預(yù)設(shè)兩個(gè)流失概率閾值yz1與yz2,將通過(guò)模型得到的司機(jī)流失概率與流失概率閾值進(jìn)行對(duì),若司機(jī)流失概率大于流失概率閾值yz2,則判定司機(jī)流失可能性大,發(fā)出三級(jí)預(yù)警提示司機(jī)流失概率大,若司機(jī)流失概率小于流失概率閾值yz1,則判定司機(jī)流失可能性小,發(fā)出一級(jí)預(yù)警,若司機(jī)流失概率大于流失概率閾值yz1且小于流失概率閾值yz2,則判定司機(jī)為預(yù)流失用戶(hù),發(fā)出二級(jí)預(yù)警提示司機(jī)有成為流失用戶(hù)的風(fēng)險(xiǎn)。
36、本發(fā)明的技術(shù)效果和優(yōu)點(diǎn):
37、收集平臺(tái)司機(jī)特征,基于注意力機(jī)制設(shè)計(jì)一套特征提取模型,將多個(gè)特征融合到一起然后映射到高維向量空間,得到高層次的向量特征,根據(jù)歷史的司機(jī)行為生成天級(jí)向量,使用高層次的特征向量進(jìn)行流失模型的訓(xùn)練,得到最終流失模型,實(shí)時(shí)收集司機(jī)的近7天的行為預(yù)估得到司機(jī)流失概率,根據(jù)司機(jī)流失概率進(jìn)行預(yù)警提示,并根據(jù)預(yù)警提示采取相應(yīng)的干預(yù)措施,有效解決了無(wú)法對(duì)序列信息建模的問(wèn)題,提高了預(yù)測(cè)準(zhǔn)確度;
38、設(shè)計(jì)了多層注意力機(jī)制,通過(guò)該機(jī)制和模型捕捉司機(jī)的歷史行為序列特征,避免了司機(jī)歷史行為信息的丟失,極大的提高了預(yù)估司機(jī)流失的準(zhǔn)確率;另一方面是由于注意力機(jī)制在捕捉長(zhǎng)期序列行為上表現(xiàn)較好,避免多次收集數(shù)據(jù)、訓(xùn)練模型、上線模型的重復(fù)性工作。