到的AQI偏離使用經(jīng)協(xié)同訓(xùn) 練的空間和時(shí)間分類器確定的AQI時(shí),該插值得到的AQI可能無法準(zhǔn)確反映出該地區(qū)的空氣 質(zhì)量。在運(yùn)樣的情況下,實(shí)體可決定在地區(qū)安裝空氣質(zhì)量監(jiān)測(cè)站。
[0113] 線性插值可由線性插值模塊228執(zhí)行。線性插值模塊228可實(shí)現(xiàn)如下距離加權(quán)的插 值算法,該算法使用由現(xiàn)有的空氣質(zhì)量監(jiān)測(cè)站所報(bào)告的AQI值來對(duì)沒有現(xiàn)有站的區(qū)域的空 氣質(zhì)量指數(shù)進(jìn)行插值:
[0115] 其中,dx,i表示區(qū)域X和第i個(gè)監(jiān)測(cè)站之間的地理距離。在各個(gè)實(shí)施例中,AQI值還可 根據(jù)表格I被轉(zhuǎn)換成AQI水平標(biāo)記。
[0116] 位置標(biāo)識(shí)模塊226可W在多個(gè)預(yù)定時(shí)間間隔中的每一者處為每一污染物計(jì)算由空 氣質(zhì)量指數(shù)模塊224推斷出的AQI水平和由線性插值模塊22財(cái)隹斷出的AQI水平之間的偏差。 該計(jì)算可如下所示在預(yù)定時(shí)間間隔為每一區(qū)域中的每一污染物執(zhí)行,其中m表示污染物的 數(shù)目:
[0117] o=|g.Q-g.Q'|={Aqi,Aq2,...,Aqim} (17)
[0118] 隨后,位置標(biāo)識(shí)模塊226可將某區(qū)域表示成m維空間中的點(diǎn),其中每一維度代表一 污染物。例如,兩個(gè)區(qū)域的集合可被表示成第一小時(shí)在3維(3D)空間中的(1,3,4)和(3,2, 0)。參考圖4示出關(guān)于3D空間中的各區(qū)域的表示的附加細(xì)節(jié)。
[0119] 圖4是示出有助于標(biāo)識(shí)某地區(qū)中用于空氣質(zhì)量監(jiān)測(cè)站安裝的各區(qū)域的偏差的示例 3維網(wǎng)格空間400的示意圖。在所示的該示例中,維度402對(duì)應(yīng)于污染物PM2.5,維度404對(duì)應(yīng)于 污染物N02,且維度406對(duì)應(yīng)于污染物PMio。此外,運(yùn)些點(diǎn)中的每一者(例如,點(diǎn)408)可表示在 那里找到了污染物的區(qū)域。每一維度中的點(diǎn)都是隨時(shí)間添加的。例如,數(shù)字值"r指示過了 一個(gè)小時(shí),數(shù)字值"2"指示過了兩個(gè)小時(shí),數(shù)字值"3"指示過了立個(gè)小時(shí),并W此類推。
[0120] 回到圖2,在給定m維空間中的表示的情況下,位置標(biāo)識(shí)模塊226可基于天際線檢測(cè) 技術(shù)來使用數(shù)據(jù)驅(qū)動(dòng)和非參數(shù)算法尋找具有顯著差距的點(diǎn)。天際線被定義為不受任何其他 點(diǎn)支配(dominate)的那些點(diǎn)。如果點(diǎn)在所有維度上都一樣好或更好且在至少一個(gè)維度上更 好,則該點(diǎn)可支配另一點(diǎn)。
[0121] 使用天際線檢測(cè)技術(shù),位置標(biāo)識(shí)模塊226可標(biāo)識(shí)針對(duì)每小時(shí)的點(diǎn)集合(區(qū)域)。位置 標(biāo)識(shí)模塊226可對(duì)每一區(qū)域在預(yù)定時(shí)間段(例如,3個(gè)月)內(nèi)在檢測(cè)到的天際線中的出現(xiàn)計(jì) 數(shù)。因此,位置標(biāo)識(shí)模塊226可確定區(qū)域在預(yù)定時(shí)間段內(nèi)在檢測(cè)到的天際線中出現(xiàn)的越頻 繁,則該區(qū)域是適合于空氣質(zhì)量監(jiān)測(cè)站的候選區(qū)域的概率越高。
[0122] 位置標(biāo)識(shí)模塊226還可考慮運(yùn)些候選區(qū)域之間的地理距離。在各實(shí)施例中,位置標(biāo) 識(shí)模塊226可使用核密度估計(jì)化DE)來基于該區(qū)域在檢測(cè)到的天際線中的出現(xiàn)來推斷某區(qū) 域可能適合于空氣質(zhì)量監(jiān)測(cè)站的概率。KDE可能是用于估計(jì)隨機(jī)變量的概率密度函數(shù)的非 參數(shù)方式。換言之,KDE基于有限數(shù)據(jù)樣本來解決數(shù)據(jù)平滑問題。例如,在給定位于2維空間 中的n個(gè)點(diǎn)pi、p2、...、pn的情況下,KDE可被用來如下估計(jì)區(qū)域X處的強(qiáng)度:
[0124] 其中,di,X可表示Pi和X之間的距離,h可表示帶寬,且KO可W是其值隨di,X的增加而 衰減的核函數(shù)。
[0125] 在一個(gè)實(shí)例中,位置標(biāo)識(shí)模塊226可將高斯函數(shù)用作核函數(shù),并根據(jù)積分均方差標(biāo) 準(zhǔn)來執(zhí)行該計(jì)算。此外,某區(qū)域的出現(xiàn)次數(shù)被看作該網(wǎng)格中的點(diǎn)的數(shù)量,并且每一點(diǎn)的坐標(biāo) 可設(shè)于該網(wǎng)格的中屯、,該點(diǎn)屬于如下:
[0127]因此,位置標(biāo)識(shí)模塊226可生成熱度圖,該熱度圖示出每一區(qū)域適合于構(gòu)建空氣質(zhì) 量監(jiān)測(cè)站的概率。由此,如果具有最高概率的區(qū)域不可用于建筑物,則決策作出者(例如,政 府機(jī)關(guān))可根據(jù)該熱度圖而考慮該區(qū)域周圍的其他區(qū)域。第二,由位置標(biāo)識(shí)模塊226確定的 估計(jì)密度可將各個(gè)體區(qū)域(例如,網(wǎng)格)在地理空間上分組成多個(gè)聚類。由此,一旦某聚類中 的區(qū)域被確定為適合于構(gòu)造空氣質(zhì)量監(jiān)測(cè)站,則決策作出者可制止將該聚類中的其他區(qū)域 認(rèn)為合適。
[01%]數(shù)據(jù)存儲(chǔ)320可存儲(chǔ)空間分類器234和時(shí)間分類器236,其可被協(xié)同訓(xùn)練W推斷針 對(duì)多種污染物的AQI。數(shù)據(jù)存儲(chǔ)230還可存儲(chǔ)S巧旨數(shù)232、存儲(chǔ)的列表、散列表和/或由計(jì)算設(shè) 備102的組件使用的其他數(shù)據(jù)源。
[0129] W上用于推斷空氣質(zhì)量指數(shù)水平的示例實(shí)施例在W上被描述成是使用協(xié)同訓(xùn)練 的空間分類器和協(xié)同訓(xùn)練的時(shí)間分類器來實(shí)現(xiàn)的。然而,在其他實(shí)施例中,空氣質(zhì)量指數(shù)水 平的推斷可用使用空間上相關(guān)的數(shù)據(jù)訓(xùn)練的空間分類器或使用時(shí)間上相關(guān)的數(shù)據(jù)訓(xùn)練的 時(shí)間分類器來實(shí)施,而無需實(shí)現(xiàn)協(xié)同訓(xùn)練。在運(yùn)樣的實(shí)施例中,空氣質(zhì)量指數(shù)模塊224可被 配置成基于空間概率分?jǐn)?shù)或時(shí)間概率分?jǐn)?shù)來推導(dǎo)某區(qū)域中針對(duì)某污染物的空氣質(zhì)量指數(shù) 水平。
[0130] 示例過程
[0131] 圖5-7描述用于在沒有空氣質(zhì)量監(jiān)測(cè)站的情況下使用空間和時(shí)間特征來推斷各區(qū) 域的空氣質(zhì)量信息的各示例過程。每一示例過程中描述操作的次序并不旨在解釋為限制, 并且任何數(shù)量的所描述的操作可W按任何次序和/或并行組合W實(shí)現(xiàn)每一過程。此外,圖5-7中的每一者中的操作可用硬件、軟件和/或其組合來實(shí)現(xiàn)。在軟件的上下文中,各個(gè)操作可 表示在由一個(gè)或多個(gè)處理器執(zhí)行時(shí)使得一個(gè)或多個(gè)處理器執(zhí)行既定操作的計(jì)算機(jī)可執(zhí)行 指令。該一個(gè)或多個(gè)處理器可被包括在各個(gè)體計(jì)算設(shè)備中或被包括在例如作為云的一部分 的多個(gè)計(jì)算設(shè)備中。一般而言,計(jì)算機(jī)可執(zhí)行指令包括使得執(zhí)行特定功能或?qū)崿F(xiàn)特定抽象 數(shù)據(jù)類型的例程、程序、對(duì)象、組件、數(shù)據(jù)結(jié)構(gòu)等。在其他實(shí)施例中,每一示例過程的操作可 W由硬件邏輯電路來執(zhí)行,如專用集成電路。
[0132] 圖5是示出用于訓(xùn)練時(shí)間分類器和空間分類器的示例過程500的流程圖,該時(shí)間分 類器和空間分類器被用來基于多個(gè)數(shù)據(jù)源來推斷某地區(qū)中某污染物的質(zhì)量指數(shù)。在框502, 標(biāo)記的數(shù)據(jù)提取模塊208可獲得針對(duì)某區(qū)域的標(biāo)記的空氣質(zhì)量指數(shù)數(shù)據(jù)。該標(biāo)記的空氣質(zhì) 量數(shù)據(jù)可W是由空氣質(zhì)量監(jiān)測(cè)站為該地區(qū)中的各區(qū)域(例如,網(wǎng)格)針對(duì)特定污染物獲得的 空氣質(zhì)量指數(shù)數(shù)據(jù)118。由此,當(dāng)網(wǎng)格具有針對(duì)某污染物的相應(yīng)空氣質(zhì)量指數(shù)時(shí),該網(wǎng)格可 被指定為與該污染物有關(guān)的標(biāo)記的網(wǎng)格。在一些實(shí)施例中,該地區(qū)可W是城市區(qū)域。
[0133] 在框504,空間特征提取模塊210可為該地區(qū)從空間上相關(guān)的數(shù)據(jù)中提取空間特 征。在各實(shí)施例中,空間上相關(guān)的數(shù)據(jù)可包括道路網(wǎng)絡(luò)數(shù)據(jù)、興趣點(diǎn)(POI)數(shù)據(jù)和/或關(guān)于該 地區(qū)中的固定基礎(chǔ)設(shè)施的其他數(shù)據(jù)??臻g上相關(guān)的數(shù)據(jù)可從多個(gè)源(諸如未標(biāo)記的源數(shù)據(jù) 112)中獲得。
[0134] 在框506,時(shí)間特征提取模塊212可為該地區(qū)從時(shí)間上相關(guān)的數(shù)據(jù)中提取時(shí)間特 征。時(shí)間上相關(guān)的數(shù)據(jù)可包括該地區(qū)中隨時(shí)間改變的數(shù)據(jù)。例如,時(shí)間上相關(guān)的數(shù)據(jù)可包括 車流量數(shù)據(jù)、人類移動(dòng)數(shù)據(jù)、和/或氣象數(shù)據(jù)等等。時(shí)間上相關(guān)的數(shù)據(jù)可從多個(gè)源(諸如未標(biāo) 記的源數(shù)據(jù)112)中獲得。
[0135] 在框508,訓(xùn)練模塊216可應(yīng)用基于協(xié)同訓(xùn)練的學(xué)習(xí)框架來基于標(biāo)記的空氣質(zhì)量指 數(shù)數(shù)據(jù)118、提取的空間特征110和提取的時(shí)間特征114來對(duì)空間分類器116和時(shí)間分類器 120進(jìn)行協(xié)同訓(xùn)練。在各實(shí)施例中,訓(xùn)練模塊216可最初用相應(yīng)的特征來訓(xùn)練空間和時(shí)間分 類器。因此,由于對(duì)標(biāo)記的空氣質(zhì)量指數(shù)數(shù)據(jù)118的使用,可結(jié)合特定污染物來訓(xùn)練空間分 類器和時(shí)間分類器。
[0136] 例如,空間分類器可最初使用空間特征來訓(xùn)練,并且時(shí)間分類器可最初用時(shí)間特 征來訓(xùn)練。訓(xùn)練模塊216可隨后應(yīng)用經(jīng)訓(xùn)練的空間分類器和經(jīng)訓(xùn)練的時(shí)間分類器來迭代地 推斷未標(biāo)記的區(qū)域(例如,網(wǎng)格)。該迭代可設(shè)及將最確信地分類的示例中的一個(gè)或多個(gè)添 加到該地區(qū)中的標(biāo)記的區(qū)域W用于每一后續(xù)訓(xùn)練迭代輪次,直到該地區(qū)中剩下的未標(biāo)記的 區(qū)域被標(biāo)記或者預(yù)定數(shù)目的迭代輪次已被執(zhí)行。在迭代的結(jié)束處,訓(xùn)練模塊216可返回完全 訓(xùn)練好的空間分類器和完全訓(xùn)練好的時(shí)間分類器。
[0137] 然而,在替換實(shí)施例中,訓(xùn)練模塊216可僅在其相應(yīng)的特征方面訓(xùn)練空間分類器或 時(shí)間分類器,W供直接用于查明污染物的AQI。換言之,訓(xùn)練模塊216可使用半監(jiān)督學(xué)習(xí)技術(shù) 來獨(dú)立地訓(xùn)練空間分類器或時(shí)間分類器,而無需應(yīng)用基于協(xié)同訓(xùn)練的學(xué)習(xí)框架。
[0138] 圖6是示出用于使用時(shí)間分類器和空間分類器來基于多個(gè)數(shù)據(jù)源推斷某區(qū)域中針 對(duì)某污染物的空氣質(zhì)量指數(shù)的示例過程600的流程圖。在框602,空間特征提取模塊210可獲 得針對(duì)包括在某地區(qū)中的區(qū)域的空間特征。在各實(shí)施例中,運(yùn)些空間特征可從針對(duì)該區(qū)域 的觀察到的數(shù)據(jù)122中的空間上相關(guān)的數(shù)據(jù)中獲得??臻g上相關(guān)的數(shù)據(jù)可包括道路網(wǎng)絡(luò)數(shù) 據(jù)、興趣點(diǎn)數(shù)據(jù)和/或關(guān)于該地區(qū)中的固定基礎(chǔ)設(shè)施的其他數(shù)據(jù)。
[0139] 在框604,時(shí)間特征提取模塊212可獲得針對(duì)包括在該地區(qū)中的該區(qū)域的時(shí)間特 征。在各實(shí)施例中,運(yùn)些時(shí)間特征可從針對(duì)該區(qū)域的觀察到的數(shù)據(jù)122中的時(shí)間上相關(guān)的數(shù) 據(jù)中獲得。時(shí)間上相關(guān)的數(shù)據(jù)可包括該地區(qū)中隨時(shí)間改變的數(shù)據(jù)。例如,時(shí)間上相關(guān)的數(shù)據(jù) 可包括車流量數(shù)據(jù)、人類移動(dòng)數(shù)據(jù)、和/或氣象數(shù)據(jù)等等。
[0140] 在框606,空間概率模塊220可使用經(jīng)訓(xùn)練的空間分類器基于空間特征來生成針對(duì) 該區(qū)域中的某污染物的空間概率分?jǐn)?shù)。在各實(shí)施例中,經(jīng)訓(xùn)練的空間分類器可W是空間分 類器116??臻g概率分?jǐn)?shù)可表示區(qū)域中存在污染物的可能性。
[0141] 在框608,時(shí)間概率模塊222可使用經(jīng)訓(xùn)練的時(shí)間分類器基于時(shí)間特征來生成針對(duì) 該區(qū)域中的某污染物的時(shí)間概率分?jǐn)?shù)。在各實(shí)施例中,經(jīng)訓(xùn)練的時(shí)間分類器可W是時(shí)間分 類器120。時(shí)間概率分?jǐn)?shù)可表示區(qū)域中存在污染物的可能性。
[0142] 在框610,空氣質(zhì)量指數(shù)模塊224可基于空間概率分?jǐn)?shù)和時(shí)間概率分?jǐn)?shù)計(jì)算與該區(qū) 域中的污染物有關(guān)的空氣質(zhì)量指數(shù)。在各實(shí)施例中,與污染物有關(guān)的空氣質(zhì)量指數(shù)可基于 空間概率分?jǐn)?shù)和時(shí)間概率分?jǐn)?shù)的乘積來計(jì)算。
[0143] 然而,在一些替換實(shí)施例中,空氣質(zhì)量指數(shù)模塊224可通過將空間分類器直接應(yīng)用 于某區(qū)域的空間特征來計(jì)算該區(qū)域與該污染物有關(guān)的空氣質(zhì)量指數(shù)。在運(yùn)樣的替換實(shí)施例 中,可在不使用基于協(xié)同訓(xùn)練的學(xué)習(xí)框架的情況下訓(xùn)練空間分類器。同樣,在其他替換實(shí)施 例中,空氣質(zhì)量指數(shù)模塊224可通過將時(shí)間分類器直接應(yīng)用于某區(qū)域的時(shí)間特征來計(jì)算該 區(qū)域與該污染物有關(guān)的空氣質(zhì)量指數(shù)。在運(yùn)樣的替換實(shí)施例中,可在不使用基于協(xié)同訓(xùn)練 的學(xué)習(xí)框架的情況下訓(xùn)練時(shí)間分類器。由此,在替換實(shí)施例中,空氣質(zhì)量指數(shù)模塊224可在 不執(zhí)行過程600中的框606和框608中描述的操作的情況下生成空氣質(zhì)量指數(shù)。
[0144] 圖7是示出用于使用獲得的污染物的空氣質(zhì)量指數(shù)水平和污染物的線性插值水平 之間的偏差來確定用于空氣質(zhì)量監(jiān)測(cè)站安裝的可能區(qū)域的示例過程700的流程圖。在框 702,位置標(biāo)識(shí)模塊226可在周期性間隔集合內(nèi)為某地區(qū)中的多個(gè)區(qū)域處的多個(gè)污染物中的 每一者計(jì)算AQI水平和線性插值水平之間的偏差。AQI水平可由空氣質(zhì)量指數(shù)模塊224使用 經(jīng)協(xié)同訓(xùn)練的空間分類器和時(shí)間分類器來獲得。線性插值水平可由線性插值模塊228獲得。
[0145] 在框704,位置標(biāo)識(shí)模塊226可將針對(duì)多個(gè)區(qū)域中的每一者處的每一污染物W及周 期性間隔中的每一者的相應(yīng)偏差定位在多維網(wǎng)格空間中。在一個(gè)實(shí)例中,多維網(wǎng)格空間可 W是其中每一維度對(duì)應(yīng)于不同的污染物并且該網(wǎng)格空間中的點(diǎn)標(biāo)識(shí)區(qū)域的3維網(wǎng)格空間。
[0146]