1.一種大數(shù)據(jù)采集方法,其特征在于,包括:
接收待上傳數(shù)據(jù)的采集客戶端發(fā)送的連接請(qǐng)求;
根據(jù)采集服務(wù)器的當(dāng)前網(wǎng)絡(luò)情況基于啟發(fā)式算法計(jì)算所述采集客戶端的延時(shí)連接時(shí)間;
將所述延時(shí)連接時(shí)間返回給采集客戶端,以便所述采集客戶端經(jīng)過所述延時(shí)連接時(shí)間后向采集服務(wù)器上傳數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述采集服務(wù)器的當(dāng)前網(wǎng)絡(luò)情況包括網(wǎng)絡(luò)流量負(fù)載情況和帶寬情況。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述根據(jù)采集服務(wù)器的當(dāng)前網(wǎng)絡(luò)情況基于啟發(fā)式算法計(jì)算所述采集客戶端的延時(shí)連接時(shí)間包括:
隨機(jī)初始化時(shí)間T0;
根據(jù)當(dāng)前的網(wǎng)絡(luò)流量負(fù)載的分布,選擇時(shí)間Tt;
比較采用當(dāng)前時(shí)間T0的流量峰值與平均值之差、時(shí)間Tt時(shí)的流量峰值與平均值之差;
如果流量峰值與平均值之差不小于當(dāng)前時(shí)間T0時(shí)的情況,則計(jì)算更新時(shí)間,其中,更新時(shí)間的計(jì)算公式為Snew=Scur+sqrt(Tt)*randn,其中所述Scur為當(dāng)前請(qǐng)求上傳時(shí)間,Snew為更新上傳時(shí)間,randn為高斯隨機(jī)數(shù);
將所述更新時(shí)間作為延時(shí)連接時(shí)間發(fā)送給采集客戶端。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,還包括:
如果采用時(shí)間Tt時(shí),流量峰值與平均值之差小于時(shí)間T0時(shí)的流量峰值與平均值之差,則將Tt更新T0,并重新根據(jù)當(dāng)前的網(wǎng)絡(luò)流量負(fù)載的分布,選擇一個(gè)新的時(shí)間Tt。
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,還包括:
判斷當(dāng)前循環(huán)次數(shù),如果當(dāng)前循環(huán)次數(shù)不大于第一設(shè)定閾值時(shí),如果采用時(shí)間Tt時(shí)流量峰值與平均值之差沒有小于時(shí)間T0時(shí)的流量峰值 與平均值之差的情況,計(jì)算接受概率P,其中P=1/(1+exp(Δ+Tt)),其中Δ為當(dāng)前時(shí)間T0、時(shí)間T1時(shí)流量峰值與平均值之差的差值;
如果所述接受概率不小于第二設(shè)定閾值,計(jì)算更新時(shí)間并將所述更新時(shí)間作為延時(shí)連接時(shí)間發(fā)送給采集客戶端。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,
如果當(dāng)前循環(huán)次數(shù)大于第一設(shè)定閾值且未得到接受概率小于第二設(shè)定閾值的時(shí)間,則退出當(dāng)前的循環(huán)計(jì)算延時(shí)連接時(shí)間的過程并確定未得到延時(shí)連接時(shí)間;
向采集客戶端返回?cái)?shù)據(jù)上傳響應(yīng)以便所述采集客戶端向服務(wù)器上傳數(shù)據(jù)。
7.一種大數(shù)據(jù)采集裝置,其特征在于,包括:
接收模塊,用于接收待上傳數(shù)據(jù)的采集客戶端發(fā)送的連接請(qǐng)求;
時(shí)間調(diào)整模塊,用于根據(jù)采集服務(wù)器的當(dāng)前網(wǎng)絡(luò)情況基于啟發(fā)式算法計(jì)算所述采集客戶端的延時(shí)連接時(shí)間;
發(fā)送模塊,用于將所述延時(shí)連接時(shí)間返回給采集客戶端以便采集樣本客戶端經(jīng)過所述延時(shí)連接時(shí)間后向服務(wù)器發(fā)送連接請(qǐng)求上傳數(shù)據(jù)。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述采集服務(wù)器的當(dāng)前網(wǎng)絡(luò)情況包括網(wǎng)絡(luò)流量負(fù)載情況和帶寬情況。
9.根據(jù)權(quán)利要求7或8所述的裝置,其特征在于,所述時(shí)間調(diào)整模塊包括:
初始化單元,用于隨機(jī)初始化時(shí)間T0;
選擇單元,用于根據(jù)當(dāng)前的網(wǎng)絡(luò)流量負(fù)載的分布,選擇時(shí)間Tt;
比較單元,用于比較采用當(dāng)前時(shí)間T0的流量峰值與平均值之差、時(shí)間Tt時(shí)的流量峰值與平均值之差;
處理單元,如果流量峰值與平均值之差不小于當(dāng)前時(shí)間T0時(shí)的情況,則計(jì)算更新時(shí)間;
發(fā)送單元,用于將所述更新時(shí)間作為延時(shí)連接時(shí)間發(fā)送給采集客戶端,其中更新時(shí)間的計(jì)算公式為Snew=Scur+sqrt(Tt)*randn,其中所述 Scur為當(dāng)前請(qǐng)求上傳時(shí)間,Snew為更新上傳時(shí)間,randn為高斯隨機(jī)數(shù)。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述處理單元還用于如果采用時(shí)間Tt時(shí)流量峰值與平均值之差小于時(shí)間T0時(shí)的流量峰值與平均值之差,則將Tt更新T0,并重新根據(jù)當(dāng)前的網(wǎng)絡(luò)流量負(fù)載的分布,選擇一個(gè)新的時(shí)間Tt。
11.根據(jù)權(quán)利要求9所述的裝置,其特征在于,處理單元還用于判斷當(dāng)前循環(huán)次數(shù),如果當(dāng)前循環(huán)次數(shù)不大于第一設(shè)定閾值時(shí),如果采用時(shí)間Tt時(shí)流量峰值與平均值之差沒有小于時(shí)間T0時(shí)的流量峰值與平均值之差的情況,計(jì)算接受概率P,其中P=1/(1+exp(Δ+Tt)),其中Δ為當(dāng)前時(shí)間T0、時(shí)間Tt時(shí)流量峰值與平均值之差的差值;如果所述接受概率不小于第二設(shè)定閾值,計(jì)算更新時(shí)間并將所述更新時(shí)間作為延時(shí)連接時(shí)間發(fā)送給采集客戶端。
12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,處理單元還用于如果當(dāng)前循環(huán)次數(shù)大于第一設(shè)定閾值且未得到接受概率小于第二設(shè)定閾值的時(shí)間,則退出當(dāng)前的循環(huán)計(jì)算延時(shí)連接時(shí)間的過程并確定未得到延時(shí)連接時(shí)間;
發(fā)送模塊還用于向采集客戶端返回?cái)?shù)據(jù)上傳響應(yīng)以便所述采集客戶端向服務(wù)器上傳數(shù)據(jù)。
13.一種大數(shù)據(jù)采集系統(tǒng),其特征在于,包括:如權(quán)利要求7-12中任一所述的大數(shù)據(jù)采集裝置以及采集客戶端、采集服務(wù)器。