1.一種基于短信的數(shù)據(jù)采集方法,其特征在于,包括:
接收安全匯聚網(wǎng)關(guān)發(fā)送的短信數(shù)據(jù),所述短信數(shù)據(jù)包括:短信屬性信息和短信文本;
根據(jù)預先設(shè)置的模版庫判斷所述短信數(shù)據(jù)是否為特定商戶用戶發(fā)送的預設(shè)類型的行業(yè)短信,所述模版庫中存儲有各特定商戶用戶所發(fā)送的所述預設(shè)類型的行業(yè)短信的模版,所述模版包括對應的所述預設(shè)類型的行業(yè)短信中的若干個關(guān)鍵詞;
若判斷出所述短信數(shù)據(jù)是所述特定商戶用戶發(fā)送的預設(shè)類型的行業(yè)短信時,則根據(jù)所述短信數(shù)據(jù)對應的模版提取所述短信文本中的關(guān)鍵詞和位于部分關(guān)鍵詞之后的數(shù)值數(shù)據(jù);
將所述短信屬性信息提取出的所述關(guān)鍵詞和所述數(shù)值數(shù)據(jù)按照預設(shè)格式生成記錄文件。
2.根據(jù)權(quán)利要求1所述的基于短信的數(shù)據(jù)采集方法,其特征在于,所述短信屬性信息包括:發(fā)送號碼;
所述根據(jù)預先設(shè)置的模版庫判斷所述短信數(shù)據(jù)是否為特定商戶用戶發(fā)送的預設(shè)類型的行業(yè)短信的步驟包括:
根據(jù)預先設(shè)置的特定商戶接入號列表和所述發(fā)送號碼判斷所述短信數(shù)據(jù)是否為特定商戶用戶發(fā)送的行業(yè)短信,所述特定商戶接入號列表記載有若干個特定商戶用戶的接入號;
若判斷出所述短信數(shù)據(jù)為特定商戶用戶發(fā)送的行業(yè)短信時,則確定所述短信數(shù)據(jù)所對應的特定商戶用戶,并從所述模版庫中調(diào)取出該特定商戶用戶對應的所述預設(shè)類型的行業(yè)短信的若干個模版;
將所述短信文本與調(diào)取出的各模版分別進行匹配;
若所述短信文本與調(diào)取出的一個模版匹配成功時,則識別出所述短信數(shù)據(jù)為特定商戶用戶發(fā)送的預設(shè)類型的行業(yè)短信。
3.根據(jù)權(quán)利要求2所述的基于短信的數(shù)據(jù)采集方法,其特征在于,所述根據(jù)預先設(shè)置的特定商戶接入號列表和所述發(fā)送號碼判斷所述短信數(shù)據(jù)是否為特定商戶用戶發(fā)送的行業(yè)短信的步驟包括:
查詢所述特定商戶接入號列表中是否存在所述發(fā)送號碼;
若能夠從所述特定商戶接入號列表中查詢出所述發(fā)送號碼,則判斷出所述短信數(shù)據(jù)為特定商戶用戶發(fā)送的行業(yè)短信,若不能從所述特定商戶接入號列表中查詢出所述發(fā)送號碼,則判斷出所述短信數(shù)據(jù)不為特定商戶用戶發(fā)送的行業(yè)短信。
4.根據(jù)權(quán)利要求3所述的基于短信的數(shù)據(jù)采集方法,其特征在于,所述查詢所述特定商戶接入號列表中是否存在所述發(fā)送號碼的步驟之前還包括:
判斷所述發(fā)送號碼是否為手機號;
若判斷出所述發(fā)送號碼不為手機號,則執(zhí)行所述查詢所述特定商戶接入號列表中是否存在所述發(fā)送號碼的步驟。
5.根據(jù)權(quán)利要求2所述的基于短信的數(shù)據(jù)采集方法,其特征在于,所述根據(jù)預先設(shè)置的特定商戶接入號列表和所述發(fā)送號碼判斷所述短信數(shù)據(jù)是否為特定商戶用戶發(fā)送的行業(yè)短信的步驟之前還包括:
從行業(yè)網(wǎng)關(guān)中同步所述特定商戶接入號列表。
6.根據(jù)權(quán)利要求1所述的基于短信的數(shù)據(jù)采集方法,其特征在于,所述將所述短信屬性信息、提取出的所述關(guān)鍵詞和所述數(shù)值數(shù)據(jù)按照預設(shè)格式生成記錄文件的步驟之后還包括:
將接收到的所述短信數(shù)據(jù)丟棄。
7.一種基于短信的數(shù)據(jù)采集系統(tǒng),其特征在于,包括:
短信接口模塊,用于接收安全匯聚網(wǎng)關(guān)發(fā)送的短信數(shù)據(jù),所述短信數(shù)據(jù)包括:短信屬性信息和短信文本;
短信判斷模塊,用于根據(jù)預先設(shè)置的模版庫判斷所述短信數(shù)據(jù)是否為特定商戶用戶發(fā)送的預設(shè)類型的行業(yè)短信,所述模版庫中存儲有各特定商戶用戶所發(fā)送的所述預設(shè)類型的行業(yè)短信的模版,所述模版包括所述預設(shè)類型的行業(yè)短信的關(guān)鍵詞;
數(shù)據(jù)提取模塊,用于若所述短信判斷模塊判斷出所述短信數(shù)據(jù)是所述特定商戶用戶發(fā)送的預設(shè)類型的行業(yè)短信時,則根據(jù)所述短信數(shù)據(jù)對應的模版提取所述短信文本中的關(guān)鍵詞和位于部分關(guān)鍵詞之后的數(shù)值數(shù)據(jù);
記錄生成模塊,用于將所述短信屬性信息、所述數(shù)據(jù)提取模塊提取出的所述關(guān)鍵詞和所述數(shù)值數(shù)據(jù)按照預設(shè)格式生成記錄文件。
8.根據(jù)權(quán)利要求7所述的基于短信的數(shù)據(jù)采集系統(tǒng),其特征在于,所述短信屬性信息包括:發(fā)送號碼;
所述短信判斷模塊包括:
行業(yè)短信判斷單元,用于根據(jù)預先設(shè)置的特定商戶接入號列表和所述發(fā)送號碼判斷所述短信數(shù)據(jù)是否為特定商戶用戶發(fā)送的行業(yè)短信,所述特定商戶接入號列表記載有若干個特定商戶用戶的接入號;
模版調(diào)取單元,用于若所述行業(yè)短信判斷單元判斷出所述短信數(shù)據(jù)為特定商戶用戶發(fā)送的行業(yè)短信時,則確定所述短信數(shù)據(jù)所對應的特定商戶用戶,并從所述模版庫中調(diào)取出該特定商戶用戶對應的所述預設(shè)類型的行業(yè)短信的若干個模版;
模版匹配單元,用于將所述短信文本與調(diào)取出的各模版分別進行匹配,其中,若所述短信文本與調(diào)取出的一個模版匹配成功時,則判斷出所述短信數(shù)據(jù)為特定商戶用戶發(fā)送的預設(shè)類型的行業(yè)短信。
9.根據(jù)權(quán)利要求8所述的基于短信的數(shù)據(jù)采集系統(tǒng),其特征在于,所述行業(yè)短信判斷單元包括:
號碼查詢子單元,用于查詢所述特定商戶接入號列表中是否存在所述發(fā)送號碼;其中,若能夠從所特定商戶接入號列表中查詢出所述發(fā)送號碼,則判斷出所述短信數(shù)據(jù)為特定商戶用戶發(fā)送的行業(yè)短信,若不能從所述特定商戶接入號列表中查詢出所述發(fā)送號碼,則判斷出所述短信數(shù)據(jù)不為特定商戶用戶發(fā)送的行業(yè)短信。
10.根據(jù)權(quán)利要求9所述的基于短信的數(shù)據(jù)采集系統(tǒng),其特征在于,所述行業(yè)短信判斷單元還包括:
手機號判斷子單元,用于判斷所述發(fā)送號碼是否為手機號;
所述號碼查詢子單元用于若所述手機號判斷子單元判斷出所述發(fā)送號碼不為手機號時,查詢所述特定商戶接入號列表中是否存在所述發(fā)送號碼。
11.根據(jù)權(quán)利要求2所述的基于短信的數(shù)據(jù)采集系統(tǒng),其特征在于,還包括:
商戶接入號信息管理模塊,用于從行業(yè)網(wǎng)關(guān)中同步所述特定商戶接入號列表。