一種對異常數(shù)據(jù)進(jìn)行處理的方法、裝置及監(jiān)控系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本申請涉及信息處理技術(shù)領(lǐng)域,特別是涉及一種對異常數(shù)據(jù)進(jìn)行處理的方法、一種對異常數(shù)據(jù)進(jìn)行處理的裝置和一種監(jiān)控系統(tǒng)。
【背景技術(shù)】
[0002]隨著信息科技的發(fā)展以及不同領(lǐng)域的業(yè)務(wù)種類的日益豐富,越來越多的業(yè)務(wù)需要不同領(lǐng)域或相同領(lǐng)域的不同平臺協(xié)同完成,為了及時發(fā)現(xiàn)合作的平臺的異常,保證業(yè)務(wù)的順利完成,對有合作關(guān)系的平臺的異常進(jìn)行監(jiān)控和處理顯得尤為重要。
[0003]例如,在電子商務(wù)領(lǐng)域中,用戶針對交易訂單付款時,會涉及支付平臺與銀行系統(tǒng)的交互,在交互過程中,由支付平臺通過交易成功率、交易成功筆數(shù)等維度對銀行系統(tǒng)進(jìn)行監(jiān)控,并在所述維度的值達(dá)到預(yù)設(shè)規(guī)則時發(fā)出告警,由運維人員根據(jù)維度的值判斷銀行系統(tǒng)是否異常,并在出現(xiàn)異常時手動關(guān)閉或降低對應(yīng)前臺展示的用戶服務(wù)承諾能力。、
[0004]然而,發(fā)明人發(fā)現(xiàn)上述處理流程存在如下缺陷:
[0005]1、在發(fā)出告警以后,由于存在人工異步處理的情況,所以異常發(fā)生時正常的用戶交易還在涌入,不能很好地縮小異常影響范圍;
[0006]2、人工對異常要進(jìn)行24小時監(jiān)控和處理,人力成本占用大,處理效率較低。
[0007]因此,目前需要本領(lǐng)域技術(shù)人員迫切解決的一個技術(shù)問題就是:提供一種異常數(shù)據(jù)處理機制,用以減少異常處理過程中的人工干預(yù),減少因人工干預(yù)異步導(dǎo)致的業(yè)務(wù)影響范圍,降低人力成本,提高異常處理效率。
【發(fā)明內(nèi)容】
[0008]本申請實施例所要解決的技術(shù)問題是提供一種對異常數(shù)據(jù)進(jìn)行處理的方法,用以減少異常處理過程中的人工干預(yù),減少因人工干預(yù)異步導(dǎo)致的業(yè)務(wù)影響范圍,降低人力成本,提聞異常處理效率。
[0009]相應(yīng)的,本申請實施例還提供了一種對異常數(shù)據(jù)進(jìn)行處理的裝置以及一種監(jiān)控系統(tǒng),用以保證上述方法的實現(xiàn)及應(yīng)用。
[0010]為了解決上述問題,本申請公開了一種對異常數(shù)據(jù)進(jìn)行處理的方法,所述方法包括:
[0011]在監(jiān)控系統(tǒng)向被監(jiān)控系統(tǒng)發(fā)送業(yè)務(wù)對象數(shù)據(jù)的過程中,當(dāng)所述監(jiān)控系統(tǒng)監(jiān)控到所述被監(jiān)控系統(tǒng)出現(xiàn)數(shù)據(jù)異常時,暫停向所述被監(jiān)控系統(tǒng)發(fā)送所述業(yè)務(wù)對象數(shù)據(jù);
[0012]所述監(jiān)控系統(tǒng)向所述被監(jiān)控系統(tǒng)發(fā)送測試數(shù)據(jù);
[0013]當(dāng)所述監(jiān)控系統(tǒng)接收到所述被監(jiān)控系統(tǒng)返回的與所述測試數(shù)據(jù)對應(yīng)的第一報文信息時,基于所述第一報文信息,判斷所述數(shù)據(jù)異常是否消除;
[0014]監(jiān)控系統(tǒng)在判定所述數(shù)據(jù)異常消除時,停止向所述被監(jiān)控系統(tǒng)發(fā)送所述測試數(shù)據(jù),以及,繼續(xù)向所述被監(jiān)控系統(tǒng)發(fā)送所述業(yè)務(wù)對象數(shù)據(jù)。
[0015]優(yōu)選地,所述監(jiān)控系統(tǒng)中設(shè)置有針對所述被監(jiān)控系統(tǒng)的業(yè)務(wù)服務(wù)能力,所述方法還包括:
[0016]當(dāng)所述監(jiān)控系統(tǒng)監(jiān)控到所述被監(jiān)控系統(tǒng)出現(xiàn)數(shù)據(jù)異常時,關(guān)閉所述業(yè)務(wù)服務(wù)能力。
[0017]優(yōu)選地,所述方法還包括:
[0018]所述監(jiān)控系統(tǒng)在判定所述數(shù)據(jù)異常消除時,開啟所述關(guān)閉的業(yè)務(wù)服務(wù)能力。
[0019]優(yōu)選地,所述被監(jiān)控系統(tǒng)包括用于接收所述業(yè)務(wù)對象數(shù)據(jù)和/或所述測試數(shù)據(jù)的主用通信渠道和/或備用通信渠道,針對所述主用通信渠道具有設(shè)定的第一級別的業(yè)務(wù)服務(wù)能力,針對所述備用通信渠道具有設(shè)定的第二級別的業(yè)務(wù)服務(wù)能力,所述第一級別的業(yè)務(wù)服務(wù)能力的級別高于所述第二級別的業(yè)務(wù)服務(wù)能力,
[0020]所述當(dāng)所述監(jiān)控系統(tǒng)監(jiān)控到所述被監(jiān)控系統(tǒng)出現(xiàn)數(shù)據(jù)異常時,關(guān)閉所述業(yè)務(wù)服務(wù)能力的步驟包括:
[0021]當(dāng)所述監(jiān)控系統(tǒng)監(jiān)控到所述主用通信渠道出現(xiàn)數(shù)據(jù)異常時,關(guān)閉所述第一級別的業(yè)務(wù)服務(wù)能力,以及
[0022]開啟所述第二級別的業(yè)務(wù)服務(wù)能力。
[0023]優(yōu)選地,所述監(jiān)控系統(tǒng)在判定所述數(shù)據(jù)異常消除時,開啟所述關(guān)閉的業(yè)務(wù)服務(wù)能力的步驟包括:
[0024]所述監(jiān)控系統(tǒng)在判定所述主用通信渠道的數(shù)據(jù)異常消除時,關(guān)閉所述第二級別的業(yè)務(wù)服務(wù)能力,以及
[0025]開啟所述第一級別的業(yè)務(wù)服務(wù)能力。
[0026]優(yōu)選地,所述第一報文信息包括第一成功響應(yīng)指令,所述當(dāng)所述監(jiān)控系統(tǒng)接收到所述被監(jiān)控系統(tǒng)返回的與所述測試數(shù)據(jù)對應(yīng)的第一報文信息時,基于所述第一報文信息,判斷所述數(shù)據(jù)異常是否消除的步驟包括:
[0027]當(dāng)所述監(jiān)控系統(tǒng)接收到所述被監(jiān)控系統(tǒng)返回的與所述測試數(shù)據(jù)對應(yīng)的第一報文信息時,從所述接收所述第一報文信息的時間開始的單位時間內(nèi),計算所述第一成功響應(yīng)指令的數(shù)量;
[0028]若所述第一成功響應(yīng)指令的數(shù)量大于第一預(yù)設(shè)閾值,則判定所述數(shù)據(jù)異常消除;
[0029]和/ 或,
[0030]從所述接收所述第一報文信息的時間開始的單位時間內(nèi),計算所述第一成功響應(yīng)指令的數(shù)量以及發(fā)出的所述測試數(shù)據(jù)的數(shù)量的比值,得到第一成功率;
[0031]若所述第一成功率大于第二預(yù)設(shè)閾值,則判定所述數(shù)據(jù)異常消除。
[0032]優(yōu)選地,所述當(dāng)所述監(jiān)控系統(tǒng)接收到所述被監(jiān)控系統(tǒng)返回的與所述測試數(shù)據(jù)對應(yīng)的第一報文信息時,基于所述第一報文信息,判斷所述數(shù)據(jù)異常是否消除的步驟包括:
[0033]從所述監(jiān)控系統(tǒng)接收到所述被監(jiān)控系統(tǒng)返回的與所述測試數(shù)據(jù)對應(yīng)的第一報文信息開始,記錄下一次發(fā)送所述測試數(shù)據(jù)的第一時間戳;
[0034]記錄接收到的,針對所述下一次發(fā)送的所述測試數(shù)據(jù)返回的所述第一報文信息的第二時間戳;
[0035]計算所述第一時間戳以及所述第二時間戳的時間差,作為第一響應(yīng)時間;
[0036]從所述接收所述第一報文信息的時間開始的單位時間內(nèi),統(tǒng)計所述第一響應(yīng)時間大于第三預(yù)設(shè)閾值的測試數(shù)據(jù)的數(shù)量;
[0037]若所述第一響應(yīng)時間大于第三預(yù)設(shè)閾值的測試數(shù)據(jù)的數(shù)量小于或等于第四預(yù)設(shè)閾值,則判定所述數(shù)據(jù)異常消除。
[0038]優(yōu)選地,所述監(jiān)控系統(tǒng)采用如下方式對所述被監(jiān)控系統(tǒng)進(jìn)行數(shù)據(jù)異常監(jiān)控:
[0039]所述監(jiān)控系統(tǒng)向所述被監(jiān)控系統(tǒng)發(fā)送業(yè)務(wù)對象數(shù)據(jù);
[0040]所述監(jiān)控系統(tǒng)接收所述被監(jiān)控系統(tǒng)基于所述業(yè)務(wù)對象數(shù)據(jù)返回的第二報文信息;
[0041]所述監(jiān)控系統(tǒng)基于所述第二報文信息,判斷所述被監(jiān)控系統(tǒng)是否出現(xiàn)數(shù)據(jù)異常。
[0042]優(yōu)選地,所述第二報文信息包括第二成功響應(yīng)指令,和/或,錯誤碼,所述監(jiān)控系統(tǒng)基于所述第二報文信息,判斷所述被監(jiān)控系統(tǒng)是否出現(xiàn)數(shù)據(jù)異常的步驟包括:
[0043]計算單位時間內(nèi)接收的所述第二成功響應(yīng)指令的數(shù)量;
[0044]若所述單位時間內(nèi)接收的第二成功響應(yīng)指令的數(shù)量小于第一預(yù)設(shè)閾值,則判定所述被監(jiān)控系統(tǒng)出現(xiàn)數(shù)據(jù)異常;
[0045]和/ 或,
[0046]計算單位時間內(nèi)接收的第二成功響應(yīng)指令的數(shù)量以及發(fā)出的業(yè)務(wù)對象數(shù)據(jù)的數(shù)量的比值,得到第二成功率;
[0047]若第二成功率小于或等于第二預(yù)設(shè)閾值,則判定所述被監(jiān)控系統(tǒng)出現(xiàn)數(shù)據(jù)異常;
[0048]和/ 或,
[0049]計算記錄的發(fā)送所述業(yè)務(wù)對象數(shù)據(jù)的時間戳,以及,記錄的接收到所述第二報文信息的時間戳的時間差,作為第二響應(yīng)時間;
[0050]統(tǒng)計單位時間內(nèi)所述第二響應(yīng)時間差大于第三預(yù)設(shè)閾值的業(yè)務(wù)對象數(shù)據(jù)的數(shù)量;
[0051]若所述單位時間內(nèi)所述第二響應(yīng)時間差大于第三預(yù)設(shè)閾值的業(yè)務(wù)對象數(shù)據(jù)的數(shù)量大于第四預(yù)設(shè)閾值,則判定所述被監(jiān)控系統(tǒng)出現(xiàn)數(shù)據(jù)異常;
[0052]和/ 或,
[0053]計算記錄的發(fā)送所述業(yè)務(wù)對象數(shù)據(jù)的時間戳,以及,記錄的接收到所述第二報文信息的時間戳的時間差,作為第二響應(yīng)時間;依據(jù)所述第二響應(yīng)時間計算單位時間內(nèi)的平均處理時效,若所述平均處理時效大于第五預(yù)設(shè)閾值,則判定所述被監(jiān)控系統(tǒng)出現(xiàn)數(shù)據(jù)異常;
[0054]和/ 或,
[0055]基于所述錯誤碼,判定所述被監(jiān)控系統(tǒng)出現(xiàn)數(shù)據(jù)異常。
[0056]優(yōu)選地,所述監(jiān)控系統(tǒng)為支付平臺,所述被監(jiān)控系統(tǒng)為銀行系統(tǒng),所述業(yè)務(wù)對象數(shù)據(jù)為交易數(shù)據(jù),所述業(yè)務(wù)服務(wù)能力包括實時到賬服務(wù)、兩小時到賬服務(wù)、當(dāng)天到賬服務(wù)、第二天到賬服務(wù)、三天內(nèi)到賬服務(wù)的至少一種,所述第一級別的業(yè)務(wù)服務(wù)能力包括實時到賬服務(wù)或者兩小時到賬服務(wù),所述第二級別的業(yè)務(wù)服務(wù)能力為當(dāng)天到賬服務(wù)、第二天到賬服務(wù)、三天內(nèi)到賬服務(wù)。
[0057]本申請還公開了一種對異常數(shù)據(jù)進(jìn)行處理的裝置,所述裝置包括:
[0058]暫停模塊,用于在監(jiān)控系統(tǒng)向被監(jiān)控系統(tǒng)發(fā)送業(yè)務(wù)對象數(shù)據(jù)的過程中,當(dāng)所述監(jiān)控系統(tǒng)監(jiān)控到所述被監(jiān)控系統(tǒng)出現(xiàn)數(shù)據(jù)異常時,暫停向所述被監(jiān)控系統(tǒng)發(fā)送所述業(yè)務(wù)對象數(shù)據(jù);
[0059]測試數(shù)據(jù)發(fā)送模塊,用于向所述被監(jiān)控系統(tǒng)發(fā)送測試數(shù)據(jù);
[0060]判斷模塊,用于在所述監(jiān)控系統(tǒng)接收到所述被監(jiān)控系統(tǒng)返回的與所述測試數(shù)據(jù)對應(yīng)的第一報文信息時,基于所述第一報文信息,判斷所述數(shù)據(jù)異常是否消除;
[0061]重啟模塊,用于在判定所述數(shù)據(jù)異常消除時,停止向所述被監(jiān)控系統(tǒng)發(fā)送所述測試數(shù)據(jù),以及,繼續(xù)向所述被監(jiān)控系統(tǒng)發(fā)送所述業(yè)務(wù)對象數(shù)據(jù)。
[0062]優(yōu)選地,所述監(jiān)控系統(tǒng)中設(shè)置有針對所述被監(jiān)控系統(tǒng)的業(yè)務(wù)服務(wù)能力,所述裝置還包括:
[0063]服務(wù)關(guān)閉模塊,用于在監(jiān)控到所述被監(jiān)控系統(tǒng)出現(xiàn)數(shù)據(jù)異常時,關(guān)閉所述業(yè)務(wù)服務(wù)能力。
[0064]優(yōu)選地,所述裝置還包括:
[0065]服務(wù)開啟模塊,用于在判定所述數(shù)據(jù)異常消除時,開啟所述關(guān)閉的業(yè)務(wù)服務(wù)能力。
[0066]優(yōu)選地,所述被監(jiān)控系統(tǒng)包括用于接收所述業(yè)務(wù)對象數(shù)據(jù)和/或所述測試數(shù)據(jù)的主用通信渠道和/或備用通信渠道,針對所述主用通信渠道具有設(shè)定的第一級別的業(yè)務(wù)服務(wù)能力,針對所述備用通信渠道具有設(shè)定的第二級別的業(yè)務(wù)服務(wù)能力,所述第一級別的業(yè)務(wù)服務(wù)能力的級別高于所述第二級別的業(yè)務(wù)服務(wù)能力,
[0067]所述服務(wù)關(guān)閉模塊包括:
[0068]第一關(guān)閉子模塊,用于在監(jiān)控到所述主用通信渠道出現(xiàn)數(shù)據(jù)異常時,關(guān)閉所述第一級別的業(yè)務(wù)服務(wù)能力,以及
[0069]第一開啟子模塊,用于開啟所述第二級別的業(yè)務(wù)服務(wù)能力。
[0070]優(yōu)選地,所述服務(wù)開啟模塊包括:
[0071]第二關(guān)閉子模塊,用于在判定所述主用通信渠道數(shù)據(jù)的數(shù)據(jù)異常消除時,關(guān)閉所述第二級別的業(yè)務(wù)服務(wù)能力,以及
[0072]第二開啟子模塊,用于開啟所述第一級別的業(yè)務(wù)服務(wù)能力。
[0073]優(yōu)選地,所述第一報文信息包括第一成功響應(yīng)指令,所述判斷模塊包括:
[0074]第一計算子模塊,用于在接收到所述被監(jiān)控系統(tǒng)返回的與所述測試數(shù)據(jù)對應(yīng)的第一報文信息時,從所述接收所述第一報文信息的時間開始的單位時間內(nèi),計算所述第一成功響應(yīng)指令的數(shù)量;
[0075]第一判定子模塊,用于在所述第一成功響應(yīng)指令的數(shù)量大于第一預(yù)設(shè)閾值時,判定所述數(shù)據(jù)異常消除;
[0076]和/ 或,
[0077]第二計算子模塊,用于從所述接收所述第一報文信息的時間開始的單位時間內(nèi),計算所述第一成功響應(yīng)指令的數(shù)量以及發(fā)出的所述測試數(shù)據(jù)的數(shù)量的比值,得到第一成功率;
[0078]第二判定子模塊,用于在所述第一成功率大于第二預(yù)設(shè)閾值時,判定所述數(shù)據(jù)異常消除。
[0079]優(yōu)選地,所述所述判斷模塊包括:
[0080]第一記錄子模塊,用于從所述監(jiān)控系統(tǒng)接收到所述被監(jiān)控系統(tǒng)返回的與所述測試數(shù)據(jù)對應(yīng)的第一報文信息開始,記錄下一次發(fā)送所述測試數(shù)據(jù)的第一時間戳;
[0081]第二記錄子模塊,用于記錄接收到的,針對所述下一次發(fā)送的所述測試數(shù)據(jù)返回的所述第一報文信息的第二時間戳;
[0082]第三計算子模塊,用于計算所述第一時間戳以及所述第二時間戳的時間差,作為第一響應(yīng)時間;
[0083]第四計算子模塊,用于從所述接收所述第一報文信息的時間開始的單位時間內(nèi),統(tǒng)計所述第一響應(yīng)時間大于第三預(yù)設(shè)閾值的測試數(shù)據(jù)的數(shù)量;
[0084]第三判定子模塊,用于在所述第一響應(yīng)時間大于第三預(yù)設(shè)閾值的測試數(shù)據(jù)的數(shù)量小于或等于第四預(yù)設(shè)閾值時,判定所述數(shù)據(jù)異常消除。
[0085]優(yōu)選地,所述監(jiān)控系統(tǒng)采用如下方式對所述被監(jiān)控系統(tǒng)進(jìn)行數(shù)據(jù)異常監(jiān)控:
[0086]所述監(jiān)控系統(tǒng)向所述被監(jiān)控系統(tǒng)發(fā)送業(yè)務(wù)對象數(shù)據(jù);
[0087]所述監(jiān)控系統(tǒng)接收所述被監(jiān)控系統(tǒng)基于所述業(yè)務(wù)對象數(shù)據(jù)返回的第二報文信息;
[0088]所述監(jiān)控系統(tǒng)基于所述第二報文信息,判斷所述被監(jiān)控系統(tǒng)是否出現(xiàn)數(shù)據(jù)異常。
[0089]優(yōu)選地,所述第二報文信息包括第二成功響應(yīng)指令,和/或,錯誤碼,所述監(jiān)控系統(tǒng)基于所述第二報文信息,判斷所述被監(jiān)控系統(tǒng)是否出現(xiàn)數(shù)據(jù)異常的方式包括:
[0090]計算單位時間內(nèi)接收的所述第二成功響應(yīng)指令的數(shù)量;
[0091]若所述單位時間內(nèi)接收的第二成功響應(yīng)指令的數(shù)量小于第一預(yù)設(shè)閾值,則判定所述被監(jiān)控系統(tǒng)出現(xiàn)數(shù)據(jù)異常;
[0092]和/ 或,
[0093]計算單位時間內(nèi)接收的第二成功響應(yīng)指令的數(shù)量以及發(fā)出的業(yè)務(wù)對象數(shù)據(jù)的數(shù)量的比值,得到第二成功率;
[0094]若第二成功率小于或等于第二預(yù)設(shè)閾值,則判定所述被監(jiān)控系統(tǒng)出現(xiàn)數(shù)據(jù)異常;
[0095]和/ 或,
[0096]計算記錄的發(fā)送所述業(yè)務(wù)對象數(shù)據(jù)的時間戳,以及,記錄的接收到所述第二報文信息的時間戳的時間差,作為第二響應(yīng)時間;
[0097]統(tǒng)計單位時間內(nèi)所述第二響應(yīng)時間差大于第三預(yù)設(shè)閾值的業(yè)務(wù)對象數(shù)據(jù)的數(shù)量;
[0098]若所述單位時間內(nèi)所述第二響應(yīng)時間差大于第三預(yù)設(shè)閾值的業(yè)務(wù)對象數(shù)據(jù)的數(shù)量大于第四預(yù)設(shè)閾值,則判定所述被監(jiān)控系統(tǒng)出現(xiàn)數(shù)據(jù)異常;
[0099]和/ 或,
[0100]計算記錄的發(fā)送所述業(yè)務(wù)對象數(shù)據(jù)的時間戳,以及,記錄的接收到所述第二報文信息的時間戳的時間差,作為第二響應(yīng)時間;依據(jù)所述第二響應(yīng)時間計算單位時間內(nèi)的平均處理時效,若平均處理時效大于第五預(yù)設(shè)閾值,則判定所述被監(jiān)控系統(tǒng)出現(xiàn)數(shù)據(jù)異常;
[0101]和/ 或,
[0102]基于所述錯誤碼,判定所述被監(jiān)控系統(tǒng)出現(xiàn)數(shù)據(jù)異常。
[0103]優(yōu)選地,所述監(jiān)控系統(tǒng)為支付平臺,所述被監(jiān)控系統(tǒng)為銀行系統(tǒng),