本發(fā)明屬于機(jī)器學(xué)習(xí),具體涉及一種利用任務(wù)效果評估數(shù)據(jù)集質(zhì)量的方法、精神心理篩查系統(tǒng)、數(shù)據(jù)集質(zhì)量評估系統(tǒng)。
背景技術(shù):
1、通過結(jié)合人工智能方法與腦機(jī)接口技術(shù),能夠構(gòu)建規(guī)?;娜航M數(shù)據(jù)集畫像,形成可客觀識別個體任務(wù)水平的智能腦機(jī)接口工具。此外,由于腦電作為一種來自中樞神經(jīng)系統(tǒng)的生理信號,具有蘊(yùn)含信息量大、不易偽裝等優(yōu)勢,已經(jīng)成為情感識別的優(yōu)質(zhì)數(shù)據(jù)源,因此,群組數(shù)據(jù)集畫像還能用于精神心理等領(lǐng)域以篩查情緒障礙,為抑郁癥的輔助診斷、干預(yù)治療跟蹤評價等提供量化、客觀的依據(jù)。
2、但是由于腦電信號隨時間情景變化的隨機(jī)性強(qiáng)、數(shù)據(jù)集樣本含有大量種類的復(fù)雜信息,現(xiàn)有技術(shù)通常將數(shù)據(jù)集的質(zhì)量單純定義為數(shù)據(jù)集中各數(shù)據(jù)的質(zhì)量或評估維度單一,為確認(rèn)當(dāng)前數(shù)據(jù)集可用,在分類任務(wù)中需要進(jìn)一步評價數(shù)據(jù)集內(nèi)各類中的數(shù)據(jù)是否具備基礎(chǔ)的一致性,在回歸任務(wù)中則需要評價數(shù)據(jù)集內(nèi)數(shù)據(jù)分布是否廣泛等。能夠斷言,以上指標(biāo)值明顯不佳的數(shù)據(jù)集是不可用的數(shù)據(jù)集,在這種數(shù)據(jù)集上訓(xùn)練出的模型必然效果不佳。顯然,采集或預(yù)處理后的數(shù)據(jù)質(zhì)量好只是該數(shù)據(jù)集可用的前提條件,無法全面客觀地觀測數(shù)據(jù)集,更缺乏衡量數(shù)據(jù)集在目標(biāo)任務(wù)上的預(yù)期效果及可用程度的指標(biāo)。
3、在相關(guān)技術(shù)中,例如專利cn202410522089.1公開了一種數(shù)據(jù)集質(zhì)量評估方法、系統(tǒng)、電子設(shè)備及存儲介質(zhì),其依托于另外的目標(biāo)任務(wù)樣本集,針對非結(jié)構(gòu)化數(shù)據(jù)及目標(biāo)檢測任務(wù)返回樣本集中的標(biāo)簽,即檢測提供的非結(jié)構(gòu)化數(shù)據(jù)中是否包含“期望檢測的目標(biāo)”,以評估用于模型測試集的數(shù)據(jù)集的質(zhì)量,并未涉及將結(jié)構(gòu)化數(shù)據(jù)集的數(shù)據(jù)、特征、基礎(chǔ)信息等分類然后通過任務(wù)特征矩陣和標(biāo)簽向量來測試質(zhì)量指標(biāo),以便獲取執(zhí)行某目標(biāo)任務(wù)時數(shù)據(jù)集自身的質(zhì)量。
技術(shù)實現(xiàn)思路
1、本發(fā)明提供了一種利用任務(wù)效果評估數(shù)據(jù)集質(zhì)量的方法、精神心理篩查系統(tǒng)、數(shù)據(jù)集質(zhì)量評估系統(tǒng),以量化數(shù)據(jù)集在目標(biāo)任務(wù)上的預(yù)期效果和可用程度。
2、為了解決上述技術(shù)問題,第一方面,本發(fā)明提供了一種利用任務(wù)效果評估數(shù)據(jù)集質(zhì)量的方法,包括:基于數(shù)據(jù)集獲取基礎(chǔ)特征指標(biāo)bfqi;選定目標(biāo)任務(wù)并根據(jù)數(shù)據(jù)集的任務(wù)特征獲取任務(wù)特征指標(biāo)tfqi和預(yù)測標(biāo)簽;基于預(yù)測標(biāo)簽獲取任務(wù)指標(biāo)tqi;以及通過加權(quán)函數(shù)將基礎(chǔ)特征指標(biāo)bfqi、任務(wù)特征指標(biāo)tfqi、任務(wù)指標(biāo)tqi融合以獲取數(shù)據(jù)集的任務(wù)效果dsqi,作為數(shù)據(jù)集質(zhì)量的評估結(jié)果。
3、進(jìn)一步,當(dāng)所述目標(biāo)任務(wù)為有監(jiān)督學(xué)習(xí)任務(wù)時,所述獲取任務(wù)特征指標(biāo)包括:將所述數(shù)據(jù)集中實行有監(jiān)督學(xué)習(xí)任務(wù)的數(shù)據(jù)信息記錄為真實標(biāo)簽;對所述任務(wù)特征依據(jù)真實標(biāo)簽進(jìn)行分組,并在組間通過假設(shè)檢驗得到所述任務(wù)特征指標(biāo)tfqi。
4、進(jìn)一步,所述獲取任務(wù)指標(biāo)包括:對所述預(yù)測標(biāo)簽與真實標(biāo)簽進(jìn)行假設(shè)檢驗得到所述任務(wù)指標(biāo)tqi。
5、進(jìn)一步,當(dāng)所述有監(jiān)督學(xué)習(xí)任務(wù)為分類任務(wù)時,所述假設(shè)檢驗為計算不同類別數(shù)據(jù)間的同分布程度;當(dāng)所述有監(jiān)督學(xué)習(xí)任務(wù)為回歸任務(wù)時,所述假設(shè)檢驗為計算數(shù)據(jù)的統(tǒng)計特征變化度。
6、進(jìn)一步,當(dāng)所述目標(biāo)任務(wù)為無監(jiān)督學(xué)習(xí)任務(wù)時,所述獲取任務(wù)特征指標(biāo)包括:對所述任務(wù)特征依據(jù)所述預(yù)測標(biāo)簽進(jìn)行分組,并在組間對任務(wù)特征假設(shè)檢驗得到所述任務(wù)特征指標(biāo)tfqi。
7、進(jìn)一步,所述獲取任務(wù)指標(biāo)包括:對所述預(yù)測標(biāo)簽進(jìn)行假設(shè)檢驗得到所述任務(wù)指標(biāo)tqi。
8、進(jìn)一步,當(dāng)所述無監(jiān)督學(xué)習(xí)任務(wù)為聚類任務(wù)時,所述假設(shè)檢驗為計算不同類別數(shù)據(jù)間的同分布程度。
9、進(jìn)一步,所述加權(quán)函數(shù)被配置為任務(wù)效果dsqi?=?sqi?*?bfqi?*?tqi?*?tfqi;或任務(wù)效果dsqi?=?mean(sqi,bfqi,tqi,tfqi);或任務(wù)效果dsqi?=?min(sqi,bfqi,tqi,tfqi);或任務(wù)效果dsqi?=?a?*?sqi?+?b?*?bfqi?+?c?*?tqi?+?d?*?tfqi;其中,a為數(shù)據(jù)系數(shù),b為基礎(chǔ)特征系數(shù),c為任務(wù)特征系數(shù),d為任務(wù)系數(shù),sqi為數(shù)據(jù)指標(biāo)。
10、進(jìn)一步,所述數(shù)據(jù)集包括初始數(shù)據(jù);所述數(shù)據(jù)指標(biāo)的獲取方式包括:獲取達(dá)標(biāo)數(shù)據(jù),即篩選高于噪度閾值的初始數(shù)據(jù)作為達(dá)標(biāo)數(shù)據(jù)并計算達(dá)標(biāo)數(shù)據(jù)占比;計算初始數(shù)據(jù)的質(zhì)量指標(biāo)的分布統(tǒng)計量,得到數(shù)據(jù)指標(biāo)sqi;其中所述數(shù)據(jù)指標(biāo)sqi?=(達(dá)標(biāo)數(shù)據(jù)占比*分布統(tǒng)計量)/噪度閾值;所述質(zhì)量指標(biāo)包括:直流分量、偏移量、冪律分布系數(shù)、工頻強(qiáng)度、相關(guān)系數(shù)中的至少一種。
11、進(jìn)一步,所述數(shù)據(jù)集包括基礎(chǔ)特征;所述獲取基礎(chǔ)特征指標(biāo)包括:針對基礎(chǔ)特征進(jìn)行假設(shè)檢驗得到所述基礎(chǔ)特征指標(biāo)bfqi;其中所述基礎(chǔ)特征包括:數(shù)據(jù)集的采集信息、被試信息中的至少一種。
12、第二方面,本發(fā)明提供了一種精神心理篩查系統(tǒng),包括:處理器,運(yùn)行所述的方法,以獲取數(shù)據(jù)集針對目標(biāo)任務(wù)的評估結(jié)果;連接處理器的人機(jī)交互機(jī),其操作界面上設(shè)置有評估結(jié)果顯示區(qū);其中所述評估結(jié)果顯示區(qū)上設(shè)置有數(shù)據(jù)集選擇項,以根據(jù)評估結(jié)果選擇精神心理篩查需要的數(shù)據(jù)集。
13、第三方面,本發(fā)明提供了一種數(shù)據(jù)集質(zhì)量評估系統(tǒng),包括:處理器,運(yùn)行所述方法的步驟,以獲取數(shù)據(jù)集針對目標(biāo)任務(wù)的評估結(jié)果;打標(biāo)模塊,根據(jù)目標(biāo)任務(wù)的評估結(jié)果對數(shù)據(jù)集進(jìn)行打標(biāo)。
14、第四方面,本發(fā)明提供了一種計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)程序,所述計算機(jī)程序被處理器執(zhí)行時實現(xiàn)所述方法的步驟。
15、第五方面,本發(fā)明提供了一種計算機(jī)程序產(chǎn)品,包括計算機(jī)程序,所述計算機(jī)程序被處理器執(zhí)行時實現(xiàn)所述方法的步驟。
16、本發(fā)明的有益效果是,本發(fā)明的利用任務(wù)效果評估數(shù)據(jù)集質(zhì)量的方法、精神心理篩查系統(tǒng)、數(shù)據(jù)集質(zhì)量評估系統(tǒng),通過訓(xùn)練測試生成輔助的標(biāo)簽,又將根據(jù)數(shù)據(jù)基礎(chǔ)質(zhì)量提取的數(shù)據(jù)指標(biāo)sqi、根據(jù)基礎(chǔ)特征提取的基礎(chǔ)特征指標(biāo)bfqi、根據(jù)任務(wù)特征提取的任務(wù)特征指標(biāo)tfqi、根據(jù)預(yù)測標(biāo)簽提取的任務(wù)指標(biāo)tqi融合在一起,加權(quán)得到數(shù)據(jù)集的任務(wù)效果dsqi。本發(fā)明精準(zhǔn)地將數(shù)據(jù)集在目標(biāo)任務(wù)上的預(yù)期效果量化,客觀、全面地評估了數(shù)據(jù)集對分類、回歸、聚類等任務(wù)的適用性,不僅能在數(shù)據(jù)采集過程中起到指導(dǎo)效果,還能使得目標(biāo)任務(wù)一致的數(shù)據(jù)集合并或使數(shù)據(jù)集內(nèi)部的異常被試剔除,從而提高采集效率和應(yīng)用于目標(biāo)任務(wù)后的效果。
17、本發(fā)明的其他特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點在說明書、權(quán)利要求書以及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。
18、為使本發(fā)明的上述目的、特征和優(yōu)點能更明顯易懂,下文特舉較佳實施例,并配合所附附圖,作詳細(xì)說明如下。
1.一種利用任務(wù)效果評估數(shù)據(jù)集質(zhì)量的方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,
4.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,
7.根據(jù)權(quán)利要求5或6所述的方法,其特征在于,
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,
10.根據(jù)權(quán)利要求1所述的方法,其特征在于,
11.一種精神心理篩查系統(tǒng),其特征在于,包括:
12.一種數(shù)據(jù)集質(zhì)量評估系統(tǒng),其特征在于,包括:
13.一種計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)程序,其特征在于,所述計算機(jī)程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1-10任一項所述方法的步驟。
14.一種計算機(jī)程序產(chǎn)品,包括計算機(jī)程序,其特征在于,所述計算機(jī)程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1-10任一項所述方法的步驟。