技術(shù)特征:
技術(shù)總結(jié)
本發(fā)明提供了一種基于DC規(guī)劃處理缺失數(shù)據(jù)的聚類方法,針對現(xiàn)實應(yīng)用中真實采集的數(shù)據(jù)集常出現(xiàn)數(shù)據(jù)缺失的情況進(jìn)行缺失項估計。主要包括四個步驟:1、對數(shù)據(jù)集缺失項采用該特征的平均值進(jìn)行初始化處理;2、采用核模糊C均值聚類算法(KFCM)對預(yù)處理后數(shù)據(jù)集聚類,并采用凸差(DC)方法對KFCM目標(biāo)函數(shù)進(jìn)行非凸規(guī)劃優(yōu)化,使最優(yōu)解盡可能跳出局部極值點的吸引域;3、求得聚類中心和數(shù)據(jù)隸屬度后,將缺失數(shù)據(jù)項看作變量進(jìn)行優(yōu)化,以優(yōu)化估計值更新缺失項;4、判斷本次中所有缺失數(shù)據(jù)優(yōu)化解與上一次缺失優(yōu)化解的差是否小于給定閾值,迭代更新2、3直至滿足收斂條件。本方法能夠快速地求得缺失項的估計值,并提高原KFCM算法的聚類精度,且適用于大規(guī)模數(shù)據(jù)集。
技術(shù)研發(fā)人員:陳松燦;賀丹
受保護(hù)的技術(shù)使用者:南京航空航天大學(xué)
技術(shù)研發(fā)日:2016.04.05
技術(shù)公布日:2017.10.24