挖掘石窟壁畫群中石窟壁畫時(shí)空關(guān)聯(lián)關(guān)系的方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及圖像處理領(lǐng)域,特別涉及一種挖掘石窟壁畫群中石窟壁畫時(shí)空關(guān)聯(lián)關(guān) 系的方法和裝置。
【背景技術(shù)】
[0002] 所謂石窟壁畫為繪制在石洞墻壁上的畫作,而同一石窟內(nèi)的多幅石窟壁畫構(gòu)成石 窟壁畫群,其中,國內(nèi)已經(jīng)發(fā)現(xiàn)的石窟壁畫群包括:新疆石窟壁畫群、敦煌莫高窟壁畫群等 等。由于石窟壁畫群作為重要的文化遺產(chǎn),國內(nèi)外學(xué)者發(fā)表了大量關(guān)于石窟壁畫群的專著 文獻(xiàn),以從歷史淵源、宗教背景、壁畫內(nèi)容、藝術(shù)風(fēng)格、建筑風(fēng)格、壁畫原材料等諸多方面對(duì) 壁畫群中單幅壁畫進(jìn)行了大量深入細(xì)致的研究工作。
[0003] 盡管關(guān)于壁畫群中單幅壁畫的研究能夠?yàn)槭弑诋嬵I(lǐng)域的提供大量的參考數(shù)據(jù), 但是,所提供的參考數(shù)據(jù)比較單一和分散,因此,為了提供研究石窟壁畫的關(guān)于整體關(guān)系的 參考數(shù)據(jù),存在對(duì)石窟壁畫群中各個(gè)石窟壁畫間的關(guān)聯(lián)關(guān)系的確定的需求。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明實(shí)施例公開了一種挖掘石窟壁畫群中石窟壁畫時(shí)空關(guān)聯(lián)關(guān)系的方法和裝 置,以挖掘確定出石窟壁畫群中石窟壁畫的時(shí)空關(guān)聯(lián)關(guān)系,為研究石窟壁畫的整體的關(guān)聯(lián) 關(guān)系提供參考數(shù)據(jù)。具體方案如下:
[0005] -方面,本發(fā)明實(shí)施例提供了一種挖掘石窟壁畫群中石窟壁畫時(shí)空關(guān)聯(lián)關(guān)系的方 法,所述方法包括:
[0006] 確定石窟壁畫群中各石窟壁畫的第一描述數(shù)據(jù),并將每幅石窟壁畫確定為一個(gè)元 組,其中,所述石窟壁畫的第一描述數(shù)據(jù)為:從預(yù)先獲得的該石窟壁畫中的描述信息以及預(yù) 先獲得的關(guān)于該石窟壁畫的介紹信息中提取得到;
[0007] 基于Apriori算法對(duì)各石窟壁畫的第一描述數(shù)據(jù)進(jìn)行第一詞頻統(tǒng)計(jì),進(jìn)而,獲得各 石窟壁畫所對(duì)應(yīng)的描述詞和所述描述詞所對(duì)應(yīng)的詞頻;
[0008] 將各石窟壁畫中詞頻超過第一預(yù)設(shè)閾值的多個(gè)描述詞確定為相應(yīng)元組的預(yù)定類 別屬性,其中,所述預(yù)定類別屬性包括:時(shí)間類屬性、空間類屬性和描述類屬性;
[0009] 從各石窟壁畫的第一描述數(shù)據(jù)中,確定所對(duì)應(yīng)元組的屬于預(yù)定類別屬性的各個(gè)描 述詞所對(duì)應(yīng)的多個(gè)描述子數(shù)據(jù),并將所述多個(gè)描述子數(shù)據(jù)中出現(xiàn)次數(shù)超過預(yù)設(shè)數(shù)量閾值的 目標(biāo)描述子數(shù)據(jù)確定為相應(yīng)描述詞所對(duì)應(yīng)的元組的屬性值;
[0010]根據(jù)各個(gè)元組的屬于描述類屬性的各個(gè)描述詞的屬性值,將所述各個(gè)元組關(guān)聯(lián)成 復(fù)雜網(wǎng)絡(luò),其中,復(fù)雜網(wǎng)絡(luò)中的節(jié)點(diǎn)為所述元組;
[0011]利用復(fù)雜網(wǎng)絡(luò)分析算法,將所述復(fù)雜網(wǎng)絡(luò)中的所有元組以模塊化參數(shù)最大化的標(biāo) 準(zhǔn)分割為多個(gè)網(wǎng)絡(luò)模塊,每個(gè)網(wǎng)絡(luò)模塊中包括至少一個(gè)元組;
[0012]將所述多個(gè)網(wǎng)絡(luò)模塊中符合預(yù)定條件的目標(biāo)網(wǎng)絡(luò)模塊所包括元組對(duì)應(yīng)的石窟壁 畫確定為存在時(shí)空關(guān)聯(lián)關(guān)系,其中,所述預(yù)定條件包括:所包括元組的屬于時(shí)間類屬性的描 述詞的屬性值不同和/或空間類屬性的描述詞的屬性值不同。
[0013] 較佳的,所述基于Apriori算法對(duì)各石窟壁畫的第一描述數(shù)據(jù)進(jìn)行第一詞頻統(tǒng)計(jì), 包括:
[0014] 基于Apriori算法對(duì)各石窟壁畫的第一描述數(shù)據(jù)進(jìn)行除語氣助詞、數(shù)字、語氣詞、 標(biāo)點(diǎn)符號(hào)以及結(jié)構(gòu)助詞之外的第一詞頻統(tǒng)計(jì)。
[0015] 較佳的,關(guān)于該石窟壁畫中的描述信息的獲得方式,包括:
[0016] 對(duì)紙質(zhì)形式的石窟壁畫中的描述信息依次進(jìn)行掃描和光學(xué)字符識(shí)別,從而獲得該 石窟壁畫中的描述信息;
[0017] 關(guān)于該石窟壁畫的介紹信息的獲得方式,包括:
[0018] 對(duì)紙質(zhì)形式的該石窟壁畫的介紹信息依次進(jìn)行掃描和光學(xué)字符識(shí)別,從而獲得該 石窟壁畫的介紹信息。
[0019] 較佳的,所述獲得各壁畫所對(duì)應(yīng)的描述詞和所述描述詞所對(duì)應(yīng)的詞頻包括:
[0020] 利用基于無監(jiān)督學(xué)習(xí)的自組織映射算法對(duì)所述各壁畫所對(duì)應(yīng)的描述詞進(jìn)行量化 分析,以濾除屬于噪聲的描述詞;
[0021] 獲得濾除噪聲的描述詞的各石窟壁畫所對(duì)應(yīng)的描述詞和所述描述詞所對(duì)應(yīng)的詞 頻,所述屬于噪聲的描述詞為對(duì)所述紙質(zhì)形式的石窟壁畫中的描述信息和/或所述紙質(zhì)形 式的該石窟壁畫的介紹信息依次進(jìn)行進(jìn)行掃描和光學(xué)字符識(shí)別時(shí),出現(xiàn)的錯(cuò)誤識(shí)別的描述 詞;其中,所述自組織映射算法中參數(shù)選擇六邊形映射格點(diǎn),初始化碼書選擇隨機(jī)碼書,訓(xùn) 練過程選擇批處理batch訓(xùn)練算法,映射函數(shù)選擇高斯鄰域函數(shù)
高斯鄰域函數(shù)中σ為鄰域半徑,r。為單元c的位置,c代表batch訓(xùn)練過程中,對(duì)應(yīng)的各石窟壁 畫所對(duì)應(yīng)的描述詞訓(xùn)練輸出結(jié)果索引,η。表示濾除噪聲的描述詞的各石窟壁畫所對(duì)應(yīng)的描 述詞與未濾除噪聲的描述詞間的高斯距離,r。是batch訓(xùn)練過程輸出的濾除噪聲的描述詞 的各石窟壁畫所對(duì)應(yīng)的描述詞,^是訓(xùn)練輸入的各石窟壁畫所對(duì)應(yīng)的描述詞,| |η-Γι| |表 示訓(xùn)練時(shí)產(chǎn)生的噪聲的一階原點(diǎn)矩。
[0022] 較佳的,所述根據(jù)各個(gè)元組的屬于描述類屬性的各個(gè)描述詞的屬性值,將所述各 個(gè)元組關(guān)聯(lián)成復(fù)雜網(wǎng)絡(luò),包括:
[0023] 針對(duì)每兩個(gè)元組,當(dāng)所述兩個(gè)元組的屬于描述類屬性的各個(gè)描述詞的屬性值相同 的數(shù)量超過第三預(yù)設(shè)閾值時(shí),確定所述兩個(gè)元組相互關(guān)聯(lián);
[0024] 依次確定每兩個(gè)元組間的關(guān)聯(lián)關(guān)系,將所述各元組關(guān)聯(lián)成復(fù)雜網(wǎng)絡(luò)。
[0025] 較佳的,在所述將所述多個(gè)網(wǎng)絡(luò)模塊中符合預(yù)定條件的目標(biāo)網(wǎng)絡(luò)模塊所包括元組 對(duì)應(yīng)的石窟壁畫確定為存在時(shí)空關(guān)聯(lián)關(guān)系之后,還包括:
[0026] 計(jì)算所述目標(biāo)網(wǎng)絡(luò)模塊占所有網(wǎng)絡(luò)模塊的百分比,以定量確定所述石窟壁畫群中 各石窟壁畫的時(shí)空關(guān)聯(lián)關(guān)系。
[0027] 另一方面,本發(fā)明實(shí)施例還提供了一種挖掘石窟壁畫群中石窟壁畫時(shí)空關(guān)聯(lián)關(guān)系 的裝置,所述裝置包括:
[0028] 確定單元:用于確定石窟壁畫群中各石窟壁畫的第一描述數(shù)據(jù),并將每幅石窟壁 畫確定為一個(gè)元組,其中,所述石窟壁畫的第一描述數(shù)據(jù)為:從預(yù)先獲得的該石窟壁畫中的 描述信息以及預(yù)先獲得的關(guān)于該石窟壁畫的介紹信息中提取得到;
[0029] 詞頻統(tǒng)計(jì)單元:用于基于Apriori算法對(duì)各石窟壁畫的第一描述數(shù)據(jù)進(jìn)行第一詞 頻統(tǒng)計(jì),進(jìn)而,獲得各石窟壁畫所對(duì)應(yīng)的描述詞和所述描述詞所對(duì)應(yīng)的詞頻;
[0030] 預(yù)定類別屬性確定單元:用于將各石窟壁畫中詞頻超過第一預(yù)設(shè)閾值的多個(gè)描述 詞確定為相應(yīng)元組的預(yù)定類別屬性,其中,所述預(yù)定類別屬性包括:時(shí)間類屬性、空間類屬 性和描述類屬性;
[0031] 屬性值確定單元:用于從各石窟壁畫的第一描述數(shù)據(jù)中,確定所對(duì)應(yīng)元組的屬于 預(yù)定類別屬性的各個(gè)描述詞所對(duì)應(yīng)的多個(gè)描述子數(shù)據(jù),并將所述多個(gè)描述子數(shù)據(jù)中出現(xiàn)次 數(shù)超過預(yù)設(shè)數(shù)量閾值的目標(biāo)描述子數(shù)據(jù)確定為相應(yīng)描述詞所對(duì)應(yīng)的元組的屬性值;
[0032] 復(fù)雜網(wǎng)絡(luò)關(guān)聯(lián)單元:用于根據(jù)各個(gè)元組的屬于描述類屬性的各個(gè)描述詞的屬性 值,將所述各個(gè)元組關(guān)聯(lián)成復(fù)雜網(wǎng)絡(luò),其中,復(fù)雜網(wǎng)絡(luò)中的節(jié)點(diǎn)為所述元組;
[0033] 網(wǎng)絡(luò)模塊分割單元:用于利用復(fù)雜網(wǎng)絡(luò)分析算法,將所述復(fù)雜網(wǎng)絡(luò)中的所有元組 以模塊化參數(shù)最大化的標(biāo)準(zhǔn)分割為多個(gè)網(wǎng)絡(luò)模塊,每個(gè)網(wǎng)絡(luò)模塊中包括至少一個(gè)元組;
[0034] 時(shí)空關(guān)聯(lián)關(guān)系確定單元:用于將所述多個(gè)網(wǎng)絡(luò)模塊中符合預(yù)定條件的目標(biāo)網(wǎng)絡(luò)模 塊所包括元組對(duì)應(yīng)的石窟壁畫確定為存在時(shí)空關(guān)聯(lián)關(guān)系,其中,所述預(yù)定條件包括:所包括 元組的屬于時(shí)間類屬性的描述詞的屬性值不同和/或空間類屬性的描述詞的屬性值不同。
[0035] 較佳的,關(guān)于該石窟壁畫中的描述信息的獲得方式,包括:
[0036] 對(duì)紙質(zhì)形式的石窟壁畫中的描述信息依次進(jìn)行掃描和光學(xué)字符識(shí)別,從而獲得該 石窟壁畫中的描述信息;
[0037] 關(guān)于該石窟壁畫的介紹信息的獲得方式,包括:
[0038] 對(duì)紙質(zhì)形式的該石窟壁畫的介紹信息依次進(jìn)行掃描和光學(xué)字符識(shí)別,從而獲得該 石窟壁畫的介紹信息。
[0039] 較佳的,所述詞頻統(tǒng)計(jì)單元具體用于:
[0040] 利用基于無監(jiān)督學(xué)習(xí)的自組織映射算法對(duì)所述各壁畫所對(duì)應(yīng)的描述詞進(jìn)行量化 分析,以濾除屬于噪聲的描述詞;
[0041] 獲得濾除噪聲的描述詞的各石窟壁畫所對(duì)應(yīng)的描述詞和所述描述詞所對(duì)應(yīng)的詞 頻,所述屬于噪聲的描述詞為對(duì)所述紙質(zhì)形式的石窟壁畫中的描述信息和/或所述紙質(zhì)形 式的該石窟壁畫的介紹信息依次進(jìn)行進(jìn)行掃描和光學(xué)字符識(shí)別時(shí),出現(xiàn)的錯(cuò)誤識(shí)別的描述 詞;其中,所述自組織映射算法中參數(shù)選擇六邊形映射格點(diǎn),初始化碼書選擇隨機(jī)碼書,訓(xùn) 練過程選擇批處理batch訓(xùn)練算法,映射函數(shù)選擇高斯鄰域函數(shù)
高斯鄰域函數(shù)中σ為鄰域半徑,r。為單元c的位置,c代