專利名稱:規(guī)則發(fā)現(xiàn)程序、規(guī)則發(fā)現(xiàn)處理和規(guī)則發(fā)現(xiàn)裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于發(fā)現(xiàn)多個(gè)信息項(xiàng)之間的關(guān)系的規(guī)則發(fā)現(xiàn)程序、規(guī)則發(fā)現(xiàn)處理和規(guī)則發(fā)現(xiàn)裝置,更具體地,該規(guī)則發(fā)現(xiàn)程序、規(guī)則發(fā)現(xiàn)處理和規(guī)則發(fā)現(xiàn)裝置用于發(fā)現(xiàn)多媒體數(shù)據(jù)項(xiàng)和分別與這些多媒體數(shù)據(jù)項(xiàng)相關(guān)聯(lián)的文本數(shù)據(jù)項(xiàng)之間的關(guān)系。
背景技術(shù):
目前,在多種領(lǐng)域中使用了基于多媒體數(shù)據(jù)的狀態(tài)分析。例如,可以通過采集并分析組件的圖像來確定在制造中使用的組件(部件)的圖像是否令人滿意。目前在包括靜態(tài)或運(yùn)動(dòng)圖像的分析、體數(shù)據(jù)(volumedata)的分析、時(shí)間系列信息的分析、流體分析,機(jī)械組件的性能分析、醫(yī)學(xué)圖像的診斷、大腦功能的識(shí)別(clarification)、市場分析等在內(nèi)的廣泛范圍內(nèi)使用基于諸如上述圖像的多媒體數(shù)據(jù)的多種類型的狀態(tài)估測(例如,疾病的診斷)。
在基于多媒體數(shù)據(jù)進(jìn)行狀態(tài)分析的情況下,當(dāng)通過一規(guī)則(科學(xué)規(guī)則)來表示由多媒體數(shù)據(jù)表示的對(duì)象的特性和由多媒體數(shù)據(jù)表示的信息之間的關(guān)系時(shí),可以提高多媒體數(shù)據(jù)的分析效率。例如,在存在組件的照片圖像,并且在進(jìn)行組件是否令人滿意的確定時(shí)知道應(yīng)該關(guān)注的照片圖像的區(qū)域的情況下,可以根據(jù)該照片圖像容易地進(jìn)行該確定。
因此,需要對(duì)知識(shí)發(fā)現(xiàn)提供支持的裝置(例如,圖像挖掘(mining)裝置),該知識(shí)與多媒體數(shù)據(jù)和表示對(duì)象特性的文本數(shù)據(jù)之間的關(guān)系有關(guān)。在這種情況下,需要確定與文本數(shù)據(jù)具有強(qiáng)相關(guān)性的多媒體數(shù)據(jù)的一部分(例如,這表示該組件是否令人滿意)。
此時(shí),可以將多媒體數(shù)據(jù)的特征部分確定為與文本數(shù)據(jù)具有強(qiáng)相關(guān)性的上述部分。從多媒體數(shù)據(jù)中提取預(yù)定特征(例如,在多媒體數(shù)據(jù)表示圖像的情況下,為圖像特征)的多種方法是公知的。由于存在包括相對(duì)普通的特征(例如,顏色)和對(duì)于個(gè)別領(lǐng)域特定的特征(例如,圖像的某些部分的形狀)在內(nèi)的許多圖像特征,所以難以預(yù)先指定適當(dāng)?shù)膱D像特征(與文本數(shù)據(jù)具有強(qiáng)相關(guān)性)。
考慮上述情況,提出了一種方法,用于在根據(jù)多對(duì)圖像數(shù)據(jù)項(xiàng)和與這些圖像數(shù)據(jù)項(xiàng)相關(guān)聯(lián)的字符數(shù)據(jù)項(xiàng)(文本數(shù)據(jù)項(xiàng)),來發(fā)現(xiàn)與圖像特征和文本特征之間的關(guān)系相關(guān)的知識(shí)(規(guī)則)的處理中,基于操作者的視覺觀察來支持提取圖像特征的操作。此時(shí),可以設(shè)置表示圖像和文本(即,表示事件之間的相關(guān)程度的規(guī)則)之間關(guān)系的相關(guān)規(guī)則,并顯示相關(guān)規(guī)則的評(píng)估結(jié)果(例如,如日本未審查專利公報(bào)No.2003-67401中所公開的)。
但是,根據(jù)日本未審查專利公報(bào)No.2003-67401中公開的技術(shù),人為地確定圖像特征,因此產(chǎn)生下列問題。
(a)勞動(dòng)成本增加。
(b)所發(fā)現(xiàn)的規(guī)則可能取決于個(gè)人觀點(diǎn)。
(c)可能忽略難以發(fā)現(xiàn)的規(guī)則。
為了解決上述問題,由本專利申請(qǐng)的受讓人提交的日本專利申請(qǐng)No.2003-433233公開了一種技術(shù)。根據(jù)該技術(shù),對(duì)圖像執(zhí)行小波變換,并從通過小波變換產(chǎn)生的系數(shù)中提取下述系數(shù),基于該系數(shù)可以確定文本數(shù)據(jù)的特征。
然而,在日本專利申請(qǐng)No.2003-433233中公開的上述技術(shù)中,通過分析僅僅獲得了各個(gè)系數(shù)和文本數(shù)據(jù)之間的關(guān)系。因此,即使當(dāng)文本數(shù)據(jù)和位于圖像中的多個(gè)離散位置中的部分?jǐn)?shù)據(jù)之間存在強(qiáng)相關(guān)性時(shí),也不能提取表示該相關(guān)性的規(guī)則。例如,在某些情況下,即使當(dāng)文本數(shù)據(jù)與區(qū)域A中的部分?jǐn)?shù)據(jù)之間,或者文本數(shù)據(jù)與區(qū)域B中的部分?jǐn)?shù)據(jù)之間沒有相關(guān)性時(shí),在文本數(shù)據(jù)與區(qū)域A和B中的部分?jǐn)?shù)據(jù)的總和之間也可能存在強(qiáng)相關(guān)性。
此外,通常通過多個(gè)數(shù)據(jù)元(例如,圖像的各個(gè)像素的亮度)來構(gòu)成各個(gè)多媒體數(shù)據(jù)項(xiàng)。因此,如果將各個(gè)數(shù)據(jù)元作為單個(gè)變量進(jìn)行處理,則這些變量的可能組合的數(shù)量會(huì)非常大。但是,通過完全檢查這些變量的極大數(shù)量的可能組合,難以實(shí)時(shí)精確地獲得文本數(shù)據(jù)和這些變量的極大數(shù)量的可能組合之間的關(guān)系。
發(fā)明內(nèi)容
鑒于上述問題提出了本發(fā)明,并且本發(fā)明的目的是提供一種對(duì)于規(guī)則的產(chǎn)生有效的規(guī)則發(fā)現(xiàn)程序、規(guī)則發(fā)現(xiàn)處理和規(guī)則發(fā)現(xiàn)裝置,其能夠通過自動(dòng)地搜索多媒體數(shù)據(jù)的特征部分,來發(fā)現(xiàn)表示多媒體數(shù)據(jù)項(xiàng)和文本數(shù)據(jù)項(xiàng)之間關(guān)系的規(guī)則。
為了實(shí)現(xiàn)上述目的,提供了一種規(guī)則發(fā)現(xiàn)程序,用于發(fā)現(xiàn)表示多媒體數(shù)據(jù)項(xiàng)和分別與這些多媒體數(shù)據(jù)項(xiàng)相關(guān)的文本數(shù)據(jù)項(xiàng)之間關(guān)系的規(guī)則。該規(guī)則發(fā)現(xiàn)程序使計(jì)算機(jī)包括輸入接收單元,用于接收分別由多媒體數(shù)據(jù)項(xiàng)和文本數(shù)據(jù)項(xiàng)形成的對(duì)所構(gòu)成的樣本數(shù)據(jù)項(xiàng);搜索單元,用于執(zhí)行選擇數(shù)據(jù)陣列的評(píng)估位置的操作,并產(chǎn)生表示評(píng)估位置的選擇模式,其中該數(shù)據(jù)陣列構(gòu)成樣本數(shù)據(jù)項(xiàng)中的各個(gè)多媒體數(shù)據(jù)項(xiàng),而評(píng)估位置是要進(jìn)行評(píng)估的位置;集成單元,用于執(zhí)行對(duì)由搜索單元選擇的數(shù)據(jù)陣列的評(píng)估位置進(jìn)行集成,以產(chǎn)生一個(gè)或更多個(gè)待評(píng)估的評(píng)估區(qū)域的操作;候選規(guī)則產(chǎn)生單元,用于執(zhí)行下述操作,該操作通過由一個(gè)或更多個(gè)數(shù)值來表示一個(gè)或更多個(gè)評(píng)估區(qū)域中的數(shù)據(jù),在各個(gè)多媒體數(shù)據(jù)項(xiàng)中產(chǎn)生一個(gè)或更多個(gè)評(píng)估區(qū)域的特征數(shù)據(jù),并產(chǎn)生表示各個(gè)多媒體數(shù)據(jù)項(xiàng)中的一個(gè)或更多個(gè)評(píng)估區(qū)域的特征數(shù)據(jù)和與這些多媒體數(shù)據(jù)項(xiàng)相關(guān)的文本數(shù)據(jù)項(xiàng)之一之間的關(guān)系的候選規(guī)則,其中由該候選規(guī)則表示的關(guān)系為所有多媒體數(shù)據(jù)項(xiàng)所共有;候選規(guī)則評(píng)估單元,用于執(zhí)行下述操作,該操作對(duì)由候選規(guī)則產(chǎn)生單元所產(chǎn)生的候選規(guī)則所表示的關(guān)系的精確度進(jìn)行評(píng)估,以獲得評(píng)估結(jié)果;以及輸出單元,用于執(zhí)行下述操作,該操作在評(píng)估結(jié)果滿足預(yù)定標(biāo)準(zhǔn)時(shí),將由候選規(guī)則產(chǎn)生單元產(chǎn)生的候選規(guī)則作為規(guī)則輸出。根據(jù)數(shù)據(jù)陣列的評(píng)估位置的不同組合來重復(fù)搜索單元、集成單元、候選規(guī)則產(chǎn)生單元、候選規(guī)則評(píng)估單元以及輸出單元的操作,直到滿足完成搜索操作的預(yù)定條件為止。
此外,為了實(shí)現(xiàn)上述目的,提供了一種規(guī)則發(fā)現(xiàn)處理,用于通過使用計(jì)算機(jī)來發(fā)現(xiàn)表示多媒體數(shù)據(jù)項(xiàng)和分別與這些多媒體數(shù)據(jù)項(xiàng)相關(guān)的文本數(shù)據(jù)項(xiàng)之間關(guān)系的規(guī)則。該規(guī)則發(fā)現(xiàn)處理包括以下步驟(a)通過輸入接收單元來接收分別由多媒體數(shù)據(jù)項(xiàng)和文本數(shù)據(jù)項(xiàng)形成的對(duì)所構(gòu)成的樣本數(shù)據(jù)項(xiàng);(b)通過搜索單元來選擇數(shù)據(jù)陣列的評(píng)估位置,并生成表示評(píng)估位置的選擇模式,其中該數(shù)據(jù)陣列構(gòu)成樣本數(shù)據(jù)項(xiàng)中的各個(gè)多媒體數(shù)據(jù)項(xiàng),而該評(píng)估位置是要進(jìn)行評(píng)估的位置;(c)通過集成單元對(duì)在步驟(b)中選擇的數(shù)據(jù)陣列的評(píng)估位置進(jìn)行集成,以產(chǎn)生要進(jìn)行評(píng)估的一個(gè)或更多個(gè)評(píng)估區(qū)域;(d),通過用一個(gè)或更多個(gè)數(shù)值來表示一個(gè)或更多個(gè)評(píng)估區(qū)域中的數(shù)據(jù),由候選規(guī)則產(chǎn)生單元在各個(gè)多媒體數(shù)據(jù)項(xiàng)中產(chǎn)生一個(gè)或更多個(gè)評(píng)估區(qū)域的特征數(shù)據(jù),并且產(chǎn)生表示各個(gè)多媒體數(shù)據(jù)項(xiàng)中的一個(gè)或更多個(gè)評(píng)估區(qū)域的特征數(shù)據(jù)和與這些多媒體數(shù)據(jù)項(xiàng)相關(guān)的文本數(shù)據(jù)項(xiàng)之一之間關(guān)系的候選規(guī)則,其中由候選規(guī)則表示的關(guān)系為所有多媒體數(shù)據(jù)項(xiàng)所共有;(e)通過候選規(guī)則評(píng)估單元對(duì)步驟(d)中產(chǎn)生的候選規(guī)則所表示的關(guān)系的精確度進(jìn)行評(píng)估,以獲得評(píng)估結(jié)果;以及(f)當(dāng)該評(píng)估結(jié)果滿足預(yù)定標(biāo)準(zhǔn)時(shí),通過輸出單元將步驟(d)中產(chǎn)生的候選規(guī)則作為規(guī)則輸出。根據(jù)數(shù)據(jù)陣列的評(píng)估位置的不同組合重復(fù)步驟(b)至(f)中的操作,直到滿足完成搜索操作的預(yù)定條件為止。
此外,為了實(shí)現(xiàn)上述目的,提供了一種規(guī)則發(fā)現(xiàn)裝置,用于發(fā)現(xiàn)表示多媒體數(shù)據(jù)項(xiàng)和分別與這些多媒體數(shù)據(jù)項(xiàng)相關(guān)的文本數(shù)據(jù)項(xiàng)之間關(guān)系的規(guī)則。該規(guī)則發(fā)現(xiàn)裝置包括輸入接收單元,用于接收分別由多媒體數(shù)據(jù)項(xiàng)和文本數(shù)據(jù)項(xiàng)形成的對(duì)所構(gòu)成的樣本數(shù)據(jù)項(xiàng);搜索單元,用于執(zhí)行下述操作,該操作選擇數(shù)據(jù)陣列的多個(gè)評(píng)估位置,并產(chǎn)生表示這些評(píng)估位置的選擇模式,其中該數(shù)據(jù)陣列構(gòu)成樣本數(shù)據(jù)項(xiàng)中的各個(gè)多媒體數(shù)據(jù)項(xiàng),而評(píng)估位置是要進(jìn)行評(píng)估的位置;集成單元,用于執(zhí)行對(duì)由搜索單元選擇的數(shù)據(jù)陣列的評(píng)估位置進(jìn)行集成的操作,以產(chǎn)生要進(jìn)行評(píng)估的一個(gè)或更多個(gè)評(píng)估區(qū)域;候選規(guī)則產(chǎn)生單元,用于執(zhí)行下述操作,該操作通過由一個(gè)或更多個(gè)數(shù)值來表示一個(gè)或更多個(gè)評(píng)估區(qū)域中的數(shù)據(jù),在各個(gè)多媒體數(shù)據(jù)項(xiàng)中產(chǎn)生一個(gè)或更多個(gè)評(píng)估區(qū)域的特征數(shù)據(jù),并且產(chǎn)生表示各個(gè)多媒體數(shù)據(jù)項(xiàng)中的一個(gè)或更多個(gè)評(píng)估區(qū)域的特征數(shù)據(jù)和與這些多媒體數(shù)據(jù)項(xiàng)相關(guān)的文本數(shù)據(jù)項(xiàng)之一之間關(guān)系的候選規(guī)則,其中由候選規(guī)則表示的關(guān)系為所有多媒體數(shù)據(jù)項(xiàng)所共有;候選規(guī)則評(píng)估單元,用于執(zhí)行下述操作,該操作對(duì)由候選規(guī)則產(chǎn)生單元所產(chǎn)生的候選規(guī)則表示的關(guān)系的精確度進(jìn)行評(píng)估,以獲得評(píng)估結(jié)果;以及輸出單元,用于執(zhí)行操作,該操作在該評(píng)估結(jié)果滿足預(yù)定標(biāo)準(zhǔn)時(shí),將由候選規(guī)則產(chǎn)生單元產(chǎn)生的候選規(guī)則作為規(guī)則輸出。根據(jù)該數(shù)據(jù)陣列的評(píng)估位置的不同組合重復(fù)搜索單元、集成單元、候選規(guī)則產(chǎn)生單元、候選規(guī)則評(píng)估單元以及輸出單元的操作,直到滿足完成搜索操作的預(yù)定條件為止。
當(dāng)結(jié)合通過示例的方式顯示本發(fā)明的優(yōu)選實(shí)施例的附圖時(shí),根據(jù)以下說明,本發(fā)明的上述及其它目的、特征和優(yōu)點(diǎn)將變得明了。
圖1是表示在實(shí)施例中實(shí)現(xiàn)的本發(fā)明的概念圖。
圖2表示與PC機(jī)殼形狀相對(duì)應(yīng)的溫度分布圖像。
圖3表示其中使用了本發(fā)明的實(shí)施例的系統(tǒng)的結(jié)構(gòu)。
圖4表示在實(shí)施例中使用的規(guī)則發(fā)現(xiàn)裝置的硬件結(jié)構(gòu)。
圖5是表示規(guī)則發(fā)現(xiàn)裝置的功能的方框圖。
圖6表示通過使用遺傳算法在像素的選擇中用于對(duì)各代進(jìn)行交替的方法。
圖7表示了處理順序,其中重復(fù)進(jìn)行評(píng)估位置的集成和多重回歸分析。
圖8是表示根據(jù)第一實(shí)施例的用于產(chǎn)生規(guī)則的處理順序的流程圖。
圖9表示其上顯示有規(guī)則的畫面的示例。
圖10是表示根據(jù)第二實(shí)施例的用于產(chǎn)生規(guī)則的處理順序的流程圖。
圖11是表示根據(jù)第三實(shí)施例的用于產(chǎn)生規(guī)則的處理順序的流程圖。
圖12是表示對(duì)逐個(gè)像素進(jìn)行分析的處理順序的流程圖。
具體實(shí)施例方式
將參照附圖描述本發(fā)明的優(yōu)選實(shí)施例,其中在所有附圖中,相同的標(biāo)號(hào)表示相同元件(element)。
首先,說明在實(shí)施例中實(shí)現(xiàn)的本發(fā)明的概要,然后說明實(shí)施例的細(xì)節(jié)。
圖1是表示在實(shí)施例中實(shí)現(xiàn)的本發(fā)明的操作的概念圖。如圖1所示,根據(jù)本發(fā)明的規(guī)則發(fā)現(xiàn)程序或規(guī)則發(fā)現(xiàn)裝置包括輸入接收單元1、搜索單元2、集成單元3、候選規(guī)則產(chǎn)生單元4、候選規(guī)則評(píng)估單元5和輸出單元6。
輸入接收單元1接收多個(gè)樣本數(shù)據(jù)項(xiàng)7a、7b和7c的輸入,該多個(gè)樣本數(shù)據(jù)項(xiàng)7a、7b和7c分別由多對(duì)多媒體數(shù)據(jù)項(xiàng)7aa、7ba和7ca以及文本數(shù)據(jù)項(xiàng)7ab、7bb和7cb構(gòu)成。
搜索單元2選擇數(shù)據(jù)陣列的多個(gè)評(píng)估位置(即,要進(jìn)行評(píng)估的位置),并產(chǎn)生表示所選擇的多個(gè)評(píng)估位置的選擇模式8a,其中該數(shù)據(jù)陣列構(gòu)成多個(gè)樣本數(shù)據(jù)項(xiàng)7a、7b和7c中的多媒體數(shù)據(jù)項(xiàng)7aa、7ba和7ca中的每一個(gè)。例如,在多媒體數(shù)據(jù)項(xiàng)7aa、7ba和7ca是圖像數(shù)據(jù)項(xiàng)的情況下,該數(shù)據(jù)陣列的評(píng)估位置是像素位置,并且由x-和y-坐標(biāo)表示。
此外,搜索單元2改變數(shù)據(jù)陣列的評(píng)估位置(的組合),并重復(fù)進(jìn)行用于產(chǎn)生選擇模式8a的處理,直到滿足完成搜索操作的預(yù)定條件為止。例如,搜索單元2重復(fù)進(jìn)行用于產(chǎn)生選擇模式8a的處理,直到所產(chǎn)生的選擇模式的數(shù)量超過預(yù)定數(shù)量為止。
集成單元3集成各個(gè)選擇模式8a中的數(shù)據(jù)陣列的多個(gè)評(píng)估位置,以產(chǎn)生一個(gè)或更多個(gè)(或預(yù)定數(shù)量的)評(píng)估區(qū)域8b和8c,作為要進(jìn)行評(píng)估的區(qū)域。例如,集成單元3集成數(shù)據(jù)陣列的多個(gè)評(píng)估位置中相鄰的多個(gè)評(píng)估位置。該預(yù)定數(shù)量例如為兩個(gè)。
候選規(guī)則產(chǎn)生單元4通過由一個(gè)或更多個(gè)數(shù)值來表示一個(gè)或更多個(gè)評(píng)估區(qū)域中的數(shù)據(jù),產(chǎn)生各個(gè)多媒體數(shù)據(jù)項(xiàng)7aa、7ba和7ca中的一個(gè)或更多個(gè)評(píng)估區(qū)域8b和8c的特征數(shù)據(jù),并且產(chǎn)生候選規(guī)則8d,該候選規(guī)則8d表示各個(gè)多媒體數(shù)據(jù)項(xiàng)中的一個(gè)或更多個(gè)評(píng)估區(qū)8b和8c的特征數(shù)據(jù)和與這些多媒體數(shù)據(jù)項(xiàng)相關(guān)的多個(gè)文本數(shù)據(jù)項(xiàng)7ab、7bb和7cb中的一個(gè)之間的關(guān)系,其中該關(guān)系為所有多媒體數(shù)據(jù)項(xiàng)7aa、7ba和7ca所共有。例如,一個(gè)或更多個(gè)評(píng)估區(qū)域8b和8c中的每一個(gè)的特征數(shù)據(jù)是評(píng)估區(qū)域中的數(shù)據(jù)的平均值,并且可以通過多重回歸分析來獲得候選規(guī)則8d。根據(jù)多重回歸分析,通過公式來表示被稱為說明性變量的多個(gè)變量X1、X1,…,Xn與被稱為目標(biāo)變量的其它變量Y之間的關(guān)系,并進(jìn)行分析,以確定說明性變量的變化對(duì)目標(biāo)變量的變化的影響程度。
候選規(guī)則評(píng)估單元5對(duì)由候選規(guī)則產(chǎn)生單元4產(chǎn)生的候選規(guī)則8d表示的關(guān)系的精確度進(jìn)行評(píng)估。例如,當(dāng)通過多重回歸分析獲得候選規(guī)則8d時(shí),可以基于由候選規(guī)則8d表示的預(yù)測公式的多重相關(guān)系數(shù)的值來對(duì)候選規(guī)則8d進(jìn)行評(píng)估。
當(dāng)由候選規(guī)則評(píng)估單元5獲得的評(píng)估結(jié)果表示該候選規(guī)則滿足預(yù)定標(biāo)準(zhǔn)時(shí),輸出單元6將該候選規(guī)則作為規(guī)則9輸出。例如,該規(guī)則9包含分別表示用于產(chǎn)生規(guī)則9的評(píng)估區(qū)域8b和8c的評(píng)估區(qū)域信息項(xiàng)9a和9b,以及表示各個(gè)多媒體數(shù)據(jù)項(xiàng)7aa、7ba和7ca中的評(píng)估區(qū)域8b和8c的特征數(shù)據(jù)與這些多媒體數(shù)據(jù)項(xiàng)中的文本數(shù)據(jù)項(xiàng)7ab、7bb和7cb中的一個(gè)之間關(guān)系的預(yù)測公式9c。
具有上述功能的該結(jié)構(gòu)如下進(jìn)行操作。
當(dāng)輸入接收單元1接收到多個(gè)文本數(shù)據(jù)項(xiàng)7ab、7bb和7cb時(shí),搜索單元2選擇數(shù)據(jù)陣列的多個(gè)評(píng)估位置(即,要進(jìn)行評(píng)估的位置),并且產(chǎn)生表示所選擇的多個(gè)評(píng)估位置的選擇模式8a,其中該數(shù)據(jù)陣列構(gòu)成多個(gè)樣本數(shù)據(jù)項(xiàng)7a、7b和7c中的各個(gè)多媒體數(shù)據(jù)項(xiàng)7aa、7ba和7ca。搜索單元2重復(fù)進(jìn)行用于產(chǎn)生選擇模式8a的處理,直到滿足完成搜索操作的預(yù)定條件為止。
接下來,集成單元3對(duì)各個(gè)選擇模式8a中的數(shù)據(jù)陣列的評(píng)估位置進(jìn)行集成,以產(chǎn)生預(yù)定數(shù)量的(一個(gè)或更多個(gè))評(píng)估區(qū)域8b和8c,作為要進(jìn)行評(píng)估的區(qū)域。
然后,候選規(guī)則產(chǎn)生單元4通過由一個(gè)或更多個(gè)數(shù)值來表示一個(gè)或更多個(gè)評(píng)估區(qū)域中的數(shù)據(jù),產(chǎn)生各個(gè)多媒體數(shù)據(jù)項(xiàng)7aa、7ba和7ca中的一個(gè)或更多個(gè)評(píng)估區(qū)域8b和8c中的每一個(gè)的特征數(shù)據(jù),并且產(chǎn)生候選規(guī)則8d,該候選規(guī)則8d表示各個(gè)多媒體數(shù)據(jù)項(xiàng)中的一個(gè)或更多個(gè)評(píng)估區(qū)域8b和8c的特征數(shù)據(jù)和與這些多媒體數(shù)據(jù)項(xiàng)相關(guān)的文本數(shù)據(jù)項(xiàng)7ab、7bb和7cb中的一個(gè)之間的關(guān)系,其中該關(guān)系為所有多媒體數(shù)據(jù)項(xiàng)7aa、7ha和7ca所共有。
隨后,規(guī)則候選評(píng)估單元5對(duì)由候選規(guī)則產(chǎn)生單元4產(chǎn)生的候選規(guī)則8d表示的關(guān)系的精確度進(jìn)行評(píng)估。在由候選規(guī)則評(píng)估單元5獲得的評(píng)估結(jié)果表示候選規(guī)則滿足預(yù)定標(biāo)準(zhǔn)的情況下,輸出單元6將該候選規(guī)則作為規(guī)則9輸出。
如上所述,可以從樣本數(shù)據(jù)項(xiàng)7a、7b和7c中自動(dòng)地提取規(guī)則9。由于集成單元3對(duì)評(píng)估位置進(jìn)行集成,所以即使當(dāng)構(gòu)成原始多媒體數(shù)據(jù)的數(shù)據(jù)元的數(shù)量很大時(shí),也可以有效地產(chǎn)生候選規(guī)則。
此外,由于可以從樣本數(shù)據(jù)項(xiàng)7a、7b和7c中自動(dòng)地提取規(guī)則9,所以可以減小勞動(dòng)成本。此外,由于可以獲得文本數(shù)據(jù)和多媒體數(shù)據(jù)中的多個(gè)區(qū)域之間的關(guān)系,所以可以增大提取不易人為發(fā)現(xiàn)的多媒體數(shù)據(jù)的特征的可能性。此外,由于根據(jù)預(yù)定的過程對(duì)候選規(guī)則進(jìn)行評(píng)估,所以可以以客觀的方式來確定規(guī)則。
下面,通過使用多媒體數(shù)據(jù)為圖像數(shù)據(jù)的示例來解釋本發(fā)明的實(shí)施例。
<第一實(shí)施例>
在第一實(shí)施例中,將本發(fā)明用于工業(yè)產(chǎn)品的設(shè)計(jì)階段。具體地,將本發(fā)明應(yīng)用于為獲得個(gè)人電腦的機(jī)殼(以下稱為PC機(jī)殼)強(qiáng)度與澆注在模具中的材料的溫度分布之間的關(guān)系而進(jìn)行的分析。
圖2表示與PC機(jī)殼形狀相對(duì)應(yīng)的溫度分布圖像。
在設(shè)計(jì)用于個(gè)人電腦20的機(jī)殼的模具時(shí),必須考慮機(jī)殼的強(qiáng)度。機(jī)殼的強(qiáng)度受到澆注在機(jī)殼模具中的材料的溫度分布的影響。因此,需要發(fā)現(xiàn)用于實(shí)現(xiàn)高強(qiáng)度機(jī)殼的溫度分布的規(guī)則。此時(shí),使用仿真器計(jì)算溫度分布圖像30,其表示澆注在模具中的材料的溫度分布。
溫度分布圖像30例如通過色調(diào)(或亮度)來表示澆注在模具中的材料的各個(gè)位置的溫度。此時(shí),必須根據(jù)溫度分布圖像30來發(fā)現(xiàn)影響機(jī)殼強(qiáng)度的區(qū)域30a和30b。例如,在區(qū)域30a的溫度較高而區(qū)域30b的溫度較低時(shí)機(jī)殼強(qiáng)度增大的規(guī)則的情況下,希望對(duì)機(jī)殼的形狀進(jìn)行設(shè)計(jì),以實(shí)現(xiàn)澆注在模具中的材料的這種溫度分布。
圖3表示使用了本發(fā)明的實(shí)施例的系統(tǒng)的結(jié)構(gòu)。如圖3所示,溫度分布仿真器21與規(guī)則發(fā)現(xiàn)裝置100相連。溫度分布仿真器21可以根據(jù)機(jī)殼的形狀,來計(jì)算澆注在機(jī)殼模具中的材料的溫度分布。此外,溫度分布仿真器21生成溫度分布圖像31a、32a和33a,各個(gè)溫度分布圖像31a、32a和33a例如通過色調(diào)或亮度來表示澆注在模具中的材料的各個(gè)位置的溫度。例如,各個(gè)溫度分布圖像31a、32a和33a可以通過較接近于紅色的顏色來表示與較高溫度值相對(duì)應(yīng)的區(qū)域,而通過較接近于藍(lán)色的顏色來表示與較低溫度值相對(duì)應(yīng)的區(qū)域。
規(guī)則發(fā)現(xiàn)裝置100基于由溫度分布圖像31a、32a和33a以及機(jī)殼強(qiáng)度值31b、32b和33b構(gòu)成的多個(gè)樣本數(shù)據(jù)項(xiàng)31、32和33來生成表示溫度分布圖像31a、32a和33a與機(jī)殼強(qiáng)度值31b、32b和33b之間存在的因果關(guān)系的預(yù)測公式,其中根據(jù)表示模具形狀的數(shù)據(jù),以及表示由模具產(chǎn)生的機(jī)殼強(qiáng)度值的機(jī)殼強(qiáng)度值31b、32b和33b來產(chǎn)生溫度分布圖像31a、32a和33a。
機(jī)殼的設(shè)計(jì)者可以通過使用上述系統(tǒng)來獲得下述規(guī)則,該規(guī)則用于確定所設(shè)計(jì)的機(jī)殼的性能。為此,首先,設(shè)計(jì)者準(zhǔn)備表示具有各種形狀的機(jī)殼樣本的模型數(shù)據(jù),然后將該模型數(shù)據(jù)輸入溫度分布仿真器21。
溫度分布仿真器21基于上述模型數(shù)據(jù)來計(jì)算澆注在上述機(jī)殼的模具中的材料的溫度分布,產(chǎn)生溫度分布圖像31a、32a和33a,并將溫度分布圖像31a、32a和33a輸入規(guī)則發(fā)現(xiàn)裝置100。
此外,設(shè)計(jì)者通過測量來獲得所設(shè)計(jì)的機(jī)殼的強(qiáng)度值31b、32b和33b(機(jī)殼強(qiáng)度值),并將這些值31b、32b和33b輸入規(guī)則發(fā)現(xiàn)裝置100。規(guī)則發(fā)現(xiàn)裝置100保存成對(duì)的溫度分布圖像31a、32a和33a和機(jī)殼強(qiáng)度值31b、32b和33b作為樣本數(shù)據(jù)項(xiàng)31、32和33,并且基于樣本數(shù)據(jù)項(xiàng)31、32和33產(chǎn)生規(guī)則。
圖4表示在實(shí)施例中使用的規(guī)則發(fā)現(xiàn)裝置100的硬件結(jié)構(gòu)。整個(gè)規(guī)則發(fā)現(xiàn)裝置100由CPU(中央處理器)101控制,RAM(隨機(jī)存取存儲(chǔ)器)102、HDD(硬盤驅(qū)動(dòng)器)103、圖形處理裝置104、輸入接口105以及通信接口106通過總線107與CPU 101相連。
RAM 102臨時(shí)存儲(chǔ)由CPU 101執(zhí)行的OS(操作系統(tǒng))程序和應(yīng)用程序中的至少部分程序,以及CPU 101進(jìn)行處理所需的各種數(shù)據(jù)。HDD 103存儲(chǔ)OS和應(yīng)用程序。
監(jiān)視器11與圖形處理裝置104相連,圖形處理裝置104根據(jù)來自CPU101的指令使監(jiān)視器11在屏幕上顯示圖像。鍵盤12和鼠標(biāo)13與輸入裝置105相連,該輸入裝置105通過總線107將從鍵盤12和鼠標(biāo)13發(fā)送的信號(hào)傳送給CPU 101。
通信接口106與網(wǎng)絡(luò)10相連,并通過網(wǎng)絡(luò)10與其它計(jì)算機(jī)交換數(shù)據(jù)。
通過使用上述硬件結(jié)構(gòu),可以實(shí)現(xiàn)根據(jù)本發(fā)明的規(guī)則發(fā)現(xiàn)裝置100的功能。此外,也可以通過使用類似的硬件結(jié)構(gòu)來實(shí)現(xiàn)溫度分布仿真器21。
在下文中,對(duì)通過規(guī)則發(fā)現(xiàn)裝置100來生成規(guī)則的方式進(jìn)行詳細(xì)說明。
圖5是表示規(guī)則發(fā)現(xiàn)裝置的功能的方框圖。如圖5所示,規(guī)則發(fā)現(xiàn)裝置100包括輸入接收單元110、搜索單元120、集成單元130、候選規(guī)則產(chǎn)生單元140、候選規(guī)則評(píng)估單元150以及輸出單元160。
輸入接收單元110接收分別由多對(duì)溫度分布圖像和機(jī)殼強(qiáng)度值構(gòu)成的多個(gè)樣本數(shù)據(jù)項(xiàng)的輸入,其中溫度分布圖像表示各個(gè)機(jī)殼中的溫度分布,并且由溫度分布仿真器21提供。然后,輸入接收單元110將所接收的樣本數(shù)據(jù)項(xiàng)中的全部或部分作為輸入數(shù)據(jù)傳送給搜索單元120。此外,輸入接收單元110可以將所選擇的部分溫度分布圖像傳送給搜索單元120。
此外,輸入接收單元110具有一接口,通過該接口可以接收限制條件(例如設(shè)計(jì)者的預(yù)先知識(shí)(advance knowledge)),該限制條件可以通過人工輸入提供給規(guī)則發(fā)現(xiàn)裝置100。例如,輸入接收單元110可以接收在稍后所述的規(guī)則(例如,多重回歸分析中的預(yù)測公式)中使用的變量數(shù)量的上限的操控輸入。根據(jù)要解決的問題由設(shè)計(jì)者來設(shè)置上述預(yù)先知識(shí)。
搜索單元120從構(gòu)成各個(gè)溫度分布圖像的像素的位置中選擇在生成候選規(guī)則時(shí)使用的一個(gè)以上的像素的位置作為評(píng)估位置,并產(chǎn)生表示評(píng)估位置的組合的信息作為選擇模式。搜索單元120重復(fù)進(jìn)行用于產(chǎn)生選擇模式8a的處理,直到滿足完成搜索操作的預(yù)定條件為止。
例如,當(dāng)完成所有可能組合的搜索時(shí),或者當(dāng)重復(fù)次數(shù)達(dá)到預(yù)定的上限時(shí),搜索單元120結(jié)束用于產(chǎn)生選擇模式的處理。另選地,當(dāng)通過候選規(guī)則評(píng)估單元150將候選規(guī)則評(píng)估為滿足預(yù)定標(biāo)準(zhǔn)時(shí),可以結(jié)束用于產(chǎn)生選擇模式的處理。
如果對(duì)像素的所有可能組合進(jìn)行計(jì)算,則選擇模式的數(shù)量變?yōu)?N(其中N是像素的數(shù)量),并且搜索空間變得非常大。由于處理時(shí)間隨搜索空間而增加,所以對(duì)所有像素進(jìn)行搜索是不切實(shí)際的。因此,應(yīng)預(yù)先確定結(jié)束搜索操作的條件。
為了減少處理時(shí)間,可以考慮采用近似搜索而不是窮舉搜索(對(duì)所有可能的組合進(jìn)行搜索)。近似搜索的具體示例是遺傳算法(GA)。另選地,對(duì)于組合的搜索可以使用貪婪算法、神經(jīng)網(wǎng)絡(luò)等。在該實(shí)施例中,通過使用GA來對(duì)像素的組合進(jìn)行搜索。稍后詳細(xì)說明在該實(shí)施例中執(zhí)行的GA處理。
集成單元130通過選擇由搜索單元120產(chǎn)生的選擇模式中的多個(gè)像素,對(duì)由搜索單元120選擇的多個(gè)評(píng)估位置進(jìn)行集成,以產(chǎn)生評(píng)估位置,并根據(jù)預(yù)定的過程通過預(yù)定變量值來表示所選擇的像素的值,其中像素是構(gòu)成各個(gè)圖像的最小圖像元素。
候選規(guī)則產(chǎn)生單元140通過使用由集成單元130獲得的預(yù)定變量的值來產(chǎn)生候選規(guī)則,該候選規(guī)則描述各個(gè)多媒體數(shù)據(jù)項(xiàng)(溫度分布圖像)和對(duì)應(yīng)的文本數(shù)據(jù)項(xiàng)(機(jī)殼強(qiáng)度值)之間的關(guān)系。具體地,候選規(guī)則產(chǎn)生單元140計(jì)算與通過對(duì)各個(gè)溫度分布圖像進(jìn)行集成而獲得的各個(gè)評(píng)估區(qū)域相對(duì)應(yīng)的像素的平均值,并通過多重回歸分析來生成預(yù)測公式,其中該預(yù)測公式構(gòu)成候選規(guī)則。
在通過各個(gè)溫度分布圖像中的亮度來表示溫度的情況下,各個(gè)像素值是表示像素亮度的數(shù)值,或者在通過各個(gè)溫度分布圖像中的色調(diào)來表示溫度的情況下,各個(gè)像素值是像素的色調(diào)。在后一情況下,例如,較紅的像素表示較高的溫度值,較藍(lán)的像素表示較低的溫度值,并且較大的數(shù)值表示較高的溫度值。可以通過下述計(jì)算的反算,根據(jù)色調(diào)值來獲得溫度值,通過該計(jì)算根據(jù)用于產(chǎn)生溫度分布圖像的溫度值來獲得色調(diào)值。
候選規(guī)則評(píng)估單元150基于與候選規(guī)則相關(guān)的信息對(duì)由候選規(guī)則產(chǎn)生單元140獲得的候選規(guī)則進(jìn)行評(píng)估。具體地,當(dāng)通過多重回歸分析獲得候選規(guī)則時(shí),候選規(guī)則評(píng)估單元150基于多重相關(guān)系數(shù)對(duì)候選規(guī)則進(jìn)行評(píng)估。
多重相關(guān)系數(shù)可以取-1至1范圍內(nèi)的值,并且當(dāng)預(yù)測公式中的誤差較小時(shí)具有接近于1的絕對(duì)值。因此,候選規(guī)則評(píng)估單元150使用多重相關(guān)系數(shù)的值作為評(píng)估值,候選規(guī)則評(píng)估單元150基于該評(píng)估值來確定是否要提取該候選規(guī)則作為規(guī)則。例如,當(dāng)多重相關(guān)系數(shù)的絕對(duì)值等于或大于預(yù)定閾值(例如,0.5)時(shí),候選規(guī)則評(píng)估單元150提取候選規(guī)則作為規(guī)則。此外,由于在使用多重回歸分析的情況下,說明性變量之間的相關(guān)系數(shù)也是很重要的,所以可以使用說明性變量之間的相關(guān)系數(shù)作為部分評(píng)估項(xiàng)。
當(dāng)計(jì)算了候選規(guī)則的評(píng)估值,并且確定該評(píng)估值等于或大于預(yù)定閾值時(shí),輸出單元160將候選規(guī)則作為規(guī)則輸出。輸出單元160可以輸出一個(gè)以上的規(guī)則。例如,在多重回歸分析的情況下,預(yù)測公式、多重相關(guān)系數(shù)、表示與說明性變量相對(duì)應(yīng)的像素選擇的信息等構(gòu)成規(guī)則??梢酝ㄟ^可視化(圖形顯示)來闡明表示與說明性變量相對(duì)應(yīng)的像素選擇的信息。設(shè)計(jì)者考慮以上獲得的規(guī)則,以將其反映在產(chǎn)品的設(shè)計(jì)中。
接下來,將詳細(xì)說明遺傳算法(GA)。
在GA的實(shí)施中,將所選擇的像素的各個(gè)組合認(rèn)為是個(gè)體。在第一代中,準(zhǔn)備預(yù)定數(shù)量(例如,32)的個(gè)體,其中選擇了像素的不同組合。輸出單元160在經(jīng)過幾代而產(chǎn)生的個(gè)體中重復(fù)進(jìn)行遺傳因子的交替操作(例如,交叉和變異),并搜索具有高評(píng)估值的至少一個(gè)像素組合。在近似搜索的情況下,如上獲得的各個(gè)組合不是最優(yōu)解,而是局部最優(yōu)解。
圖6表示通過使用GA算法在像素的選擇中用于對(duì)各代進(jìn)行交替的方法。為了簡化說明,在圖6的示例中,假定從4×4像素中選擇,則個(gè)體的數(shù)量為4。將表示每個(gè)像素是否被選擇的信息分配給像素作為遺傳因子。在圖6中,通過陰影線正方形表示所選擇的像素,通過空白正方形表示未選擇的像素。
考慮第n代中的個(gè)體的生成,其中n是自然數(shù)。
在這種情況下,搜索單元120確定初始遺傳因子(所選擇的像素的組合),根據(jù)該初始遺傳因子產(chǎn)生第n代的個(gè)體。例如,搜索單元120以與各個(gè)個(gè)體的適合程度相對(duì)應(yīng)的概率,從第(n-1)代的個(gè)體中選擇預(yù)定數(shù)量的個(gè)體。此時(shí),假定可以選擇相同的個(gè)體一次以上,并且將所選擇的個(gè)體中的每一個(gè)的遺傳因子確定為第n代的個(gè)體的初始遺傳因子。
接下來,搜索單元120對(duì)確定了初始遺傳因子的個(gè)體執(zhí)行交叉操作。具體地,搜索單元120從個(gè)體集合中選擇多對(duì)個(gè)體,在以上多對(duì)中確定要交換遺傳因子的區(qū)域(像素集合),交換位于形成該對(duì)的個(gè)體的對(duì)應(yīng)位置中的像素的遺傳因子,其中各個(gè)遺傳因子表示是否選擇了對(duì)應(yīng)的像素。
例如,在圖6的示例中,由個(gè)體#1和#2形成一對(duì),而由個(gè)體#3和#4形成另一對(duì)。在圖6中,個(gè)體#1和#2的右半邊與個(gè)體#3和#4的左半邊分別是其中要交換遺傳因子的各個(gè)區(qū)域(像素集合)。由此,交換個(gè)體#1和#2的右半邊中的對(duì)應(yīng)像素的遺傳因子,并交換個(gè)體#3和#4的左半邊中的對(duì)應(yīng)像素的遺傳因子。另選地,可以以其它方式來確定其中要交換遺傳因子的區(qū)域。
隨后,搜索單元120執(zhí)行變異操作。在變異操作中,搜索單元120以隨機(jī)概率(例如,0.01)來選擇像素,交換所選擇像素的遺傳因子(選擇或非選擇),然后計(jì)算各個(gè)個(gè)體的適合程度。將通過各個(gè)個(gè)體中的像素的選擇狀態(tài)的多重回歸分析而獲得的多重相關(guān)系數(shù)用作為該適合程度。
為了生成第(n+1)代的個(gè)體,以較高的概率為下一代選擇第n代的具有較高適合程度的個(gè)體。在上述示例中,個(gè)體#1、#2、#3和#4的適合程度分別是0.1、0.6、0.4和0.9。因此,為下一代選擇個(gè)體#1、#2、#3、和#4的概率分別為5%、30%、20%和45%。在圖6所示的示例中,選擇了個(gè)體#4、#2、#4和#3。
此后,對(duì)每一代執(zhí)行用于交叉和變異的相似操作,并且當(dāng)各代的交替數(shù)量超過預(yù)定數(shù)量(例如,5,000)時(shí)結(jié)束搜索操作。最后,當(dāng)至少一個(gè)候選規(guī)則的適合程度較高時(shí),輸出單元160將該至少一個(gè)候選規(guī)則作為至少一個(gè)規(guī)則輸出。
此外,如果將所選擇的位置中的所有像素用作為多重回歸分析中的關(guān)注變量,則變量的數(shù)量變得太大。因此,執(zhí)行用于對(duì)所選擇的像素位置進(jìn)行集成的處理。
接下來,說明包括由集成單元130執(zhí)行的用于對(duì)評(píng)估位置進(jìn)行集成的處理在內(nèi)的多重回歸分析的順序。
圖7表示其中重復(fù)評(píng)估位置的集成和多重回歸分析的處理順序。為了簡化說明,在圖7的示例中,假定由三個(gè)溫度分布圖像41、42和43構(gòu)成樣本數(shù)據(jù),各個(gè)溫度分布圖像由4×4像素構(gòu)成。
在第一狀態(tài)(ST1)中,如圖7所示來選擇溫度分布圖像41中的評(píng)估位置,其中由陰影正方形表示所選擇的像素,而由空白正方形表示未選擇的像素。
隨后,執(zhí)行對(duì)評(píng)估位置進(jìn)行集成的處理,以實(shí)現(xiàn)圖7中所示的第二狀態(tài)(ST2)。在圖7的示例中,以下述方式進(jìn)行集成,在該方式中,由單個(gè)變量的值來表示相鄰像素。具體地,表示經(jīng)集成單元130集成的多個(gè)像素的(亮度)值的各個(gè)預(yù)定變量的值是像素值的平均值。由于以上述方式對(duì)評(píng)估位置進(jìn)行了集成,所以與在評(píng)估中使用表示4×4像素之一的值的變量的情況相比,可以減少在評(píng)估中使用的變量數(shù)量。在圖7的示例中,將第一狀態(tài)(ST1)下的評(píng)估位置集成到第二狀態(tài)(ST2)下的三個(gè)評(píng)估區(qū)域41a、41b和41c中。
此外,可以設(shè)置評(píng)估區(qū)域的數(shù)量的上限。在這種情況下,在處理中僅使用數(shù)量不超過該上限的評(píng)估區(qū)域。此時(shí),在處理中優(yōu)選地使用包含較大數(shù)量的像素的評(píng)估區(qū)域。在圖7的示例中,假設(shè)評(píng)估區(qū)域的數(shù)量上限為2。因此,僅選擇包含較大數(shù)量的像素的評(píng)估區(qū)域41b和41c用于該處理,并且排除與較小數(shù)量的像素相對(duì)應(yīng)的評(píng)估區(qū)域41a,如圖7的第三狀態(tài)(ST3)所示。
由此,計(jì)算與所選擇的評(píng)估區(qū)域41b和41c相對(duì)應(yīng)的變量的值。在該示例中,獲得評(píng)估區(qū)域41b和41c中的像素的亮度值的平均值,分別作為說明性變量x1和x2的值,如圖7中的第四狀態(tài)(ST4)所示。即,x1=12.3和x2=32.5。
對(duì)其它溫度分布圖像42和43也執(zhí)行確定評(píng)估區(qū)域和計(jì)算說明性變量的值的操作,并由此獲得說明性變量的值,如圖7中的第五狀態(tài)(ST5)所示。隨后,候選規(guī)則產(chǎn)生單元140基于從溫度分布圖像41、42和43獲得的說明性變量的值來執(zhí)行多重回歸分析,并獲得如圖7中的第六狀態(tài)(ST6)所示的結(jié)果。
在該示例中,基于變量x1和x2的值以及目標(biāo)變量y的值(為第五狀態(tài)(ST5)下的各個(gè)樣本數(shù)據(jù)項(xiàng)獲得的),通過多重回歸分析獲得預(yù)測公式y(tǒng)=a+b×x1+c×x2,其中a、b和c是實(shí)數(shù)。即,該預(yù)測公式表示k維空間中的直線,其中k是目標(biāo)變量的數(shù)量與說明性變量的數(shù)量的總和。該預(yù)測公式是用于基于說明性變量x1和x2的值來預(yù)測目標(biāo)變量y的值的公式。計(jì)算系數(shù)a、b和c的值,以在將從各個(gè)樣本數(shù)據(jù)項(xiàng)獲得的說明性變量x1和x2的值代入該預(yù)測公式時(shí),使目標(biāo)變量y的值的誤差最小。
可以根據(jù)該預(yù)測公式獲得多重相關(guān)系數(shù)。多重相關(guān)系數(shù)是表示說明性變量與預(yù)測公式的匹配程度的數(shù)值。多重相關(guān)系數(shù)的較大絕對(duì)值表示預(yù)測公式的較高適合程度。因此,當(dāng)多重相關(guān)系數(shù)等于或大于預(yù)定閾值時(shí),輸出該預(yù)測公式。例如,Takao Enkawa,″Tahenryo no Data Kaiseki(Multivariate Data Analysis)”,published in Japanese by AsakuraShoten,Japan pp.22-43,1988說明了用于推導(dǎo)預(yù)測公式以及多重相關(guān)系數(shù)的方法的細(xì)節(jié)。
對(duì)通過GA產(chǎn)生的預(yù)定數(shù)量的不同個(gè)體(由評(píng)估位置的不同組合形成的不同選擇模式)執(zhí)行用于對(duì)評(píng)估位置進(jìn)行集成以及進(jìn)行上述多重回歸分析的處理,直到滿足完成搜索操作的預(yù)定條件為止。
當(dāng)說明性變量的數(shù)量大于樣本數(shù)量時(shí)多重回歸分析沒有意義。但是,在圖像數(shù)據(jù)的情況下,像素?cái)?shù)量通常大于樣本數(shù)量,難以使用像素本身的值作為說明性變量。因此,集成處理對(duì)于使說明性變量的數(shù)量小于樣本數(shù)量是有效的。
在下文中,參照流程圖來說明用于發(fā)現(xiàn)規(guī)則的處理的順序。
圖8是表示根據(jù)第一實(shí)施例的用于產(chǎn)生規(guī)則的處理的順序的流程圖。下面逐步地說明圖8所示的處理。
<步驟S11>輸入接收單元110加載多個(gè)樣本數(shù)據(jù)項(xiàng),各個(gè)樣本數(shù)據(jù)項(xiàng)由一對(duì)溫度分布圖像和文本數(shù)據(jù)項(xiàng)構(gòu)成,其中該溫度分布圖像表示澆注在機(jī)殼模具中的材料的溫度分布,而該文本數(shù)據(jù)項(xiàng)表示機(jī)殼的強(qiáng)度。
<步驟S12>搜索單元120生成用于根據(jù)GA進(jìn)行處理的第一代個(gè)體。具體地,搜索單元120對(duì)每一個(gè)個(gè)體從構(gòu)成各個(gè)溫度分布圖像的像素中選擇至少一個(gè)像素,并產(chǎn)生預(yù)定數(shù)量的(例如,32個(gè))個(gè)體,每一個(gè)個(gè)體分別具有表示是否選擇了對(duì)應(yīng)像素的遺傳因子。
<步驟S13>搜索單元120確定各代的交替數(shù)量是否到達(dá)了預(yù)定數(shù)量。當(dāng)確定為是時(shí),結(jié)束圖8的處理。當(dāng)確定為否時(shí),操作進(jìn)行到步驟S14。
<步驟S14>搜索單元120通過使用GA生成下一代的預(yù)定數(shù)量的個(gè)體。
<步驟S15>搜索單元120確定是否完成了對(duì)所有產(chǎn)生的個(gè)體進(jìn)行的評(píng)估。當(dāng)確定為是時(shí),操作進(jìn)行到步驟S13。當(dāng)確定為否時(shí),操作進(jìn)行到步驟S16。
<步驟S16>集成單元130選擇還沒有進(jìn)行評(píng)估的個(gè)體。
<步驟S17>集成單元130對(duì)所選擇的個(gè)體中的相鄰評(píng)估位置進(jìn)行集成。
<步驟S18>候選規(guī)則產(chǎn)生單元140從通過集成產(chǎn)生的多個(gè)評(píng)估區(qū)域中選擇預(yù)定數(shù)量的(例如,兩個(gè))評(píng)估區(qū)域(每一個(gè)評(píng)估區(qū)域都具有較大的范圍(由較大數(shù)量的像素構(gòu)成)),并產(chǎn)生表示機(jī)殼強(qiáng)度和所選擇的評(píng)估區(qū)域的值之間關(guān)系的候選規(guī)則,其中該關(guān)系為所有樣本數(shù)據(jù)項(xiàng)所共有。
具體地,在選擇預(yù)定數(shù)量的評(píng)估區(qū)域之后,候選規(guī)則產(chǎn)生單元140獲得各個(gè)樣本數(shù)據(jù)項(xiàng)的各個(gè)所選擇的評(píng)估區(qū)域中的像素亮度值的平均值,并將所獲得的平均值確定為說明性變量的值(與樣本數(shù)據(jù)項(xiàng)相對(duì)應(yīng))。此外,候選規(guī)則產(chǎn)生單元140將包含在各個(gè)樣本數(shù)據(jù)項(xiàng)中的機(jī)殼強(qiáng)度值確定為目標(biāo)變量的值(與樣本數(shù)據(jù)項(xiàng)相對(duì)應(yīng))。當(dāng)確定了所有樣本數(shù)據(jù)項(xiàng)的說明性變量和目標(biāo)變量的值時(shí),候選規(guī)則產(chǎn)生單元140基于說明性變量和目標(biāo)變量的上述值來執(zhí)行多重回歸分析,以產(chǎn)生構(gòu)成候選規(guī)則的預(yù)測公式。
<步驟S19>候選規(guī)則評(píng)估單元150對(duì)由候選規(guī)則產(chǎn)生單元140產(chǎn)生的候選規(guī)則進(jìn)行評(píng)估。具體地,候選規(guī)則評(píng)估單元150計(jì)算出在步驟S18中產(chǎn)生的預(yù)測公式的多重相關(guān)系數(shù),將其作為評(píng)估值。
<步驟S20>輸出單元160確定由候選規(guī)則評(píng)估單元150計(jì)算出的評(píng)估值(多重相關(guān)系數(shù))是否等于或大于預(yù)定閾值。當(dāng)確定為是時(shí),操作進(jìn)行到步驟S21。當(dāng)確定為否時(shí),操作進(jìn)行到步驟S15,以對(duì)其它個(gè)體進(jìn)行評(píng)估。
<步驟S21>輸出單元160輸出候選規(guī)則和表示所評(píng)估的個(gè)體中的各個(gè)所選擇評(píng)估區(qū)域的范圍的信息,作為特征提取規(guī)則。將所輸出的特征提取規(guī)則存儲(chǔ)在存儲(chǔ)裝置(例如HDD)中。此后,操作進(jìn)行到步驟S15,以對(duì)其它個(gè)體進(jìn)行評(píng)估。
如上所述,僅輸出一個(gè)或更多個(gè)評(píng)價(jià)較高的個(gè)體,并且在規(guī)則發(fā)現(xiàn)裝置100的屏幕上顯示對(duì)各個(gè)輸出的個(gè)體產(chǎn)生的信息,例如,產(chǎn)生對(duì)應(yīng)規(guī)則時(shí)所選擇的像素的位置。
圖9表示其上顯示有規(guī)則的畫面的示例。在圖9中,規(guī)則顯示屏幕50上顯示了溫度分布圖像51。溫度分布圖像51中表示了PC機(jī)殼的形狀51a,并且在PC機(jī)殼的形狀51a中通過顏色表示了澆注在PC機(jī)殼模具中的材料的溫度分布。
此外,在該畫面上還顯示了表示溫度分布和機(jī)殼強(qiáng)度之間關(guān)系的預(yù)測公式,以及表示該預(yù)測公式的可靠性程度的多重相關(guān)系數(shù)。此外,在溫度分布圖像51中顯示了區(qū)域51b和51c,從該區(qū)域51b和51c中獲得該預(yù)測公式的說明性變量x1和x2的值。
如上所述,由于可以從多對(duì)多媒體數(shù)據(jù)項(xiàng)和屬性數(shù)據(jù)項(xiàng)中自動(dòng)地提取規(guī)則,所以操作者不需要預(yù)先確定特征量,因此可以降低勞動(dòng)成本。此外,本發(fā)明的優(yōu)點(diǎn)在于自動(dòng)提取的規(guī)則與個(gè)人觀點(diǎn)無關(guān),以及可以提取難以人為發(fā)現(xiàn)的規(guī)則。因此,根據(jù)本發(fā)明,可以客觀地和詳盡地發(fā)現(xiàn)規(guī)則,并且有效地獲得高質(zhì)量的規(guī)則。
<第二實(shí)施例>
在下文中說明本發(fā)明的第二實(shí)施例。根據(jù)第二實(shí)施例,僅當(dāng)相鄰評(píng)估位置處的像素值之間的差異較小時(shí),才對(duì)相鄰評(píng)估位置進(jìn)行集成。
根據(jù)第二實(shí)施例的規(guī)則發(fā)現(xiàn)裝置具有與根據(jù)圖1所示的第一實(shí)施例的規(guī)則發(fā)現(xiàn)裝置100相似的結(jié)構(gòu)。但是,在第二實(shí)施例中由集成單元130和候選規(guī)則產(chǎn)生單元140執(zhí)行的處理的某些部分與第一實(shí)施例的不同。因此,以下說明針對(duì)與第一實(shí)施例不同的部分處理,并且使用與圖5相同的標(biāo)號(hào)。
圖10是表示根據(jù)第二實(shí)施例的用于產(chǎn)生規(guī)則的處理順序的流程圖。下面逐步地說明圖10所示的處理。
圖10的步驟S31至S37中執(zhí)行的操作分別與圖8的步驟S11至S17中執(zhí)行的操作相同,圖10的步驟S40至S42中執(zhí)行的操作分別與圖8的步驟S19至S21中執(zhí)行的操作相同。因此,下面僅說明與第一實(shí)施例不同的步驟S38和S39中的操作。
<步驟S38>集成單元130選擇在步驟S37中進(jìn)行了集成的多個(gè)評(píng)估區(qū)域之一,然后獲得多個(gè)樣本數(shù)據(jù)項(xiàng)中的每一個(gè)中的溫度分布圖像中的所選擇評(píng)估區(qū)域中的像素值的標(biāo)準(zhǔn)偏差。此外,集成單元130獲得多個(gè)樣本數(shù)據(jù)項(xiàng)的所選擇的評(píng)估區(qū)域中的標(biāo)準(zhǔn)偏差的平均值。
隨后,集成單元130逐個(gè)地選擇在步驟S37中進(jìn)行了集成的評(píng)估區(qū)域中的剩余評(píng)估區(qū)域,并獲得多個(gè)樣本數(shù)據(jù)項(xiàng)的所選擇的評(píng)估區(qū)域中的標(biāo)準(zhǔn)偏差的平均值。
此外,集成單元130將標(biāo)準(zhǔn)偏差的各個(gè)平均值與預(yù)設(shè)的閾值相比較,并且當(dāng)平均值等于或大于該閾值時(shí),取消集成為與該平均值相對(duì)應(yīng)的評(píng)估區(qū)域的操作。
<步驟S39>候選規(guī)則產(chǎn)生單元140從通過集成(沒有被取消的)產(chǎn)生的評(píng)估區(qū)域中選擇預(yù)定數(shù)量的(例如,兩個(gè))評(píng)估區(qū)域(每一個(gè)評(píng)估區(qū)域都具有相對(duì)大的范圍(由較大數(shù)量的像素構(gòu)成)),并產(chǎn)生表示機(jī)殼強(qiáng)度和所選擇的評(píng)估區(qū)域的值之間關(guān)系的候選規(guī)則,其中該關(guān)系為所有樣本數(shù)據(jù)項(xiàng)所共有。用于產(chǎn)生候選規(guī)則的處理的細(xì)節(jié)與第一實(shí)施例中的步驟S18相同。
如上所述,可以僅對(duì)其中像素值不太分散的評(píng)估位置進(jìn)行集成。因此,根據(jù)溫度變化不大的區(qū)域中的一組像素來產(chǎn)生各個(gè)評(píng)估區(qū)域,并且對(duì)各個(gè)評(píng)估區(qū)域計(jì)算說明性變量的值。由此,可以通過說明性變量的值精確地表示與下述區(qū)域的溫度相關(guān)的特征,該區(qū)域與各個(gè)溫度分布圖像中的各個(gè)評(píng)估區(qū)域相對(duì)應(yīng)。
具體地,說明性變量的值是像素的平均值。因此,當(dāng)像素值的分散較大時(shí),說明性變量的值不能精確地表示與下述區(qū)域的溫度相關(guān)的特征,該區(qū)域與各個(gè)溫度分布圖像中的評(píng)估區(qū)域相對(duì)應(yīng)。例如,當(dāng)評(píng)估區(qū)域的前一半是高溫區(qū)域而評(píng)估區(qū)域的后一半是低溫區(qū)域時(shí),獲得平均溫度值作為表示評(píng)估區(qū)域的說明性變量的值。即,說明性變量的值并不表示與各個(gè)溫度分布圖像中的評(píng)估區(qū)域相對(duì)應(yīng)的區(qū)域的特征。根據(jù)第二實(shí)施例,由于在產(chǎn)生候選規(guī)則之前,取消了集成為像素值的分散較大的各個(gè)評(píng)估區(qū)域的操作,所以僅根據(jù)像素值的分散較小的評(píng)估區(qū)域來獲得說明性變量的值。因此,可以產(chǎn)生其中精確地反映了溫度分布圖像的特征的候選規(guī)則。
<第三實(shí)施例>
在下文中,說明本發(fā)明的第三實(shí)施例。根據(jù)第三實(shí)施例,搜索單元進(jìn)行從粗到精的搜索。即,首先進(jìn)行解的粗略搜索,然后基于該粗略搜索對(duì)被評(píng)估為滿足預(yù)定標(biāo)準(zhǔn)的像素組合進(jìn)行解的精細(xì)搜索。
具體地,首先,在粗略搜索中,假設(shè)構(gòu)成各個(gè)圖像的最小圖像元素為分別由多個(gè)像素而不是單個(gè)像素構(gòu)成的圖像元素。即,搜索單元選擇分別由多個(gè)像素構(gòu)成的上述圖像元素中的一個(gè)以上圖像元素的位置,而不是一個(gè)以上像素的位置,作為評(píng)估位置。例如,上述圖像元素中的每一個(gè)由5×5像素構(gòu)成。除了最小圖像元素以外,粗略搜索的操作與基于逐個(gè)像素的前述搜索操作相同。由此,通過粗略搜索來獲得至少一個(gè)解(即,具有等于或大于預(yù)定值的評(píng)估值的至少一個(gè)候選規(guī)則)。
接下來,基于在粗略搜索中評(píng)價(jià)較高的各個(gè)候選規(guī)則對(duì)所選擇的圖像元素進(jìn)行精細(xì)搜索。該所選擇的圖像元素是位于評(píng)估位置處的圖像元素,該評(píng)估位置構(gòu)成在候選規(guī)則中使用的圖像元素的至少一個(gè)組合,并且僅對(duì)所選擇的圖像元素進(jìn)行精細(xì)搜索。逐個(gè)像素地進(jìn)行精細(xì)搜索。由此,通過精細(xì)搜索獲得的解是最終解。
根據(jù)第三實(shí)施例的規(guī)則發(fā)現(xiàn)裝置具有與根據(jù)圖1所示的第一實(shí)施例的規(guī)則發(fā)現(xiàn)裝置100相似的結(jié)構(gòu)。但是,在第三實(shí)施例中,由搜索單元120、集成單元130、候選規(guī)則產(chǎn)生單元140執(zhí)行的處理的某些部分與第一實(shí)施例的不同。因此,以下說明針對(duì)與第一實(shí)施例不同的部分處理,并且使用與圖5相同的標(biāo)號(hào)。
圖11是表示根據(jù)第三實(shí)施例的用于產(chǎn)生規(guī)則的處理順序的流程圖。下面逐步地說明圖11所示的處理。
<步驟S51>輸入接收單元110加載多個(gè)樣本數(shù)據(jù)項(xiàng),每一個(gè)樣本數(shù)據(jù)項(xiàng)由一對(duì)溫度分布圖像和文本數(shù)據(jù)項(xiàng)構(gòu)成,其中溫度分布圖像表示澆注到機(jī)殼模具中的材料的溫度分布,而文本數(shù)據(jù)項(xiàng)表示機(jī)殼強(qiáng)度。
<步驟S52>搜索單元120定義多個(gè)圖像元素,該多個(gè)圖像元素中的每一個(gè)都由多個(gè)像素構(gòu)成。例如,上述多個(gè)圖像元素中的每一個(gè)都由5×5像素構(gòu)成。
<步驟S53>搜索單元120生成用于根據(jù)GA來進(jìn)行處理的第一代個(gè)體。具體地,搜索單元120從構(gòu)成各個(gè)溫度分布圖像的圖像元素中為每一個(gè)個(gè)體選擇至少一個(gè)圖像元素,并產(chǎn)生預(yù)定數(shù)量的(例如,32個(gè))個(gè)體,每一個(gè)個(gè)體都具有表示是否選擇了對(duì)應(yīng)圖像元素的遺傳因子。
<步驟S54>搜索單元120確定各代的交替數(shù)量是否到達(dá)了預(yù)定數(shù)量。當(dāng)確定為是時(shí),結(jié)束圖11的處理。當(dāng)確定為否時(shí),操作進(jìn)行到步驟S55。
<步驟S55>搜索單元120通過使用GA來生成下一代的預(yù)定數(shù)量的個(gè)體(作為圖像元素的組合)。
<步驟S56>搜索單元120確定是否完成了對(duì)步驟S53中產(chǎn)生的所有個(gè)體的評(píng)估。當(dāng)確定為是時(shí),操作進(jìn)行到步驟S54。當(dāng)確定為否時(shí),操作進(jìn)行到步驟S57。
<步驟S57>集成單元130選擇還沒有進(jìn)行評(píng)估的個(gè)體。
<步驟S58>集成單元130對(duì)所選擇的個(gè)體中的相鄰評(píng)估位置進(jìn)行集成。
<步驟S59>候選規(guī)則產(chǎn)生單元140從通過集成產(chǎn)生的多個(gè)評(píng)估區(qū)域中選擇預(yù)定數(shù)量的(例如,兩個(gè))評(píng)估區(qū)域(均由較大數(shù)量的像素元素構(gòu)成),并產(chǎn)生表示機(jī)殼強(qiáng)度和所選擇的評(píng)估區(qū)域的值之間關(guān)系的候選規(guī)則,其中該關(guān)系為所有樣本數(shù)據(jù)項(xiàng)所共有。
<步驟S60>候選規(guī)則評(píng)估單元150對(duì)由候選規(guī)則產(chǎn)生單元140產(chǎn)生的候選規(guī)則進(jìn)行評(píng)估。具體地,候選規(guī)則評(píng)估單元150計(jì)算出在步驟S59中產(chǎn)生的預(yù)測公式的多重相關(guān)系數(shù),作為評(píng)估值。
<步驟S61>搜索單元120確定由候選規(guī)則評(píng)估單元150計(jì)算出的評(píng)估值(多重相關(guān)系數(shù))是否等于或大于預(yù)定閾值。當(dāng)確定為是時(shí),操作進(jìn)行到步驟S62。當(dāng)確定為否時(shí),操作進(jìn)行到步驟S56,以對(duì)其它個(gè)體進(jìn)行評(píng)估。
<步驟S62>搜索單元120指定候選規(guī)則以及在如上進(jìn)行了評(píng)估的個(gè)體中選擇的要進(jìn)行逐個(gè)像素分析處理的圖像元素集合,并且開始進(jìn)行逐個(gè)像素的分析。當(dāng)完成逐個(gè)像素分析的處理時(shí),操作進(jìn)行到步驟S56,以對(duì)另一個(gè)體進(jìn)行評(píng)估。
圖12是表示逐個(gè)像素分析的處理順序的流程圖。下面逐步地說明圖12所示的處理。在圖12所示的處理中,逐個(gè)像素地產(chǎn)生各個(gè)個(gè)體,并且各個(gè)個(gè)體表示是否選擇了像素,即,所選擇的像素的組合。
<步驟S71>搜索單元120恢復(fù)在步驟S62中指定的集合中的圖像元素的逐個(gè)像素表示。在根據(jù)GA的以下處理中,僅從在步驟S62中指定的集合中的圖像元素中的像素中選擇多個(gè)像素。
<步驟S72>搜索單元120生成用于根據(jù)GA來進(jìn)行處理的第一代的個(gè)體。具體地,搜索單元120從各個(gè)溫度分布圖像的上述圖像元素中的像素中選擇至少一個(gè)像素,并產(chǎn)生預(yù)定數(shù)量的(例如,32個(gè))個(gè)體,這些個(gè)體中的每一個(gè)都具有表示是否選擇了各個(gè)像素的遺傳因子。
<步驟S73>搜索單元120確定該逐個(gè)像素分析中的各代的交替數(shù)量是否達(dá)到了預(yù)定數(shù)量。當(dāng)確定為是時(shí),操作進(jìn)行到圖11中的步驟S56。當(dāng)確定為否時(shí),操作進(jìn)行到步驟S74。
<步驟S74>搜索單元120通過使用GA來生成下一代的預(yù)定數(shù)量的個(gè)體。
<步驟S75>搜索單元120確定是否完成了對(duì)所有產(chǎn)生的個(gè)體進(jìn)行的評(píng)估。當(dāng)確定為是時(shí),操作進(jìn)行到步驟S73。當(dāng)確定為否時(shí),操作進(jìn)行到步驟S76。
<步驟S76>集成單元130選擇還沒有進(jìn)行評(píng)估的個(gè)體。
<步驟S77>集成單元130對(duì)所選擇的個(gè)體中的相鄰評(píng)估位置進(jìn)行集成。
<步驟S78>候選規(guī)則產(chǎn)生單元140從通過步驟S77中的集成產(chǎn)生的多個(gè)評(píng)估區(qū)域中選擇預(yù)定數(shù)量的(例如,兩個(gè))評(píng)估區(qū)域(分別由較大數(shù)量的像素構(gòu)成),并產(chǎn)生表示機(jī)殼強(qiáng)度和所選擇的評(píng)估區(qū)域的值之間關(guān)系的候選規(guī)則,其中該關(guān)系為所有樣本數(shù)據(jù)項(xiàng)所共有。
<步驟S79>候選規(guī)則評(píng)估單元150對(duì)由候選規(guī)則產(chǎn)生單元140產(chǎn)生的候選規(guī)則進(jìn)行評(píng)估。具體地,候選規(guī)則評(píng)估單元150計(jì)算出在步驟S78中產(chǎn)生的預(yù)測公式的多重相關(guān)系數(shù),作為評(píng)估值。
<步驟S80>輸出單元160確定由候選規(guī)則評(píng)估單元150計(jì)算出的評(píng)估值(多重相關(guān)系數(shù))是否等于或大于預(yù)定閾值。當(dāng)確定為是時(shí),操作進(jìn)行到步驟S81。當(dāng)確定為否時(shí),操作進(jìn)行到步驟S75,以對(duì)另一個(gè)體進(jìn)行評(píng)估。在步驟S80中使用的閾值大于在圖11中的步驟S61中使用的閾值。
<步驟S81>輸出單元160輸出候選規(guī)則以及表示所評(píng)估的個(gè)體中的各個(gè)所選擇評(píng)估區(qū)域的范圍的信息,作為輸出特征提取規(guī)則。將所輸出的特征提取規(guī)則存儲(chǔ)在存儲(chǔ)裝置(例如HDD)中。此后,操作進(jìn)行到步驟S75,以對(duì)另一個(gè)體進(jìn)行評(píng)估。
如上所述,由于根據(jù)第三實(shí)施例,通過組合粗略搜索和精細(xì)搜索可以獲得特征提取規(guī)則,所以可以提高處理效率。例如,在初始溫度分布圖像是高分辨率圖像的情況下,所選擇像素的可能組合的數(shù)量變得非常大,因此,用于從所選擇像素的所有可能組合中獲得局部最優(yōu)解的處理量也變得很大。根據(jù)從粗到精的搜索,由于首先進(jìn)行解的粗略搜索,然后基于粗略搜索對(duì)被評(píng)估為滿足預(yù)定標(biāo)準(zhǔn)的像素組合進(jìn)行解的精細(xì)搜索,所以可以高效地搜索解。
在上述實(shí)施例中,盡管在多媒體數(shù)據(jù)項(xiàng)為圖像的情況下獲得規(guī)則,但是在處理其它類型的多媒體數(shù)據(jù)的情況下也可以執(zhí)行類似的處理。例如,在聲音數(shù)據(jù)的情況下,可以將具有預(yù)定長度的各個(gè)單元再現(xiàn)時(shí)間跨度中的數(shù)據(jù)(例如,表示聲音的平均強(qiáng)度的數(shù)據(jù))定義為可以由搜索單元120選擇的最小數(shù)據(jù)元。在這種情況下,集成單元130在連續(xù)的單元再現(xiàn)時(shí)間跨度中對(duì)所選擇的數(shù)據(jù)進(jìn)行集成。
在上述實(shí)施例中,盡管在多媒體數(shù)據(jù)項(xiàng)為二維圖像的情況下獲得規(guī)則,但是也可以獲得表示三維模型的數(shù)據(jù)(例如體數(shù)據(jù))和文本數(shù)據(jù)之間關(guān)系的規(guī)則。在這種情況下,例如,可以將三維空間分為多個(gè)立方體,每一個(gè)立方體具有預(yù)定的大小,并且將根據(jù)立方模型表示各個(gè)立方體中的各個(gè)三維圖像的一部分的數(shù)據(jù)定義為可以由搜索單元120選擇的最小數(shù)據(jù)元。此外,集成單元130對(duì)與互相面對(duì)鄰接的相鄰立方體相對(duì)應(yīng)的所選擇的數(shù)據(jù)進(jìn)行集成。
可以通過計(jì)算機(jī)來實(shí)現(xiàn)上述處理功能。在這種情況下,提供用于規(guī)則發(fā)現(xiàn)裝置100的程序。該程序描述了規(guī)則發(fā)現(xiàn)裝置100應(yīng)該具有的處理功能的細(xì)節(jié)。當(dāng)計(jì)算機(jī)執(zhí)行上述程序時(shí),在計(jì)算機(jī)上實(shí)現(xiàn)了規(guī)則發(fā)現(xiàn)裝置100的處理功能。
描述處理細(xì)節(jié)的上述程序可以存儲(chǔ)在計(jì)算機(jī)可讀記錄介質(zhì)中。該計(jì)算機(jī)可讀記錄介質(zhì)可以是磁記錄裝置、光盤、光磁記錄介質(zhì)、半導(dǎo)體存儲(chǔ)器等。磁記錄裝置可以是硬盤驅(qū)動(dòng)器(HDD)、軟盤(FD)、磁帶等。該光盤可以是DVD(數(shù)字通用盤)、DVD-RAM(隨機(jī)存取存儲(chǔ)器)、CD-ROM(光盤只讀存儲(chǔ)器)、CD-R(可記錄)/RW(可重寫)等。光磁記錄介質(zhì)可以是MO(磁光盤)等。
為了將該程序投入市場,例如,可以銷售其中記錄有該程序的便攜式記錄介質(zhì),例如DVD或CD-ROM。另選地,上述程序可以存儲(chǔ)在屬于服務(wù)器計(jì)算機(jī)的存儲(chǔ)裝置中,并且通過網(wǎng)絡(luò)從服務(wù)器計(jì)算機(jī)傳送到上述計(jì)算機(jī)。
執(zhí)行上述程序的計(jì)算機(jī)將該程序存儲(chǔ)在屬于該計(jì)算機(jī)的存儲(chǔ)裝置中,其中,該程序最初是記錄在例如便攜式記錄介質(zhì)中或者是從服務(wù)器計(jì)算機(jī)傳送來的。然后,該計(jì)算機(jī)從存儲(chǔ)裝置讀取該程序,并根據(jù)該程序進(jìn)行處理。另選地,該計(jì)算機(jī)可以直接從便攜式記錄介質(zhì)中讀取該程序,以根據(jù)該程序進(jìn)行處理。此外,當(dāng)從服務(wù)器計(jì)算機(jī)傳送該程序的一部分時(shí),計(jì)算機(jī)可以根據(jù)該程序的各個(gè)部分依次進(jìn)行處理。
如上所述,根據(jù)本發(fā)明,通過重復(fù)產(chǎn)生評(píng)估位置的選擇模式并減小特征數(shù)據(jù)位置的數(shù)量來獲得候選規(guī)則,并將滿足預(yù)定標(biāo)準(zhǔn)的候選規(guī)則作為規(guī)則輸出,其中通過對(duì)選擇模式中的評(píng)估位置進(jìn)行集成,以生成評(píng)估區(qū)域,來實(shí)現(xiàn)特征數(shù)據(jù)位置的數(shù)量的減小。因此,即使在處理由大量數(shù)據(jù)元的陣列構(gòu)成的多媒體數(shù)據(jù)的情況下,也可以自動(dòng)地選擇被指定為特征部分的區(qū)域,并發(fā)現(xiàn)精確的規(guī)則。
上述內(nèi)容僅僅是對(duì)本發(fā)明原理的說明。此外,由于對(duì)于本領(lǐng)域的技術(shù)人員來說很容易進(jìn)行多種修改和變化,所以不希望本發(fā)明限于所示和所述的確切結(jié)構(gòu)和應(yīng)用,相應(yīng)地,可以將所有適當(dāng)?shù)男薷募捌涞刃镆暈槁淙敫郊訖?quán)利要求及其等效物限定的本發(fā)明的范圍內(nèi)。
權(quán)利要求
1.一種規(guī)則發(fā)現(xiàn)程序,用于發(fā)現(xiàn)表示多個(gè)多媒體數(shù)據(jù)項(xiàng)和分別與這些多媒體數(shù)據(jù)項(xiàng)相關(guān)的多個(gè)文本數(shù)據(jù)項(xiàng)之間關(guān)系的規(guī)則,所述程序使計(jì)算機(jī)包括輸入接收單元,用于接收分別由所述多個(gè)多媒體數(shù)據(jù)項(xiàng)和所述多個(gè)文本數(shù)據(jù)項(xiàng)形成的對(duì)所構(gòu)成的多個(gè)樣本數(shù)據(jù)項(xiàng);搜索單元,用于執(zhí)行選擇數(shù)據(jù)陣列的多個(gè)評(píng)估位置的操作,并產(chǎn)生表示該多個(gè)評(píng)估位置的選擇模式,其中所述數(shù)據(jù)陣列構(gòu)成所述多個(gè)樣本數(shù)據(jù)項(xiàng)中的所述多個(gè)多媒體數(shù)據(jù)項(xiàng)中的每一個(gè),并且所述多個(gè)評(píng)估位置是要進(jìn)行評(píng)估的多個(gè)位置;集成單元,用于執(zhí)行對(duì)所述數(shù)據(jù)陣列的由所述搜索單元選擇的所述多個(gè)評(píng)估位置進(jìn)行集成的操作,以產(chǎn)生一個(gè)或更多個(gè)要進(jìn)行評(píng)估的評(píng)估區(qū)域;候選規(guī)則產(chǎn)生單元,用于執(zhí)行下述操作,該操作通過由一個(gè)或更多個(gè)數(shù)值來表示一個(gè)或更多個(gè)評(píng)估區(qū)域中的數(shù)據(jù),在所述各個(gè)多媒體數(shù)據(jù)項(xiàng)中產(chǎn)生所述一個(gè)或更多個(gè)評(píng)估區(qū)域的特征數(shù)據(jù),并產(chǎn)生表示所述各個(gè)多媒體數(shù)據(jù)項(xiàng)中的所述一個(gè)或更多個(gè)評(píng)估區(qū)域的特征數(shù)據(jù)和與所述各個(gè)多媒體數(shù)據(jù)項(xiàng)相關(guān)的所述多個(gè)文本數(shù)據(jù)項(xiàng)中的一個(gè)之間關(guān)系的候選規(guī)則,其中由所述候選規(guī)則表示的所述關(guān)系為所有多媒體數(shù)據(jù)項(xiàng)所共有;候選規(guī)則評(píng)估單元,用于執(zhí)行下述操作,該操作對(duì)由所述候選規(guī)則產(chǎn)生單元所產(chǎn)生的所述候選規(guī)則表示的所述關(guān)系的精確度進(jìn)行評(píng)估,以獲得評(píng)估結(jié)果;以及輸出單元,當(dāng)所述評(píng)估結(jié)果滿足預(yù)定標(biāo)準(zhǔn)時(shí),該輸出單元執(zhí)行下述操作,該操作將由所述候選規(guī)則產(chǎn)生單元產(chǎn)生的所述候選規(guī)則作為規(guī)則輸出;其中根據(jù)所述數(shù)據(jù)陣列的多個(gè)評(píng)估位置的不同組合重復(fù)進(jìn)行所述搜索單元、所述集成單元、所述候選規(guī)則產(chǎn)生單元、所述候選規(guī)則評(píng)估單元以及所述輸出單元的操作,直到滿足完成所述搜索操作的預(yù)定條件為止。
2.根據(jù)權(quán)利要求1所述的規(guī)則發(fā)現(xiàn)程序,其中所述候選規(guī)則產(chǎn)生單元通過多重回歸分析來對(duì)所述候選規(guī)則進(jìn)行評(píng)估。
3.根據(jù)權(quán)利要求1所述的規(guī)則發(fā)現(xiàn)程序,其中所述搜索單元基于與所述選擇模式相對(duì)應(yīng)地產(chǎn)生的候選規(guī)則的評(píng)估結(jié)果,通過從先前產(chǎn)生的選擇模式中優(yōu)選地提取與至少一個(gè)評(píng)價(jià)較高的候選規(guī)則相對(duì)應(yīng)的至少一個(gè)第二選擇模式,來產(chǎn)生至少一個(gè)第一選擇模式,并且改變所述至少一個(gè)第二選擇模式的每一個(gè)中的評(píng)估位置的組合。
4.根據(jù)權(quán)利要求3所述的規(guī)則發(fā)現(xiàn)程序,其中所述搜索單元根據(jù)遺傳算法產(chǎn)生所述至少一個(gè)第一選擇模式。
5.根據(jù)權(quán)利要求1所述的規(guī)則發(fā)現(xiàn)程序,其中所述搜索單元將所述數(shù)據(jù)陣列上的多個(gè)數(shù)據(jù)位置分為均包含多個(gè)數(shù)據(jù)位置的多個(gè)單元區(qū)域,并選擇這些單元區(qū)域中的多個(gè)作為評(píng)估位置。
6.根據(jù)權(quán)利要求5所述的規(guī)則發(fā)現(xiàn)程序,其中在選擇了所述多個(gè)單元區(qū)域中的所述多個(gè)之后,所述搜索單元選擇所述多個(gè)單元區(qū)域中由所述搜索單元選擇并與被評(píng)估為滿足預(yù)定標(biāo)準(zhǔn)的候選規(guī)則相對(duì)應(yīng)的多個(gè)單元區(qū)域中的數(shù)據(jù)位置作為評(píng)估位置,以產(chǎn)生所述選擇模式。
7.根據(jù)權(quán)利要求1所述的規(guī)則發(fā)現(xiàn)程序,其中所述集成單元對(duì)所述數(shù)據(jù)陣列中由所述搜索單元選擇的所述多個(gè)評(píng)估位置中的相鄰評(píng)估位置進(jìn)行集成。
8.根據(jù)權(quán)利要求1所述的規(guī)則發(fā)現(xiàn)程序,其中所述集成單元計(jì)算所述一個(gè)或更多個(gè)評(píng)估區(qū)域中的每一個(gè)中所選擇的評(píng)估位置中的數(shù)據(jù)元值的分散程度,并且當(dāng)所述分散程度大于預(yù)定值時(shí),取消對(duì)所述評(píng)估位置進(jìn)行的集成。
9.根據(jù)權(quán)利要求1所述的規(guī)則發(fā)現(xiàn)程序,其中所述候選規(guī)則產(chǎn)生單元從通過所述集成單元產(chǎn)生的所述一個(gè)或更多個(gè)評(píng)估區(qū)域中選擇預(yù)定數(shù)量的評(píng)估區(qū)域,并基于該預(yù)定數(shù)量的評(píng)估區(qū)域中的特征數(shù)據(jù)與所述多個(gè)文本數(shù)據(jù)項(xiàng)之間的關(guān)系,來產(chǎn)生所述候選規(guī)則。
10.根據(jù)權(quán)利要求9所述的規(guī)則發(fā)現(xiàn)程序,其中所述預(yù)定數(shù)量的評(píng)估區(qū)域是由所述集成單元產(chǎn)生的所述一個(gè)或更多個(gè)評(píng)估區(qū)域中,所選擇的評(píng)估位置的范圍都相對(duì)較大的多個(gè)評(píng)估區(qū)域。
11.一種規(guī)則發(fā)現(xiàn)處理,用于通過使用計(jì)算機(jī),發(fā)現(xiàn)表示多個(gè)多媒體數(shù)據(jù)項(xiàng)和分別與這些多媒體數(shù)據(jù)項(xiàng)相關(guān)的多個(gè)文本數(shù)據(jù)項(xiàng)之間關(guān)系的規(guī)則,所述規(guī)則發(fā)現(xiàn)處理包括以下步驟(a)通過輸入接收單元接收多個(gè)樣本數(shù)據(jù)項(xiàng),該多個(gè)樣本數(shù)據(jù)項(xiàng)分別由所述多個(gè)多媒體數(shù)據(jù)項(xiàng)和所述多個(gè)文本數(shù)據(jù)項(xiàng)形成的對(duì)構(gòu)成;(b)通過搜索單元選擇數(shù)據(jù)陣列的多個(gè)評(píng)估位置,并產(chǎn)生表示這些評(píng)估位置的選擇模式,其中所述數(shù)據(jù)陣列構(gòu)成所述多個(gè)樣本數(shù)據(jù)項(xiàng)的所述多媒體數(shù)據(jù)項(xiàng)中的每一個(gè),而所述多個(gè)評(píng)估位置是要進(jìn)行評(píng)估的多個(gè)位置;(c)通過集成單元對(duì)所述數(shù)據(jù)陣列的在所述步驟(b)中選擇的所述多個(gè)評(píng)估位置進(jìn)行集成,以產(chǎn)生一個(gè)或更多個(gè)要進(jìn)行評(píng)估的評(píng)估區(qū)域;(d)通過用一個(gè)或更多個(gè)數(shù)值來表示所述一個(gè)或更多個(gè)評(píng)估區(qū)域中的數(shù)據(jù),由候選規(guī)則產(chǎn)生單元在所述各個(gè)多媒體數(shù)據(jù)項(xiàng)中產(chǎn)生所述一個(gè)或更多個(gè)評(píng)估區(qū)域的特征數(shù)據(jù),并產(chǎn)生表示所述各個(gè)多媒體數(shù)據(jù)項(xiàng)中的一個(gè)或更多個(gè)評(píng)估區(qū)域的特征數(shù)據(jù)和與所述各個(gè)多媒體數(shù)據(jù)項(xiàng)相關(guān)的多個(gè)文本數(shù)據(jù)項(xiàng)中的一個(gè)之間關(guān)系的候選規(guī)則,其中由所述候選規(guī)則表示的所述關(guān)系為所有多媒體數(shù)據(jù)項(xiàng)所共有;(e)通過候選規(guī)則評(píng)估單元對(duì)在所述步驟(d)中產(chǎn)生的所述候選規(guī)則所表示的所述關(guān)系的精確度進(jìn)行評(píng)估,以獲得評(píng)估結(jié)果;以及(f)當(dāng)所述評(píng)估結(jié)果滿足預(yù)定標(biāo)準(zhǔn)時(shí),通過輸出單元將所述步驟(d)中產(chǎn)生的所述候選規(guī)則作為規(guī)則輸出;其中根據(jù)所述數(shù)據(jù)陣列的多個(gè)評(píng)估位置的不同組合來重復(fù)所述步驟(b)到(f)中的操作,直到滿足完成搜索操作的預(yù)定條件為止。
12.一種規(guī)則發(fā)現(xiàn)裝置,用于發(fā)現(xiàn)表示多個(gè)多媒體數(shù)據(jù)項(xiàng)和分別與這些多媒體數(shù)據(jù)項(xiàng)相關(guān)的多個(gè)文本數(shù)據(jù)項(xiàng)之間關(guān)系的規(guī)則,其包括輸入接收單元,用于接收分別由所述多個(gè)多媒體數(shù)據(jù)項(xiàng)和所述多個(gè)文本數(shù)據(jù)項(xiàng)形成的對(duì)所構(gòu)成的多個(gè)樣本數(shù)據(jù)項(xiàng);搜索單元,用于執(zhí)行選擇數(shù)據(jù)陣列的多個(gè)評(píng)估位置的操作,并產(chǎn)生表示該多個(gè)評(píng)估位置的選擇模式,其中所述數(shù)據(jù)陣列構(gòu)成所述多個(gè)樣本數(shù)據(jù)項(xiàng)中的所述多個(gè)多媒體數(shù)據(jù)項(xiàng)中的每一個(gè),并且所述多個(gè)評(píng)估位置是要進(jìn)行評(píng)估的多個(gè)位置;集成單元,用于執(zhí)行對(duì)所述數(shù)據(jù)陣列的由所述搜索單元選擇的所述多個(gè)評(píng)估位置進(jìn)行集成的操作,以產(chǎn)生一個(gè)或更多個(gè)要進(jìn)行評(píng)估的評(píng)估區(qū)域;候選規(guī)則產(chǎn)生單元,用于執(zhí)行下述操作,該操作通過由一個(gè)或更多個(gè)數(shù)值來表示一個(gè)或更多個(gè)評(píng)估區(qū)域中的數(shù)據(jù),在所述各個(gè)多媒體數(shù)據(jù)項(xiàng)中產(chǎn)生所述一個(gè)或更多個(gè)評(píng)估區(qū)域的特征數(shù)據(jù),并產(chǎn)生表示所述各個(gè)多媒體數(shù)據(jù)項(xiàng)中的所述一個(gè)或更多個(gè)評(píng)估區(qū)域的特征數(shù)據(jù)和與所述各個(gè)多媒體數(shù)據(jù)項(xiàng)相關(guān)的所述多個(gè)文本數(shù)據(jù)項(xiàng)中的一個(gè)之間關(guān)系的候選規(guī)則,其中由所述候選規(guī)則表示的所述關(guān)系為所有多媒體數(shù)據(jù)項(xiàng)所共有;候選規(guī)則評(píng)估單元,用于執(zhí)行下述操作,該操作對(duì)由所述候選規(guī)則產(chǎn)生單元所產(chǎn)生的所述候選規(guī)則表示的所述關(guān)系的精確度進(jìn)行評(píng)估,以獲得評(píng)估結(jié)果;以及輸出單元,當(dāng)所述評(píng)估結(jié)果滿足預(yù)定標(biāo)準(zhǔn)時(shí),該輸出單元執(zhí)行下述操作,該操作將由所述候選規(guī)則產(chǎn)生單元產(chǎn)生的所述候選規(guī)則作為規(guī)則輸出;其中根據(jù)所述數(shù)據(jù)陣列的多個(gè)評(píng)估位置的不同組合來重復(fù)所述搜索單元、所述集成單元、所述候選規(guī)則產(chǎn)生單元、所述候選規(guī)則評(píng)估單元以及所述輸出單元的操作,直到滿足完成所述搜索操作的預(yù)定條件為止。
13.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),用于存儲(chǔ)規(guī)則發(fā)現(xiàn)程序,該規(guī)則發(fā)現(xiàn)程序使計(jì)算機(jī)實(shí)現(xiàn)下述裝置,該裝置用于發(fā)現(xiàn)表示多個(gè)多媒體數(shù)據(jù)項(xiàng)和分別與這些多媒體數(shù)據(jù)項(xiàng)相關(guān)的多個(gè)文本數(shù)據(jù)項(xiàng)之間關(guān)系的規(guī)則,所述裝置包括輸入接收單元,用于接收分別由所述多個(gè)多媒體數(shù)據(jù)項(xiàng)和所述多個(gè)文本數(shù)據(jù)項(xiàng)形成的對(duì)所構(gòu)成的多個(gè)樣本數(shù)據(jù)項(xiàng);搜索單元,用于執(zhí)行選擇數(shù)據(jù)陣列的多個(gè)評(píng)估位置的操作,并產(chǎn)生表示該多個(gè)評(píng)估位置的選擇模式,其中所述數(shù)據(jù)陣列構(gòu)成所述多個(gè)樣本數(shù)據(jù)項(xiàng)中的所述多個(gè)多媒體數(shù)據(jù)項(xiàng)中的每一個(gè),并且所述多個(gè)評(píng)估位置是要進(jìn)行評(píng)估的多個(gè)位置;集成單元,用于執(zhí)行對(duì)所述數(shù)據(jù)陣列的由所述搜索單元選擇的所述多個(gè)評(píng)估位置進(jìn)行集成的操作,以產(chǎn)生一個(gè)或更多個(gè)要進(jìn)行評(píng)估的評(píng)估區(qū)域;候選規(guī)則產(chǎn)生單元,用于執(zhí)行下述操作,該操作通過由一個(gè)或更多個(gè)數(shù)值來表示一個(gè)或更多個(gè)評(píng)估區(qū)域中的數(shù)據(jù),在所述各個(gè)多媒體數(shù)據(jù)項(xiàng)中產(chǎn)生所述一個(gè)或更多個(gè)評(píng)估區(qū)域的特征數(shù)據(jù),并產(chǎn)生表示所述各個(gè)多媒體數(shù)據(jù)項(xiàng)中的所述一個(gè)或更多個(gè)評(píng)估區(qū)域的特征數(shù)據(jù)和與所述各個(gè)多媒體數(shù)據(jù)項(xiàng)相關(guān)的所述多個(gè)文本數(shù)據(jù)項(xiàng)中的一個(gè)之間關(guān)系的候選規(guī)則,其中由所述候選規(guī)則表示的所述關(guān)系為所有多媒體數(shù)據(jù)項(xiàng)所共有;候選規(guī)則評(píng)估單元,用于執(zhí)行下述操作,該操作對(duì)由所述候選規(guī)則產(chǎn)生單元所產(chǎn)生的所述候選規(guī)則表示的所述關(guān)系的精確度進(jìn)行評(píng)估,以獲得評(píng)估結(jié)果;以及輸出單元,當(dāng)所述評(píng)估結(jié)果滿足預(yù)定標(biāo)準(zhǔn)時(shí),該輸出單元執(zhí)行下述操作,該操作將由所述候選規(guī)則產(chǎn)生單元產(chǎn)生的所述候選規(guī)則作為規(guī)則輸出;其中根據(jù)所述數(shù)據(jù)陣列的多個(gè)評(píng)估位置的不同組合來重復(fù)所述搜索單元、所述集成單元、所述候選規(guī)則產(chǎn)生單元、所述候選規(guī)則評(píng)估單元以及所述輸出單元的操作,直到滿足完成所述搜索操作的預(yù)定條件為止。
全文摘要
規(guī)則發(fā)現(xiàn)程序、規(guī)則發(fā)現(xiàn)處理和規(guī)則發(fā)現(xiàn)裝置。一種規(guī)則發(fā)現(xiàn)程序,其使得能夠通過自動(dòng)地搜索對(duì)于產(chǎn)生多媒體數(shù)據(jù)中的規(guī)則有效的特征部分來發(fā)現(xiàn)規(guī)則。輸入樣本數(shù)據(jù)項(xiàng)后,搜索單元選擇構(gòu)成各個(gè)樣本數(shù)據(jù)項(xiàng)的數(shù)據(jù)陣列上的多個(gè)評(píng)估位置,以產(chǎn)生選擇模式。接下來,集成單元對(duì)該選擇模式中的該多個(gè)評(píng)估位置進(jìn)行集成,以產(chǎn)生預(yù)定數(shù)量的評(píng)估區(qū)域,并且候選規(guī)則產(chǎn)生單元產(chǎn)生表示為樣本數(shù)據(jù)項(xiàng)所共有的關(guān)系的候選規(guī)則。候選規(guī)則評(píng)估單元對(duì)所產(chǎn)生的候選規(guī)則進(jìn)行評(píng)估,并且當(dāng)該候選規(guī)則滿足預(yù)定標(biāo)準(zhǔn)時(shí),輸出單元將候選規(guī)則作為規(guī)則輸出。
文檔編號(hào)G06F19/00GK1766874SQ200510055920
公開日2006年5月3日 申請(qǐng)日期2005年3月18日 優(yōu)先權(quán)日2004年10月29日
發(fā)明者馬場孝之, 遠(yuǎn)藤進(jìn), 椎谷秀一, 上原祐介, 增本大器 申請(qǐng)人:富士通株式會(huì)社