專利名稱:特有內(nèi)容數(shù)據(jù)判定程序、特有內(nèi)容數(shù)據(jù)判定裝置、特有內(nèi)容數(shù)據(jù)判定方法、記錄介質(zhì)、內(nèi)容 ...的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及提取構(gòu)成網(wǎng)頁(Web Page)的內(nèi)容數(shù)據(jù)的技術(shù)領(lǐng)域。
背景技術(shù):
以往公知有如下技術(shù)取得作為構(gòu)成網(wǎng)站(Web Site)上公開的網(wǎng)頁的素材的內(nèi)容數(shù)據(jù),并根據(jù)所取得的內(nèi)容數(shù)據(jù)生成新的內(nèi)容數(shù)據(jù)。例如,在非專利文獻(xiàn)1中公開了如下技術(shù)在由用戶指定了圖像數(shù)據(jù)的URL時(shí),從網(wǎng)站上取得與該URL對應(yīng)的圖像數(shù)據(jù),根據(jù)所取得的圖像數(shù)據(jù)自動生成橫幅廣告(banner)。現(xiàn)有技術(shù)文獻(xiàn)非專利文獻(xiàn)非專利文獻(xiàn)1 少一自動作成”、[online]、[平成21年10月21日檢索]、互聯(lián)網(wǎng) <URL :http//hyperbannermaker. com/>
發(fā)明概要發(fā)明所要解決的課題在構(gòu)成網(wǎng)站的各網(wǎng)頁中,登載有依照該網(wǎng)站的目的的內(nèi)容。因此,構(gòu)成網(wǎng)站的各網(wǎng)頁的內(nèi)容基本上相互具有關(guān)聯(lián)性,但是有時(shí)各自具有一些特征。并且,決定該網(wǎng)頁的內(nèi)容的要因是構(gòu)成網(wǎng)頁的內(nèi)容數(shù)據(jù)(例如文本數(shù)據(jù)、圖像數(shù)據(jù)等)的內(nèi)容。因此,在構(gòu)成網(wǎng)頁的內(nèi)容數(shù)據(jù)中,有時(shí)存在對該網(wǎng)頁賦予特征的內(nèi)容數(shù)據(jù)、即該網(wǎng)頁特有的內(nèi)容數(shù)據(jù)。非專利文獻(xiàn)1所記載的技術(shù)是提取網(wǎng)頁特有的內(nèi)容數(shù)據(jù)的技術(shù),但不是自動進(jìn)行提取的技術(shù),必須由用戶通過手動作業(yè)來指定內(nèi)容數(shù)據(jù),從而不能容易地提取該網(wǎng)頁特有的內(nèi)容數(shù)據(jù)。因此,在用戶不能判斷怎樣的內(nèi)容數(shù)據(jù)是網(wǎng)頁特有的內(nèi)容數(shù)據(jù)、或根據(jù)用戶的嗜好不同所偏愛的內(nèi)容數(shù)據(jù)存在差異的情況等時(shí),不能準(zhǔn)確地提取網(wǎng)頁特有的內(nèi)容數(shù)據(jù)。 此外,當(dāng)作為對象的網(wǎng)頁的頁數(shù)多時(shí),存在用戶的作業(yè)非常大的問題。此外,例如,可根據(jù)HTML (HyperText Markup Language 超文本鏈接標(biāo)記語言)文檔的標(biāo)簽的描述,如僅為圖像或僅為文本那樣,提取所有特定種類的內(nèi)容數(shù)據(jù)。但是,在所提取的內(nèi)容數(shù)據(jù)中,還包含了非網(wǎng)頁特有的常見內(nèi)容數(shù)據(jù),因此,作為提取結(jié)果的可靠性較低,所以用戶必須從提取結(jié)果中搜索特有的內(nèi)容數(shù)據(jù)。本發(fā)明正是鑒于上述方面而完成的,其目的在于,提供能夠容易地從構(gòu)成網(wǎng)頁的內(nèi)容數(shù)據(jù)中提取該網(wǎng)頁特有的內(nèi)容數(shù)據(jù)的特有內(nèi)容數(shù)據(jù)判定裝置、特有內(nèi)容數(shù)據(jù)判定方法、特有內(nèi)容數(shù)據(jù)判定程序等。用于解決課題的手段為了解決上述課題,權(quán)利要求1所述的發(fā)明的特征在于,特有內(nèi)容數(shù)據(jù)判定程序使計(jì)算機(jī)作為以下單元發(fā)揮功能提取單元,其提取構(gòu)成所指定的網(wǎng)頁的內(nèi)容數(shù)據(jù);計(jì)算單元,其計(jì)算構(gòu)成所述指定的網(wǎng)頁的各內(nèi)容數(shù)據(jù)的出現(xiàn)頻度;以及判定單元,其根據(jù)所述計(jì)算的出現(xiàn)頻度,判定構(gòu)成所述指定的網(wǎng)頁的內(nèi)容數(shù)據(jù)中該網(wǎng)頁特有的內(nèi)容數(shù)據(jù)。根據(jù)本發(fā)明,計(jì)算構(gòu)成所指定的網(wǎng)頁的各內(nèi)容數(shù)據(jù)的出現(xiàn)頻度。內(nèi)容數(shù)據(jù)的該出現(xiàn)頻度越小,內(nèi)容數(shù)據(jù)在所指定的網(wǎng)頁以外越不怎么出現(xiàn)。因此,能夠根據(jù)出現(xiàn)頻度來確定所指定的網(wǎng)頁特有的內(nèi)容數(shù)據(jù)。因此,能夠容易地提取出網(wǎng)頁特有的內(nèi)容數(shù)據(jù)。權(quán)利要求2所述的發(fā)明是在權(quán)利要求1所述的特有內(nèi)容數(shù)據(jù)判定程序中,其特征在于,該特有內(nèi)容數(shù)據(jù)判定程序使所述計(jì)算機(jī)發(fā)揮如下功能所述判定單元將構(gòu)成所述指定的網(wǎng)頁的內(nèi)容數(shù)據(jù)中出現(xiàn)頻度最小的內(nèi)容數(shù)據(jù)判定為該網(wǎng)頁特有的內(nèi)容數(shù)據(jù)。根據(jù)本發(fā)明,通過判斷出現(xiàn)頻度最小的內(nèi)容數(shù)據(jù),來確定所指定的網(wǎng)頁特有的內(nèi)容數(shù)據(jù)。權(quán)利要求3所述的發(fā)明是在權(quán)利要求1所述的特有內(nèi)容數(shù)據(jù)判定程序中,其特征在于,該特有內(nèi)容數(shù)據(jù)判定程序使所述計(jì)算機(jī)發(fā)揮如下功能所述判定單元將構(gòu)成所述指定的網(wǎng)頁的內(nèi)容數(shù)據(jù)中出現(xiàn)頻度為預(yù)定值以下的內(nèi)容數(shù)據(jù)判定為該網(wǎng)頁特有的內(nèi)容數(shù)據(jù)。根據(jù)本發(fā)明,通過判定出現(xiàn)頻度是否為預(yù)定值以下,能夠確定滿足該條件的所有內(nèi)容數(shù)據(jù)是所指定的網(wǎng)頁特有的內(nèi)容數(shù)據(jù)。權(quán)利要求4所述的發(fā)明是在權(quán)利要求1 3中的任意一項(xiàng)所述的特有內(nèi)容數(shù)據(jù)判定程序中,其特征在于,該特有內(nèi)容數(shù)據(jù)判定程序使所述計(jì)算機(jī)發(fā)揮如下功能所述計(jì)算單元計(jì)算各內(nèi)容數(shù)據(jù)在預(yù)定站點(diǎn)所包含的多個(gè)網(wǎng)頁上的出現(xiàn)頻度。根據(jù)本發(fā)明,計(jì)算構(gòu)成所指定的網(wǎng)頁的各內(nèi)容數(shù)據(jù)在預(yù)定站點(diǎn)所包含的某多個(gè)網(wǎng)頁上的出現(xiàn)頻度,因此能夠判定出站點(diǎn)內(nèi)共同使用的內(nèi)容數(shù)據(jù)不是網(wǎng)頁特有的內(nèi)容數(shù)據(jù), 從而能夠提高判斷網(wǎng)頁特有的內(nèi)容數(shù)據(jù)的精度。權(quán)利要求5所述的發(fā)明是在權(quán)利要求1 4中的任意一項(xiàng)所述的特有內(nèi)容數(shù)據(jù)判定程序中,其特征在于,該特有內(nèi)容數(shù)據(jù)判定程序使所述計(jì)算機(jī)發(fā)揮如下功能所述提取單元針對所述預(yù)定的站點(diǎn)中包含的預(yù)定種類的各網(wǎng)頁提取構(gòu)成網(wǎng)頁的內(nèi)容數(shù)據(jù),將表示提取出的內(nèi)容數(shù)據(jù)的內(nèi)容數(shù)據(jù)信息預(yù)先存儲到存儲單元中,所述計(jì)算單元根據(jù)所述存儲的內(nèi)容數(shù)據(jù)信息,計(jì)算構(gòu)成所述指定的網(wǎng)頁的各內(nèi)容數(shù)據(jù)的出現(xiàn)頻度。根據(jù)本發(fā)明,根據(jù)作為針對預(yù)定站點(diǎn)中包含的預(yù)定種類的各網(wǎng)頁預(yù)先提取的結(jié)果的內(nèi)容數(shù)據(jù)信息,計(jì)算構(gòu)成所指定的網(wǎng)頁的各內(nèi)容數(shù)據(jù)的出現(xiàn)頻度,因此能夠準(zhǔn)確地計(jì)算出現(xiàn)頻度,從而能夠提高判斷網(wǎng)頁特有的內(nèi)容數(shù)據(jù)的精度。權(quán)利要求6所述的發(fā)明是在權(quán)利要求1 5中的任意一項(xiàng)所述的特有內(nèi)容數(shù)據(jù)判定程序中,其特征在于,該特有內(nèi)容數(shù)據(jù)判定程序使所述計(jì)算機(jī)發(fā)揮如下功能所述提取單元以由1個(gè)以上的內(nèi)容數(shù)據(jù)構(gòu)成的內(nèi)容數(shù)據(jù)組為單位提取構(gòu)成網(wǎng)頁的內(nèi)容數(shù)據(jù),所述計(jì)算單元計(jì)算構(gòu)成所述指定的網(wǎng)頁的內(nèi)容數(shù)據(jù)組的出現(xiàn)頻度,所述判定單元判定構(gòu)成所述指定的網(wǎng)頁的內(nèi)容數(shù)據(jù)組中該網(wǎng)頁特有的內(nèi)容數(shù)據(jù)組。根據(jù)本發(fā)明,以內(nèi)容數(shù)據(jù)組為單位來判斷網(wǎng)頁特有的內(nèi)容數(shù)據(jù),因此,例如在網(wǎng)頁上以某個(gè)集合進(jìn)行顯示,并且將相互具有關(guān)聯(lián)性的內(nèi)容數(shù)據(jù)設(shè)為內(nèi)容數(shù)據(jù)組時(shí),能夠提取出作為網(wǎng)頁特有的內(nèi)容數(shù)據(jù)的內(nèi)容數(shù)據(jù)組。權(quán)利要求7所述的發(fā)明是在權(quán)利要求6所述的特有內(nèi)容數(shù)據(jù)判定程序中,其特征在于,該特有內(nèi)容數(shù)據(jù)判定程序使所述計(jì)算機(jī)發(fā)揮如下功能所述提取單元根據(jù)用預(yù)定的
6標(biāo)記語言描述的表示構(gòu)成網(wǎng)頁的內(nèi)容數(shù)據(jù)的文檔數(shù)據(jù),提取內(nèi)容數(shù)據(jù)組。根據(jù)本發(fā)明,根據(jù)表示構(gòu)成網(wǎng)頁的內(nèi)容數(shù)據(jù)的文檔數(shù)據(jù)來提取內(nèi)容數(shù)據(jù)組,因此能夠準(zhǔn)確地提取內(nèi)容數(shù)據(jù)組。權(quán)利要求8所述的發(fā)明是在權(quán)利要求7所述的特有內(nèi)容數(shù)據(jù)判定程序中,其特征在于,該特有內(nèi)容數(shù)據(jù)判定程序使所述計(jì)算機(jī)發(fā)揮如下功能所述提取單元在表示所述內(nèi)容數(shù)據(jù)的文檔數(shù)據(jù)中根據(jù)預(yù)定的標(biāo)簽來確定內(nèi)容數(shù)據(jù)組。根據(jù)本發(fā)明,根據(jù)預(yù)定的標(biāo)簽來提取內(nèi)容數(shù)據(jù)組,因此,在分別利用預(yù)定的標(biāo)簽對網(wǎng)頁特有的內(nèi)容數(shù)據(jù)和非特有內(nèi)容數(shù)據(jù)進(jìn)行分組化的情況下,能夠提高判斷網(wǎng)頁特有的內(nèi)容數(shù)據(jù)的精度。權(quán)利要求9所述的發(fā)明是在權(quán)利要求1 8中的任意一項(xiàng)所述的特有內(nèi)容數(shù)據(jù)判定程序中,其特征在于,該特有內(nèi)容數(shù)據(jù)判定程序使所述計(jì)算機(jī)進(jìn)一步作為生成單元發(fā)揮功能,所述生成單元根據(jù)被判定為特有內(nèi)容數(shù)據(jù)的內(nèi)容數(shù)據(jù),生成新內(nèi)容數(shù)據(jù)。根據(jù)本發(fā)明,根據(jù)網(wǎng)頁特有的內(nèi)容數(shù)據(jù)生成新內(nèi)容數(shù)據(jù),因此,例如能夠生成表示該網(wǎng)頁中登載的內(nèi)容的特征的內(nèi)容數(shù)據(jù)。權(quán)利要求10所述的發(fā)明是在權(quán)利要求9所述的特有內(nèi)容數(shù)據(jù)判定程序中,其特征在于,該特有內(nèi)容數(shù)據(jù)判定程序使所述計(jì)算機(jī)發(fā)揮如下功能所述生成單元將被判定為特有內(nèi)容數(shù)據(jù)的內(nèi)容數(shù)據(jù)的顯示尺寸調(diào)整為與預(yù)先設(shè)定的顯示尺寸一致,生成包含調(diào)整了顯示尺寸后的內(nèi)容數(shù)據(jù)的新內(nèi)容數(shù)據(jù)。權(quán)利要求11所述的發(fā)明是在權(quán)利要求9或權(quán)利要求10所述的特有內(nèi)容數(shù)據(jù)判定程序中,其特征在于,該特有內(nèi)容數(shù)據(jù)判定程序使所述計(jì)算機(jī)發(fā)揮如下功能所述生成單元生成對被判定為特有內(nèi)容數(shù)據(jù)的內(nèi)容數(shù)據(jù)施加效果來再現(xiàn)該內(nèi)容數(shù)據(jù)的新內(nèi)容數(shù)據(jù)。權(quán)利要求12所述的發(fā)明是在權(quán)利要求1 8中的任意一項(xiàng)所述的特有內(nèi)容數(shù)據(jù)判定程序中,其特征在于,該特有內(nèi)容數(shù)據(jù)判定程序使所述計(jì)算機(jī)進(jìn)一步作為插入單元發(fā)揮功能,所述插入單元將與被判定為特有內(nèi)容數(shù)據(jù)的內(nèi)容數(shù)據(jù)相關(guān)聯(lián)的關(guān)聯(lián)內(nèi)容數(shù)據(jù)插入到所述指定的網(wǎng)頁中。根據(jù)本發(fā)明,將與被判定為特有內(nèi)容數(shù)據(jù)的內(nèi)容數(shù)據(jù)相關(guān)聯(lián)的內(nèi)容數(shù)據(jù)插入到所指定的網(wǎng)頁中,因此,能夠?qū)⑴c網(wǎng)頁的特征相關(guān)聯(lián)的信息追加到該網(wǎng)頁中。權(quán)利要求13所述的發(fā)明是在權(quán)利要求12所述的特有內(nèi)容數(shù)據(jù)判定程序中,其特征在于,該特有內(nèi)容數(shù)據(jù)判定程序使所述計(jì)算機(jī)發(fā)揮如下功能在構(gòu)成所述指定的網(wǎng)頁的內(nèi)容數(shù)據(jù)包含博客消息的文本數(shù)據(jù)的情況下,所述判定單元將該文本數(shù)據(jù)判定為該網(wǎng)頁特有的內(nèi)容數(shù)據(jù),所述插入單元從被所述特有內(nèi)容數(shù)據(jù)判定裝置判定為特有內(nèi)容數(shù)據(jù)的博客消息的文本數(shù)據(jù)中提取所述指定的網(wǎng)頁的特征詞,將與該特征詞相關(guān)聯(lián)的關(guān)聯(lián)內(nèi)容數(shù)據(jù)插入到該網(wǎng)頁中。根據(jù)本發(fā)明,只要在各博客消息的文本數(shù)據(jù)中包含有該消息特有的內(nèi)容,就能夠由特有內(nèi)容數(shù)據(jù)判定裝置提取出各博客消息的文本數(shù)據(jù)。由此,能夠?qū)⑴c網(wǎng)頁中登載的博客的內(nèi)容相關(guān)聯(lián)的信息追加到該網(wǎng)頁中。權(quán)利要求14所述的發(fā)明的特征在于,特有內(nèi)容數(shù)據(jù)判定裝置具有提取單元,其提取構(gòu)成所指定的網(wǎng)頁的內(nèi)容數(shù)據(jù);計(jì)算單元,其計(jì)算構(gòu)成所述指定的網(wǎng)頁的各內(nèi)容數(shù)據(jù)的出現(xiàn)頻度;以及判定單元,其根據(jù)所述計(jì)算的出現(xiàn)頻度,判定構(gòu)成所述指定的網(wǎng)頁的內(nèi)容數(shù)據(jù)中該網(wǎng)頁特有的內(nèi)容數(shù)據(jù)。權(quán)利要求15所述的發(fā)明是在權(quán)利要求14所述的特有內(nèi)容數(shù)據(jù)判定裝置中,其特征在于,所述判定單元將構(gòu)成所述指定的網(wǎng)頁的內(nèi)容數(shù)據(jù)中出現(xiàn)頻度最小的內(nèi)容數(shù)據(jù)判定為該網(wǎng)頁特有的內(nèi)容數(shù)據(jù)。權(quán)利要求16所述的發(fā)明是在權(quán)利要求14所述的特有內(nèi)容數(shù)據(jù)判定裝置中,其特征在于,所述判定單元將構(gòu)成所述指定的網(wǎng)頁的內(nèi)容數(shù)據(jù)中出現(xiàn)頻度為預(yù)定值以下的內(nèi)容數(shù)據(jù)判定為該網(wǎng)頁特有的內(nèi)容數(shù)據(jù)。權(quán)利要求17所述的發(fā)明是在權(quán)利要求14 16中的任意一項(xiàng)所述的特有內(nèi)容數(shù)據(jù)判定裝置中,其特征在于,所述計(jì)算單元計(jì)算各內(nèi)容數(shù)據(jù)在預(yù)定站點(diǎn)所包含的多個(gè)網(wǎng)頁上的出現(xiàn)頻度。權(quán)利要求18所述的發(fā)明是在權(quán)利要求14 17中的任意一項(xiàng)所述的特有內(nèi)容數(shù)據(jù)判定裝置中,其特征在于,所述提取單元針對所述預(yù)定的站點(diǎn)中包含的預(yù)定種類的各網(wǎng)頁提取構(gòu)成網(wǎng)頁的內(nèi)容數(shù)據(jù),將表示提取出的內(nèi)容數(shù)據(jù)的內(nèi)容數(shù)據(jù)信息預(yù)先存儲到存儲單元中,所述計(jì)算單元根據(jù)所述存儲的內(nèi)容數(shù)據(jù)信息,計(jì)算構(gòu)成所述指定的網(wǎng)頁的各內(nèi)容數(shù)據(jù)的出現(xiàn)頻度。權(quán)利要求19所述的發(fā)明是在權(quán)利要求14 18中的任意一項(xiàng)所述的特有內(nèi)容數(shù)據(jù)判定裝置中,其特征在于,所述提取單元以由1個(gè)以上的內(nèi)容數(shù)據(jù)構(gòu)成的內(nèi)容數(shù)據(jù)組為單位提取構(gòu)成網(wǎng)頁的內(nèi)容數(shù)據(jù),所述計(jì)算單元計(jì)算構(gòu)成所述指定的網(wǎng)頁的內(nèi)容數(shù)據(jù)組的出現(xiàn)頻度,所述判定單元判定構(gòu)成所述指定的網(wǎng)頁的內(nèi)容數(shù)據(jù)組中該網(wǎng)頁特有的內(nèi)容數(shù)據(jù)組。權(quán)利要求20所述的發(fā)明是在權(quán)利要求19所述的特有內(nèi)容數(shù)據(jù)判定裝置中,其特征在于,所述提取單元根據(jù)用預(yù)定的標(biāo)記語言描述的表示構(gòu)成網(wǎng)頁的內(nèi)容數(shù)據(jù)的文檔數(shù)據(jù),提取內(nèi)容數(shù)據(jù)組。權(quán)利要求21所述的發(fā)明是在權(quán)利要求20所述的特有內(nèi)容數(shù)據(jù)判定裝置中,其特征在于,所述提取單元在表示所述內(nèi)容數(shù)據(jù)的文檔數(shù)據(jù)中根據(jù)預(yù)定的標(biāo)簽來確定內(nèi)容數(shù)據(jù)組。權(quán)利要求22所述的發(fā)明的特征在于,內(nèi)容數(shù)據(jù)判定方法具有以下步驟提取步驟,提取構(gòu)成所指定的網(wǎng)頁的內(nèi)容數(shù)據(jù);計(jì)算步驟,計(jì)算構(gòu)成所述指定的網(wǎng)頁的各內(nèi)容數(shù)據(jù)的出現(xiàn)頻度;以及判定步驟,根據(jù)所述計(jì)算的出現(xiàn)頻度,判定構(gòu)成所述指定的網(wǎng)頁的內(nèi)容數(shù)據(jù)中該網(wǎng)頁特有的內(nèi)容數(shù)據(jù)。權(quán)利要求23所述的發(fā)明的特征在于,記錄介質(zhì)以計(jì)算機(jī)可讀取的方式記錄有特有內(nèi)容數(shù)據(jù)判定程序,該特有內(nèi)容數(shù)據(jù)判定程序使計(jì)算機(jī)作為如下單元發(fā)揮功能提取單元,其提取構(gòu)成所指定的網(wǎng)頁的內(nèi)容數(shù)據(jù);計(jì)算單元,其計(jì)算構(gòu)成所述指定的網(wǎng)頁的各內(nèi)容數(shù)據(jù)的出現(xiàn)頻度;以及判定單元,其根據(jù)所述計(jì)算的出現(xiàn)頻度,判定構(gòu)成所述指定的網(wǎng)頁的內(nèi)容數(shù)據(jù)中該網(wǎng)頁特有的內(nèi)容數(shù)據(jù)。權(quán)利要求M所述的發(fā)明的特征在于,內(nèi)容數(shù)據(jù)生成裝置具有權(quán)利要求14 21 中的任意一項(xiàng)所述的特有內(nèi)容數(shù)據(jù)判定裝置;以及生成單元,其根據(jù)被所述特有內(nèi)容數(shù)據(jù)判定裝置判定為特有內(nèi)容數(shù)據(jù)的內(nèi)容數(shù)據(jù),生成新內(nèi)容數(shù)據(jù)。權(quán)利要求25所述的發(fā)明是在權(quán)利要求M所述的內(nèi)容數(shù)據(jù)生成裝置中,其特征在于,所述生成單元將被判定為特有內(nèi)容數(shù)據(jù)的內(nèi)容數(shù)據(jù)的顯示尺寸調(diào)整為與預(yù)先設(shè)定的顯示尺寸一致,生成包含調(diào)整了顯示尺寸后的內(nèi)容數(shù)據(jù)的新內(nèi)容數(shù)據(jù)。權(quán)利要求沈所述的發(fā)明是在權(quán)利要求M或權(quán)利要求25所述的內(nèi)容數(shù)據(jù)生成裝置中,其特征在于,所述生成單元生成對被判定為特有內(nèi)容數(shù)據(jù)的內(nèi)容數(shù)據(jù)施加效果來再現(xiàn)該內(nèi)容數(shù)據(jù)的新內(nèi)容數(shù)據(jù)。權(quán)利要求27所述的發(fā)明的特征在于,關(guān)聯(lián)內(nèi)容數(shù)據(jù)插入裝置具有權(quán)利要求14 21中的任意一項(xiàng)所述的特有內(nèi)容數(shù)據(jù)判定裝置;以及插入單元,其將與被所述特有內(nèi)容數(shù)據(jù)判定裝置判定為特有內(nèi)容數(shù)據(jù)的內(nèi)容數(shù)據(jù)相關(guān)聯(lián)的關(guān)聯(lián)內(nèi)容數(shù)據(jù)插入到所述指定的網(wǎng)頁中。權(quán)利要求觀所述的發(fā)明是在權(quán)利要求27所述的關(guān)聯(lián)內(nèi)容數(shù)據(jù)插入裝置中,其特征在于,在構(gòu)成所述指定的網(wǎng)頁的內(nèi)容數(shù)據(jù)包含博客消息的文本數(shù)據(jù)的情況下,所述特有內(nèi)容數(shù)據(jù)判定裝置將該文本數(shù)據(jù)判定為該網(wǎng)頁特有的內(nèi)容數(shù)據(jù),所述插入單元從被所述特有內(nèi)容數(shù)據(jù)判定裝置判定為特有內(nèi)容數(shù)據(jù)的博客消息的文本數(shù)據(jù)中提取所述指定的網(wǎng)頁的特征詞,將與該特征詞相關(guān)聯(lián)的關(guān)聯(lián)內(nèi)容數(shù)據(jù)插入到該網(wǎng)頁中。發(fā)明效果根據(jù)本發(fā)明,內(nèi)容數(shù)據(jù)的出現(xiàn)頻度越小,內(nèi)容數(shù)據(jù)在所指定的網(wǎng)頁以外越不怎么出現(xiàn)。因此,能夠根據(jù)出現(xiàn)頻度來確定所指定的網(wǎng)頁特有的內(nèi)容數(shù)據(jù)。因此,能夠容易地提取出網(wǎng)頁特有的內(nèi)容數(shù)據(jù)。
圖1是示出一個(gè)實(shí)施方式的購物系統(tǒng)S的概要結(jié)構(gòu)的一例的圖。圖2是示出一個(gè)實(shí)施方式的內(nèi)容數(shù)據(jù)生成服務(wù)器1的概要結(jié)構(gòu)的一例的框圖。圖3是示出從指定網(wǎng)頁到生成Flash內(nèi)容數(shù)據(jù)為止的處理的概要的圖。圖4是示出網(wǎng)頁的結(jié)構(gòu)例的圖。圖5是示出從HTML文檔生成的DOM樹的一例的圖。圖6是示出登記在素材提取數(shù)據(jù)庫101中的信息內(nèi)容的一例的圖。圖7是示出一個(gè)實(shí)施方式的內(nèi)容數(shù)據(jù)生成服務(wù)器1的系統(tǒng)控制部20的素材提取處理中的處理例的流程圖。圖8是示出一個(gè)實(shí)施方式的內(nèi)容數(shù)據(jù)生成服務(wù)器1的系統(tǒng)控制部20的單頁對應(yīng)提取處理中的處理例的流程圖。圖9是示出一個(gè)實(shí)施方式的內(nèi)容數(shù)據(jù)生成服務(wù)器1的系統(tǒng)控制部20的樹搜索處理中的處理例的流程圖。圖10是示出一個(gè)實(shí)施方式的內(nèi)容數(shù)據(jù)生成服務(wù)器1的系統(tǒng)控制部20的內(nèi)容數(shù)據(jù)生成處理中的處理例的流程圖。圖11是示出一個(gè)實(shí)施方式的內(nèi)容數(shù)據(jù)生成服務(wù)器1的系統(tǒng)控制部20的特有內(nèi)容數(shù)據(jù)塊判定處理中的處理例的流程圖。圖12是示出一個(gè)實(shí)施方式的內(nèi)容數(shù)據(jù)生成服務(wù)器1的系統(tǒng)控制部20的Flash內(nèi)容數(shù)據(jù)生成處理中的處理例的流程圖。圖13是示出一個(gè)實(shí)施方式的博客系統(tǒng)BS的概要結(jié)構(gòu)的一例的圖。
圖14是示出一個(gè)實(shí)施方式的博客服務(wù)器6的概要結(jié)構(gòu)的一例的框圖。圖15是示出從指定博主到在博客頁面中插入廣告內(nèi)容數(shù)據(jù)為止的處理的概要的圖。圖16是示出網(wǎng)頁的結(jié)構(gòu)例的圖。圖17是示出從HTML文檔生成的DOM樹的一例的圖。圖18是示出存儲在存儲部65中的內(nèi)容數(shù)據(jù)塊對應(yīng)信息的內(nèi)容的一例的圖。圖19是示出一個(gè)實(shí)施方式的博客服務(wù)器6的系統(tǒng)控制部70的廣告內(nèi)容數(shù)據(jù)插入處理中的處理例的流程圖。圖20是示出一個(gè)實(shí)施方式的博客服務(wù)器6的系統(tǒng)控制部70的單頁對應(yīng)提取處理中的處理例的流程圖。圖21是示出一個(gè)實(shí)施方式的博客服務(wù)器6的系統(tǒng)控制部70的特有內(nèi)容數(shù)據(jù)塊判定處理中的處理例的流程圖。圖22是示出一個(gè)實(shí)施方式的變形例的博客服務(wù)器6的系統(tǒng)控制部70的博客更新時(shí)處理中的處理例的流程圖。用于實(shí)施發(fā)明的方式[1.第1實(shí)施方式]下面,參照附圖來詳細(xì)說明本發(fā)明的實(shí)施方式。另外,以下說明的實(shí)施方式是如下情況下的實(shí)施方式在利用網(wǎng)絡(luò)上的電子交易進(jìn)行商品買賣的購物系統(tǒng)中,將本發(fā)明應(yīng)用于根據(jù)從購物站點(diǎn)的網(wǎng)頁中提取出的網(wǎng)頁特有的內(nèi)容數(shù)據(jù)來生成新內(nèi)容數(shù)據(jù)的服務(wù)器裝置。[1-1.購物系統(tǒng)的結(jié)構(gòu)和功能概要]首先,使用圖1對本實(shí)施方式的購物系統(tǒng)S的結(jié)構(gòu)和功能概要進(jìn)行說明。圖1是示出本實(shí)施方式的購物系統(tǒng)S的概要結(jié)構(gòu)的一例的圖。如圖1所示,購物系統(tǒng)S構(gòu)成為包含作為特有內(nèi)容數(shù)據(jù)判定裝置和內(nèi)容數(shù)據(jù)生成裝置的一例的內(nèi)容數(shù)據(jù)生成服務(wù)器1、購物服務(wù)器2、管理終端3、多個(gè)店鋪終端4以及多個(gè)用戶終端5。并且,內(nèi)容數(shù)據(jù)生成服務(wù)器1、購物服務(wù)器2、各店鋪終端4、各用戶終端5可經(jīng)由網(wǎng)絡(luò)NW,例如使用通信協(xié)議中的TCP/IP等相互進(jìn)行數(shù)據(jù)的收發(fā)。另外,網(wǎng)絡(luò)NW例如是由互聯(lián)網(wǎng)、專用通信線路(例如CATV (Community Antenna Television 有線電視)線路)、 移動通信網(wǎng)(包含基站等)以及網(wǎng)關(guān)等構(gòu)建的。此外,內(nèi)容數(shù)據(jù)生成服務(wù)器1和管理終端 3經(jīng)由LAN (Local Area Network :局域網(wǎng))等網(wǎng)絡(luò)進(jìn)行連接。另外,內(nèi)容數(shù)據(jù)生成服務(wù)器1 和購物服務(wù)器2同樣可以經(jīng)由LAN等網(wǎng)絡(luò)進(jìn)行連接。在這種結(jié)構(gòu)的購物系統(tǒng)S中,購物服務(wù)器2是根據(jù)來自店鋪終端4或用戶終端5 的請求,發(fā)送構(gòu)成購物站點(diǎn)的網(wǎng)頁的Web服務(wù)器。此外,購物服務(wù)器2根據(jù)來自店鋪終端4 的請求,對購物站點(diǎn)上出售的商品進(jìn)行登記,生成登載有該商品的詳細(xì)說明等的商品詳細(xì)頁面。并且,購物服務(wù)器2具有商品詳細(xì)頁面數(shù)據(jù)庫201,將生成的商品詳細(xì)頁面(商品詳細(xì)頁面的HTML文檔(文檔數(shù)據(jù)的一例)、作為商品詳細(xì)頁面的素材的圖像數(shù)據(jù)等)登記到商品詳細(xì)頁面數(shù)據(jù)庫201中。此外,購物服務(wù)器2根據(jù)來自閱覽了商品詳細(xì)頁面的用戶的用戶終端5的請求,進(jìn)行商品購買的處理。店鋪終端4是在購物站點(diǎn)上出售商品的店鋪的工作人員所使用的終端裝置。作為店鋪終端4,例如可采用個(gè)人計(jì)算機(jī)等。用戶終端5是在購物站點(diǎn)上購買商品的用戶所使用的終端裝置。作為用戶終端5, 例如可采用個(gè)人計(jì)算機(jī)、PDA、移動電話機(jī)等。內(nèi)容數(shù)據(jù)生成服務(wù)器1根據(jù)來自管理終端3或店鋪終端4的請求,生成表示所指定的商品詳細(xì)頁面的特征(進(jìn)而表示商品的特征)的Flash內(nèi)容數(shù)據(jù)(由Adobe Systems 公司進(jìn)行了標(biāo)準(zhǔn)化的軟件)。所生成的Flash內(nèi)容數(shù)據(jù)例如是商品的橫幅廣告圖像、介紹商品的幻燈片內(nèi)容數(shù)據(jù)、動態(tài)圖像內(nèi)容數(shù)據(jù)等。并且,F(xiàn)lash內(nèi)容數(shù)據(jù)例如被登載于店鋪所運(yùn)營的網(wǎng)站上,并被用作構(gòu)成購物站點(diǎn)的網(wǎng)頁的素材。為了生成這種Flash內(nèi)容數(shù)據(jù),內(nèi)容數(shù)據(jù)生成服務(wù)器1具有素材提取數(shù)據(jù)庫101, 提取構(gòu)成登記于商品詳細(xì)頁面數(shù)據(jù)庫201中的商品詳細(xì)頁面的作為Web素材的內(nèi)容數(shù)據(jù) (圖像數(shù)據(jù)、HTML文檔所描述的文本數(shù)據(jù)等),并將其提取結(jié)果登記到素材提取數(shù)據(jù)庫101 中。并且,內(nèi)容數(shù)據(jù)生成服務(wù)器1在從指定的商品詳細(xì)頁面中提取出的內(nèi)容數(shù)據(jù)中,確定該商品詳細(xì)頁面特有的內(nèi)容數(shù)據(jù),根據(jù)所確定的內(nèi)容數(shù)據(jù)生成Flash內(nèi)容數(shù)據(jù)。管理終端3是購物系統(tǒng)S的系統(tǒng)管理者所使用的終端裝置。作為管理終端3,例如可采用個(gè)人計(jì)算機(jī)等。[1-2.內(nèi)容數(shù)據(jù)生成服務(wù)器的結(jié)構(gòu)和功能]接著,使用圖2對內(nèi)容數(shù)據(jù)生成服務(wù)器1的結(jié)構(gòu)和功能進(jìn)行說明。圖2是示出本實(shí)施方式的內(nèi)容數(shù)據(jù)生成服務(wù)器1的概要結(jié)構(gòu)的一例的框圖。此外,圖3是示出從指定網(wǎng)頁到生成Flash內(nèi)容數(shù)據(jù)為止的處理的概要的圖。此外,圖4是示出網(wǎng)頁的結(jié)構(gòu)例的圖。并且,圖5是示出從HTML文檔生成的DOM樹的一例的圖。進(jìn)而,圖 6是示出登記在素材提取數(shù)據(jù)庫101中的信息內(nèi)容的一例的圖。如圖2所示,內(nèi)容數(shù)據(jù)生成服務(wù)器1具有操作部11、顯示部12、通信部13、驅(qū)動部 14、作為存儲單元的一例的存儲部15、輸入輸出接口部16和系統(tǒng)控制部20。并且,系統(tǒng)控制部20和輸入輸出接口部16經(jīng)由系統(tǒng)總線21進(jìn)行連接。操作部11例如由鍵盤、鼠標(biāo)等構(gòu)成,受理來自系統(tǒng)管理者等的操作指示,并將其指示內(nèi)容作為指示信號輸出到系統(tǒng)控制部20。顯示部12例如由CRT (Cathode Ray Tube 陰極射線管)顯示器、液晶顯示器等構(gòu)成,顯示字符或圖像等信息。通信部13連接到網(wǎng)絡(luò) NW等,對與購物服務(wù)器2、管理終端3、店鋪終端4、用戶終端5等的通信狀態(tài)進(jìn)行控制。驅(qū)動部 14 例如從軟盤、CD (Compact Disc 壓縮盤)、DVD (Digital Versatile Disc 數(shù)字多功能盤)等盤式DK讀出數(shù)據(jù)等,另一方面,向該盤式DK記錄數(shù)據(jù)等。存儲部15例如由硬盤驅(qū)動器等構(gòu)成,存儲各種程序和數(shù)據(jù)等。此外,在存儲部15中構(gòu)建有素材提取數(shù)據(jù)庫101。 輸入輸出接口部16進(jìn)行操作部11 存儲部15與系統(tǒng)控制部20之間的接口處理。系統(tǒng)控制部 20 由 CPU (Central Processing Unit 中央處理器)17、ROM (Read Only Memory 只讀存儲器)18和RAM (Random Access Memory 隨機(jī)存取存儲器)19等構(gòu)成。系統(tǒng)控制部20通過CPU 17讀出并執(zhí)行存儲在ROM 18和存儲部15中的各種程序來控制內(nèi)容數(shù)據(jù)生成服務(wù)器1的各個(gè)部分。此外,系統(tǒng)控制部20通過執(zhí)行內(nèi)容數(shù)據(jù)生成軟件(特有內(nèi)容數(shù)據(jù)判定程序的一例),從而作為提取單元、計(jì)算單元、判定單元和生成單元發(fā)揮功能。另外,內(nèi)容數(shù)據(jù)生成軟件等例如可經(jīng)由網(wǎng)絡(luò)NW從其他服務(wù)器裝置等取得,也可以記錄到⑶-ROM等盤式DK中并經(jīng)由驅(qū)動部14讀入。
內(nèi)容數(shù)據(jù)生成軟件是用于根據(jù)商品詳細(xì)頁面特有的內(nèi)容數(shù)據(jù)生成Flash內(nèi)容數(shù)據(jù)的程序。如圖3所示,內(nèi)容數(shù)據(jù)生成軟件由管理部、素材提取引擎、SWFGhockWave Flash Object)生成引擎等構(gòu)成。管理部是用于實(shí)現(xiàn)如下目的的軟件對素材提取引擎和SWF引擎的執(zhí)行進(jìn)行控制,并且向利用內(nèi)容數(shù)據(jù)生成軟件的用戶(店鋪工作人員或系統(tǒng)管理者)提供用于生成Flash內(nèi)容數(shù)據(jù)的⑶I (Graphical User hterface 圖形用戶界面)。素材提取引擎是用于實(shí)現(xiàn)如下目的的軟件從商品詳細(xì)頁面的HTML文檔中提取作為Web素材的內(nèi)容數(shù)據(jù),并且判定商品詳細(xì)頁面特有的內(nèi)容數(shù)據(jù)。內(nèi)容數(shù)據(jù)的提取是以后述的內(nèi)容數(shù)據(jù)塊 (內(nèi)容數(shù)據(jù)組的一例)為單位進(jìn)行的。SWF引擎是根據(jù)所給出的1個(gè)或多個(gè)內(nèi)容數(shù)據(jù)(Web素材)來生成Flash內(nèi)容數(shù)據(jù)的軟件。另外,在生成Flash內(nèi)容數(shù)據(jù)以外的富互聯(lián)網(wǎng)應(yīng)用作為新的內(nèi)容數(shù)據(jù)的情況下,也可以替代SWF生成引擎,例如應(yīng)用微軟公司的Silverlight (商標(biāo))的生成引擎。此外,還可以應(yīng)用利用Ajax (Asynchronous JavaScript (注冊商標(biāo))+XML) 等技術(shù)來生成實(shí)現(xiàn)動態(tài)頁面的腳本的軟件。以下,對Flash內(nèi)容數(shù)據(jù)的生成概要進(jìn)行說明。如圖3所示,系統(tǒng)控制部20從購物服務(wù)器2取得登記在商品詳細(xì)頁面數(shù)據(jù)庫201中的HTML文檔并進(jìn)行分析,以內(nèi)容數(shù)據(jù)塊為單位提取作為Web素材的內(nèi)容數(shù)據(jù)。并且,針對作為其提取結(jié)果提取出的每個(gè)內(nèi)容數(shù)據(jù)塊, 將內(nèi)容數(shù)據(jù)塊對應(yīng)信息(內(nèi)容數(shù)據(jù)信息的一例)登記到素材提取數(shù)據(jù)庫101中(1)。該處理是在Flash內(nèi)容數(shù)據(jù)生成前預(yù)先進(jìn)行的,基本上針對登記在商品詳細(xì)頁面數(shù)據(jù)庫201中的所有HTML文檔、即構(gòu)成購物站點(diǎn)的所有商品詳細(xì)頁面進(jìn)行提取。之后,由系統(tǒng)管理者或店鋪工作人員指定作為Flash內(nèi)容數(shù)據(jù)的生成對象的商品詳細(xì)頁面的HTML文檔的URL(2)。于是,系統(tǒng)控制部20根據(jù)所指定的URL從購物服務(wù)器2 取得HTML文檔,提取內(nèi)容數(shù)據(jù)塊。然后,控制部20參照素材提取數(shù)據(jù)庫101,計(jì)算提取出的各內(nèi)容數(shù)據(jù)塊在所有商品詳細(xì)頁面中的出現(xiàn)頻度。作為所計(jì)算的出現(xiàn)頻度,可以是出現(xiàn)次數(shù)(回?cái)?shù)),也可以是出現(xiàn)次數(shù)相對于所有商品詳細(xì)頁面的所有內(nèi)容數(shù)據(jù)塊的比例(相對回?cái)?shù))。并且,系統(tǒng)控制部20根據(jù)出現(xiàn)頻度,判定與指定的URL對應(yīng)的商品詳細(xì)頁面特有的內(nèi)容數(shù)據(jù)塊。具體而言,系統(tǒng)控制部20將出現(xiàn)頻度最小的內(nèi)容數(shù)據(jù)塊判定為與指定的URL對應(yīng)的商品詳細(xì)頁面特有的內(nèi)容數(shù)據(jù)塊(3)。系統(tǒng)控制部20經(jīng)由購物服務(wù)器2從商品詳細(xì)頁面數(shù)據(jù)庫201中取得被判定為特有內(nèi)容數(shù)據(jù)塊的內(nèi)容數(shù)據(jù)塊所包含的內(nèi)容數(shù)據(jù)。系統(tǒng)控制部20根據(jù)所取得的內(nèi)容數(shù)據(jù)生成Flash內(nèi)容數(shù)據(jù)0)。接著,系統(tǒng)管理者或店鋪工作人員下載所生成的Flash內(nèi)容數(shù)據(jù) (5)。另外,也可以在Flash內(nèi)容數(shù)據(jù)的下載前,由系統(tǒng)管理者或店鋪工作人員對Flash內(nèi)容數(shù)據(jù)進(jìn)行適當(dāng)修正。接著,對內(nèi)容數(shù)據(jù)塊的提取方法進(jìn)行說明。另外,在本實(shí)施方式中,提取文本數(shù)據(jù)和圖像數(shù)據(jù)作為Web素材。例如,商品詳細(xì)頁面的結(jié)構(gòu)(布局)如圖4所示。作為Web素材的各內(nèi)容數(shù)據(jù)在商品詳細(xì)頁面上,分別按照每個(gè)集合(塊)進(jìn)行顯示。該各個(gè)集合相當(dāng)于內(nèi)容數(shù)據(jù)塊。利用HTML文檔所描述的DIV標(biāo)簽和TABLE標(biāo)簽(預(yù)定的標(biāo)簽的一例)將各內(nèi)容數(shù)據(jù)分別分類為內(nèi)容數(shù)據(jù)塊。即,各內(nèi)容數(shù)據(jù)利用DIV標(biāo)簽和TABLE標(biāo)簽而分塊化(分組化)。另外, 將DIV標(biāo)簽和TABLE標(biāo)簽稱作“分塊化標(biāo)簽”。在圖4中,顯示了內(nèi)容數(shù)據(jù)塊301 306。內(nèi)容數(shù)據(jù)塊301例如是頁面的標(biāo)題部分的內(nèi)容數(shù)據(jù)塊,由文本A和圖像a構(gòu)成。此外,內(nèi)容數(shù)據(jù)塊302例如是用于移動到與各種類別的商品相關(guān)的網(wǎng)頁的導(dǎo)航部分的內(nèi)容數(shù)據(jù)塊,例如由表示接向其他網(wǎng)頁的鏈接的文本B、 文本C和文本D構(gòu)成。此外,內(nèi)容數(shù)據(jù)塊303例如是顯示與商品相關(guān)的信息的內(nèi)容數(shù)據(jù)塊, 由表示商品名等的目錄的文本E、內(nèi)容數(shù)據(jù)塊304和內(nèi)容數(shù)據(jù)塊305構(gòu)成。由此,內(nèi)容數(shù)據(jù)塊有時(shí)也成為嵌套狀、即層級結(jié)構(gòu)。此時(shí),設(shè)內(nèi)容數(shù)據(jù)塊303所包含的內(nèi)容數(shù)據(jù)僅為文本E, 內(nèi)容數(shù)據(jù)塊304和內(nèi)容數(shù)據(jù)塊305與內(nèi)容數(shù)據(jù)塊303相獨(dú)立。內(nèi)容數(shù)據(jù)塊304例如是表示商品的詳細(xì)情況的內(nèi)容數(shù)據(jù)塊,由表示詳細(xì)說明的文本F、作為商品等的圖像的圖像b和圖像c構(gòu)成。內(nèi)容數(shù)據(jù)塊305例如是表示商品購買時(shí)的一般注意事項(xiàng)等的內(nèi)容數(shù)據(jù)塊,由文本G和文本H構(gòu)成。內(nèi)容數(shù)據(jù)塊306例如是表示版權(quán)顯示的內(nèi)容數(shù)據(jù)塊,由文本I構(gòu)成。這些內(nèi)容數(shù)據(jù)塊中的內(nèi)容數(shù)據(jù)塊301、302、305和306在圖4所示的商品詳細(xì)頁面以外的商品詳細(xì)頁面上也比較頻繁地出現(xiàn)。另一方面,內(nèi)容數(shù)據(jù)塊303(文本E)和內(nèi)容數(shù)據(jù)塊304無論是僅用于該商品詳細(xì)頁面、還是用于其他商品詳細(xì)頁面,其頻度都比內(nèi)容數(shù)據(jù)塊301、302、305和306小。因此,例如將內(nèi)容數(shù)據(jù)塊303或內(nèi)容數(shù)據(jù)塊304判斷為該商品詳細(xì)頁面特有的內(nèi)容數(shù)據(jù)塊。圖5用DOM(Document Object Model 文檔對象模型)樹、即樹形結(jié)構(gòu)來表示圖4 所示的商品詳細(xì)頁面的HTML文檔。另外,在圖5所示的DOM樹中,省略了本實(shí)施方式的說明中不需要的標(biāo)簽節(jié)點(diǎn)的圖示。在DOM樹中,將表示DIV標(biāo)簽的DIV節(jié)點(diǎn)和表示TABLE標(biāo)簽的TABLE節(jié)點(diǎn)設(shè)為將各內(nèi)容數(shù)據(jù)分塊為內(nèi)容數(shù)據(jù)塊的節(jié)點(diǎn)(以下稱作“分塊化節(jié)點(diǎn)”)。系統(tǒng)控制部20例如通過深度優(yōu)先搜索對DOM樹進(jìn)行搜索,確定內(nèi)容數(shù)據(jù)塊。具體而言,系統(tǒng)控制部20在發(fā)現(xiàn)了分塊化節(jié)點(diǎn)時(shí),將以該節(jié)點(diǎn)為頂點(diǎn)的子樹的各個(gè)節(jié)點(diǎn)處規(guī)定的內(nèi)容數(shù)據(jù)統(tǒng)一起來而作為內(nèi)容數(shù)據(jù)塊。但是,當(dāng)分層地規(guī)定內(nèi)容數(shù)據(jù)塊的結(jié)果是,發(fā)現(xiàn)了某個(gè)分塊化節(jié)點(diǎn)(以下稱作 “上層的分塊化節(jié)點(diǎn)”)后,從該分塊化節(jié)點(diǎn)的子孫節(jié)點(diǎn)中進(jìn)一步發(fā)現(xiàn)了分塊化節(jié)點(diǎn)(以下稱作“下層的分塊化節(jié)點(diǎn)”)時(shí),對內(nèi)容數(shù)據(jù)塊進(jìn)行分割。例如,當(dāng)設(shè)節(jié)點(diǎn)與路由節(jié)點(diǎn)的距離越近,節(jié)點(diǎn)在層級上的層級越高時(shí),將與以上層的分塊化節(jié)點(diǎn)為頂點(diǎn)的子樹(以下稱作“上層子樹”)相應(yīng)的內(nèi)容數(shù)據(jù)塊分為與以下層的分塊化節(jié)點(diǎn)為頂點(diǎn)的子樹(以下稱作“下層子樹”)相應(yīng)的內(nèi)容數(shù)據(jù)塊、以及與上層子樹中除下層子樹以外的部分相應(yīng)的內(nèi)容數(shù)據(jù)塊(例如內(nèi)容數(shù)據(jù)塊304和內(nèi)容數(shù)據(jù)塊30 。此時(shí),前者的內(nèi)容數(shù)據(jù)塊在階層上比后者的內(nèi)容數(shù)據(jù)塊低。例如,內(nèi)容數(shù)據(jù)塊301、302、303和306的層級為1,內(nèi)容數(shù)據(jù)塊304和305的層級為2。即,層級的值越小,層級越高。如果用HTML文檔的標(biāo)簽的描述來說明該情況,當(dāng)基本上描述分塊化標(biāo)簽時(shí),把在分塊化標(biāo)簽所夾著的范圍內(nèi)描述了規(guī)定的內(nèi)容數(shù)據(jù)統(tǒng)一成與該分塊化標(biāo)簽對應(yīng)的內(nèi)容數(shù)據(jù)塊。但是,在分層地描述了分塊化標(biāo)簽的情況下,把在某個(gè)分塊化標(biāo)簽所夾著的范圍內(nèi)描述了規(guī)定的內(nèi)容數(shù)據(jù)中的、除了在比該分塊化標(biāo)簽更下層描述的分塊化標(biāo)簽所夾著的范圍內(nèi)描述了規(guī)定的內(nèi)容數(shù)據(jù)以外的內(nèi)容數(shù)據(jù)統(tǒng)一成與該分塊化標(biāo)簽對應(yīng)的內(nèi)容數(shù)據(jù)塊。在這樣地提取出內(nèi)容數(shù)據(jù)塊后,系統(tǒng)控制部20將表示提取結(jié)果的內(nèi)容數(shù)據(jù)塊對應(yīng)信息登記到素材提取數(shù)據(jù)庫101中。如圖6所示,針對每個(gè)內(nèi)容數(shù)據(jù)塊登記內(nèi)容數(shù)據(jù)塊對應(yīng)信息(標(biāo)號401)。內(nèi)容數(shù)據(jù)塊對應(yīng)信息由提取源的HTML文檔的URL設(shè)定部分(標(biāo)號 402)和塊構(gòu)成信息(標(biāo)號403)構(gòu)成。在塊構(gòu)成信息中,設(shè)定有提取出的各內(nèi)容數(shù)據(jù)。此處,關(guān)于文本數(shù)據(jù),設(shè)定DOM樹中的文本節(jié)點(diǎn)的內(nèi)容。另一方面,關(guān)于圖像數(shù)據(jù),替代圖像數(shù)據(jù)自身,而設(shè)定作為DOM樹中表示IMG標(biāo)簽的IMG節(jié)點(diǎn)的src屬性的圖像數(shù)據(jù)的URL。[1-3.購物系統(tǒng)的動作]接著,使用圖7至圖12對購物系統(tǒng)S的動作進(jìn)行說明。[1-3-1從所有商品詳細(xì)頁面提取內(nèi)容數(shù)據(jù)塊時(shí)]圖7是示出本實(shí)施方式的內(nèi)容數(shù)據(jù)生成服務(wù)器1的系統(tǒng)控制部20的素材提取處理中的處理例的流程圖。素材提取處理例如定期地執(zhí)行,在根據(jù)系統(tǒng)管理者的操作從管理終端3發(fā)送來素材提取處理的執(zhí)行請求時(shí),開始執(zhí)行素材提取處理。在素材提取處理中,系統(tǒng)控制部20對登記在商品詳細(xì)頁面數(shù)據(jù)庫201中的所有HTML文檔進(jìn)行分析。為此,系統(tǒng)控制部20例如可以預(yù)先從購物服務(wù)器2取得登記在商品詳細(xì)頁面數(shù)據(jù)庫201中的HTML文檔的一覽信息, 并根據(jù)該一覽信息取得HTML文檔,也可以從購物站點(diǎn)的首頁的HTML文檔逐個(gè)追尋鏈接,依次取得商品詳細(xì)頁面的HTML文檔。如圖7所示,系統(tǒng)控制部20對素材提取數(shù)據(jù)庫101進(jìn)行初始化(步驟Si)。具體而言,系統(tǒng)控制部20在素材提取數(shù)據(jù)庫101中已登記有內(nèi)容數(shù)據(jù)塊對應(yīng)信息的情況下,從素材提取數(shù)據(jù)庫101刪除所有的內(nèi)容數(shù)據(jù)塊對應(yīng)信息。接著,系統(tǒng)控制部20確定所有商品詳細(xì)頁面中最初應(yīng)取得的商品詳細(xì)頁面的 HTML文檔的URL (步驟S》,將設(shè)定了所確定的URL的請求發(fā)送到購物服務(wù)器2,由此從該購物服務(wù)器2取得HTML文檔(步驟S; )。接著,系統(tǒng)控制部20指定所取得的HTML文檔,執(zhí)行后述的單頁對應(yīng)提取處理(步驟S4)。在該單頁對應(yīng)提取處理中,從所取得的HTML文檔提取內(nèi)容數(shù)據(jù)塊,登記內(nèi)容數(shù)據(jù)塊對應(yīng)信息。接著,系統(tǒng)控制部20判定是否已提取出所有商品詳細(xì)頁面的內(nèi)容數(shù)據(jù)塊(步驟 S5)。此時(shí),系統(tǒng)控制部20在存在尚未提取內(nèi)容數(shù)據(jù)塊的商品詳細(xì)頁面的情況下(步驟S5 否),確定下一個(gè)商品詳細(xì)頁面的HTML文檔的URL (步驟S6),進(jìn)而轉(zhuǎn)移到步驟S3。并且,系統(tǒng)控制部20在反復(fù)執(zhí)行步驟S3 S6的處理而提取出所有商品詳細(xì)頁面的內(nèi)容數(shù)據(jù)塊后 (步驟S5 是),結(jié)束素材提取處理。另外,系統(tǒng)控制部20也可以不對素材提取數(shù)據(jù)庫101進(jìn)行初始化,從而不重新登記內(nèi)容數(shù)據(jù)塊對應(yīng)信息。例如,系統(tǒng)控制部20可以不對素材提取數(shù)據(jù)庫101進(jìn)行初始化,而是針對執(zhí)行上次素材提取處理后新生成的商品詳細(xì)頁面,生成內(nèi)容數(shù)據(jù)塊對應(yīng)信息并追加登記到素材提取數(shù)據(jù)庫101中,并且針對執(zhí)行上次素材提取處理后更新的商品詳細(xì)頁面, 生成內(nèi)容數(shù)據(jù)塊對應(yīng)信息并更新登記到素材提取數(shù)據(jù)庫101。圖8是示出本實(shí)施方式的內(nèi)容數(shù)據(jù)生成服務(wù)器1的系統(tǒng)控制部20的單頁對應(yīng)提取處理中的處理例的流程圖。如圖8所示,系統(tǒng)控制部20首先在RAM 19上生成所取得的HTML文檔的DOM樹 (步驟S21)。接著,系統(tǒng)控制部20將塊數(shù)NUM設(shè)定為0,并且將層級LV設(shè)定為0 (步驟S2》。塊數(shù)NUM是當(dāng)前時(shí)刻已發(fā)現(xiàn)的內(nèi)容數(shù)據(jù)塊的個(gè)數(shù)。此外,層級LV是在DOM樹中當(dāng)前搜索中的節(jié)點(diǎn)所屬的內(nèi)容數(shù)據(jù)塊的層級。NUM和LV均為全局變量,能夠從單頁對應(yīng)提取處理和后述的樹搜索處理進(jìn)行訪問。
14
接著,系統(tǒng)控制部20指定DOM樹的路由節(jié)點(diǎn)(步驟S2!3),執(zhí)行樹搜索處理(步驟 S24)。樹搜索處理可遞歸調(diào)用,通過該樹搜索處理,從網(wǎng)頁提取出所有的內(nèi)容數(shù)據(jù)塊,生成內(nèi)容數(shù)據(jù)塊對應(yīng)信息。接著,系統(tǒng)控制部20將通過樹搜索處理生成的各內(nèi)容數(shù)據(jù)塊對應(yīng)信息登記到素材提取數(shù)據(jù)庫101中(步驟S2Q。系統(tǒng)控制部20在結(jié)束該處理后,結(jié)束單頁對應(yīng)提取處理。圖9是示出本實(shí)施方式的內(nèi)容數(shù)據(jù)生成服務(wù)器1的系統(tǒng)控制部20的樹搜索處理中的處理例的流程圖。如圖9所示,系統(tǒng)控制部20首先判定所指定的節(jié)點(diǎn)的種類(步驟S31)。此時(shí),系統(tǒng)控制部20在所指定的節(jié)點(diǎn)的種類是DIV節(jié)點(diǎn)或TABLE節(jié)點(diǎn)(分塊化節(jié)點(diǎn))的情況下,即發(fā)現(xiàn)了內(nèi)容數(shù)據(jù)塊的情況下(步驟S31 :DIV或TABLE),轉(zhuǎn)移到步驟S32。在步驟S32中,系統(tǒng)控制部20對塊數(shù)NUM加1,并且對層級LV加1。接著,系統(tǒng)控制部20將塊編號BN[LV]設(shè)定為NUM(步驟S33)。塊編號BN[LV]是當(dāng)前搜索中的節(jié)點(diǎn)所屬的層級LV所表示的內(nèi)容數(shù)據(jù)塊的塊編號。按照內(nèi)容數(shù)據(jù)塊的發(fā)現(xiàn)順序賦予該塊編號。此外,BN[LV]是全局變量。接著,系統(tǒng)控制部20對與塊編號為BN[LV]的內(nèi)容數(shù)據(jù)塊對應(yīng)的內(nèi)容數(shù)據(jù)塊對應(yīng)信息進(jìn)行初始化(步驟S34)。具體而言,系統(tǒng)控制部20在RAM 19上設(shè)定對內(nèi)容數(shù)據(jù)塊對應(yīng)信息進(jìn)行存儲的區(qū)域,并在該區(qū)域中設(shè)定所取得的HTML文檔的URL。接著,系統(tǒng)控制部20判定在所指定的節(jié)點(diǎn)的子節(jié)點(diǎn)中,是否存在未搜索的子節(jié)點(diǎn) (步驟S3。。此時(shí),在存在未搜索的子節(jié)點(diǎn)的情況下(步驟S35 是),系統(tǒng)控制部20轉(zhuǎn)移到步驟S36。在步驟S36中,系統(tǒng)控制部20指定未搜索的子節(jié)點(diǎn)中的一個(gè)子節(jié)點(diǎn),執(zhí)行樹搜索處理(步驟S37)。系統(tǒng)控制部20在結(jié)束樹搜索處理后,轉(zhuǎn)移到步驟S35。并且,系統(tǒng)控制部20在反復(fù)執(zhí)行步驟S35 S37的處理而結(jié)束所有子節(jié)點(diǎn)的樹搜索處理后(步驟S35:否),轉(zhuǎn)移到步驟S38。另外,系統(tǒng)控制部20在所指定的節(jié)點(diǎn)的子節(jié)點(diǎn)一個(gè)都不存在的情況下,也轉(zhuǎn)移到步驟S38。在步驟S38中,系統(tǒng)控制部20將層級LV減去1,結(jié)束樹搜索處理。在步驟S31中,系統(tǒng)控制部20在所指定的節(jié)點(diǎn)的種類為文本節(jié)點(diǎn)的情況下(步驟 S31 文本),向與塊編號BN[LV]的內(nèi)容數(shù)據(jù)塊對應(yīng)的內(nèi)容數(shù)據(jù)塊對應(yīng)信息中的塊構(gòu)成信息中追加設(shè)定所指定的節(jié)點(diǎn)的內(nèi)容(文本數(shù)據(jù))(步驟S39)。系統(tǒng)控制部20在結(jié)束該處理后,結(jié)束樹搜索處理。在步驟S31中,系統(tǒng)控制部20在所指定的節(jié)點(diǎn)的種類為IMG節(jié)點(diǎn)的情況下(步驟 S31 :IMG),取得作為所指定的節(jié)點(diǎn)的src屬性而設(shè)定的圖像數(shù)據(jù)的URL,向與塊編號BN[LV] 的內(nèi)容數(shù)據(jù)塊對應(yīng)的內(nèi)容數(shù)據(jù)塊對應(yīng)信息中的塊構(gòu)成信息中追加設(shè)定所取得的URL(步驟 S40)。系統(tǒng)控制部20在結(jié)束該處理后,結(jié)束樹搜索處理。在步驟S31中,系統(tǒng)控制部20在所指定的節(jié)點(diǎn)的種類不是DIV節(jié)點(diǎn)、TABLE節(jié)點(diǎn)、 文本節(jié)點(diǎn)和IMG節(jié)點(diǎn)中的任何一個(gè)的情況下(步驟S31 其他),判定在所指定的節(jié)點(diǎn)的子節(jié)點(diǎn)中,是否存在未搜索的子節(jié)點(diǎn)(步驟S41)。此時(shí),系統(tǒng)控制部20在存在未搜索的子節(jié)點(diǎn)的情況下(步驟S41 是),指定未搜索的子節(jié)點(diǎn)中的一個(gè)子節(jié)點(diǎn)(步驟S4》,執(zhí)行樹搜索處理(步驟S4!3)。系統(tǒng)控制部20在結(jié)束樹搜索處理后,轉(zhuǎn)移到步驟S41。另一方面,系統(tǒng)控制部20在結(jié)束了所指定的節(jié)點(diǎn)的所有子節(jié)點(diǎn)的樹搜索處理的情況下,或者在所指定的節(jié)點(diǎn)的子節(jié)點(diǎn)一個(gè)都不存在的情況下(步驟S41 否),結(jié)束樹搜索處理。[1-3-2. Flash內(nèi)容數(shù)據(jù)生成時(shí)]圖10是示出本實(shí)施方式的內(nèi)容數(shù)據(jù)生成服務(wù)器1的系統(tǒng)控制部20的內(nèi)容數(shù)據(jù)生成處理中的處理例的流程圖。在根據(jù)系統(tǒng)管理者的操作從管理終端3發(fā)送來內(nèi)容數(shù)據(jù)生成處理的執(zhí)行請求時(shí), 或者在根據(jù)店鋪工作人員的操作從店鋪終端4發(fā)送來內(nèi)容數(shù)據(jù)生成處理的執(zhí)行請求時(shí),開始內(nèi)容數(shù)據(jù)生成處理。并且,當(dāng)系統(tǒng)管理者或店鋪工作人員指定了作為Flash內(nèi)容數(shù)據(jù)的生成對象的 HTML文檔的URL時(shí),如圖10所示,系統(tǒng)控制部20從管理終端3或店鋪終端4接收所指定的 URL(步驟陽1)。接著,系統(tǒng)控制部20將設(shè)定了接收到的URL的請求發(fā)送到購物服務(wù)器2, 從該購物服務(wù)器2取得HTML文檔(步驟S52)。接著,系統(tǒng)控制部20指定所取得的HTML文檔,執(zhí)行后述的特有內(nèi)容數(shù)據(jù)塊判定處理(步驟S5!3)。在該特有內(nèi)容數(shù)據(jù)塊判定處理中,從所取得的HTML文檔中提取內(nèi)容數(shù)據(jù)塊,判定該HTML文檔所特有的內(nèi)容數(shù)據(jù)塊。接著,系統(tǒng)控制部20取得構(gòu)成被判定為特有的內(nèi)容數(shù)據(jù)塊的各內(nèi)容數(shù)據(jù)(步驟 S54)。此時(shí),系統(tǒng)控制部20在取得文本數(shù)據(jù)的情況下,從與被判定為特有的內(nèi)容數(shù)據(jù)塊對應(yīng)的內(nèi)容數(shù)據(jù)塊對應(yīng)信息中取得文本數(shù)據(jù)。另一方面,系統(tǒng)控制部20在取得圖像數(shù)據(jù)的情況下,從與被判定為特有的內(nèi)容數(shù)據(jù)塊對應(yīng)的內(nèi)容數(shù)據(jù)塊對應(yīng)信息中取得圖像數(shù)據(jù)的URL, 將設(shè)定了所取得的URL的請求發(fā)送到購物服務(wù)器2,由此從購物服務(wù)器2取得登記在商品詳細(xì)頁面數(shù)據(jù)庫201中的圖像數(shù)據(jù)。接著,系統(tǒng)控制部20指定所取得的所有內(nèi)容數(shù)據(jù),執(zhí)行后述的Flash內(nèi)容數(shù)據(jù)生成處理(步驟S55)。接著,系統(tǒng)控制部20將Flash內(nèi)容數(shù)據(jù)生成處理中生成的Flash內(nèi)容數(shù)據(jù)發(fā)送到生成請求源的管理終端3或店鋪終端4 (步驟S56)。系統(tǒng)控制部20在結(jié)束該處理后,結(jié)束內(nèi)容數(shù)據(jù)生成處理。圖11是示出本實(shí)施方式的內(nèi)容數(shù)據(jù)生成服務(wù)器1的系統(tǒng)控制部20的特有內(nèi)容數(shù)據(jù)塊判定處理中的處理例的流程圖。如圖11所示,系統(tǒng)控制部20首先與單頁對應(yīng)提取處理同樣地,生成所取得的HTML 文檔的DOM樹(步驟S61),將塊數(shù)NUM和層級LV設(shè)定為0 (步驟S6》,指定DOM樹的路由節(jié)點(diǎn)(步驟S6!3),執(zhí)行樹搜索處理(步驟S64)。接著,系統(tǒng)控制部20將塊編號i設(shè)定為1 (步驟S6Q。接著,系統(tǒng)控制部20計(jì)算塊編號i的內(nèi)容數(shù)據(jù)塊的出現(xiàn)頻度(步驟S66)。具體而言,系統(tǒng)控制部20對樹搜索處理中生成的內(nèi)容數(shù)據(jù)塊對應(yīng)信息i (與塊編號i的內(nèi)容數(shù)據(jù)塊對應(yīng)的內(nèi)容數(shù)據(jù)塊對應(yīng)信息)的塊構(gòu)成信息、和登記在素材提取數(shù)據(jù)庫 101中的各內(nèi)容數(shù)據(jù)塊對應(yīng)信息的塊構(gòu)成信息進(jìn)行比較。此時(shí),系統(tǒng)控制部20在塊構(gòu)成信息的內(nèi)容一致的情況下,將出現(xiàn)次數(shù)計(jì)數(shù)為1次。此時(shí),系統(tǒng)控制部20可以忽視塊構(gòu)成信息中的內(nèi)容數(shù)據(jù)的規(guī)定順序。此時(shí),系統(tǒng)控制部20也可以在登記于素材提取數(shù)據(jù)庫101中的內(nèi)容數(shù)據(jù)塊對應(yīng)信息的塊構(gòu)成信息中規(guī)定的一部分內(nèi)容數(shù)據(jù)與內(nèi)容數(shù)據(jù)塊對應(yīng)信息i的塊構(gòu)成信息中規(guī)定的全部內(nèi)容數(shù)據(jù)一致的情況下,將出現(xiàn)次數(shù)計(jì)數(shù)為1次。并且,系統(tǒng)控制部20在對內(nèi)容數(shù)據(jù)塊對應(yīng)信息的塊構(gòu)成信息中規(guī)定的文本數(shù)據(jù)彼此進(jìn)行比較時(shí),可以不對文本數(shù)據(jù)所表示的文章等自身是否一致進(jìn)行判定,而是對由該文章等表現(xiàn)的實(shí)質(zhì)性內(nèi)容進(jìn)行比較。例如,系統(tǒng)控制部20可以進(jìn)行各個(gè)文本數(shù)據(jù)的詞素分析等來從文本數(shù)據(jù)中提取單詞,并對提取出的單詞彼此進(jìn)行比較。并且,系統(tǒng)控制部20可以在所有單詞一致的情況下判斷為文本數(shù)據(jù)彼此一致,也可以在單詞以預(yù)定比例以上一致的情況下判斷為文本數(shù)據(jù)彼此一致。系統(tǒng)控制部20以這種方式對內(nèi)容數(shù)據(jù)塊對應(yīng)信息i的塊構(gòu)成信息、和登記在素材提取數(shù)據(jù)庫101中的所有內(nèi)容數(shù)據(jù)塊對應(yīng)信息的塊構(gòu)成信息進(jìn)行比較,計(jì)算出現(xiàn)頻度。系統(tǒng)控制部20在計(jì)算出現(xiàn)頻度后,對塊編號i加1 (步驟S67),判定塊編號i是否大于塊數(shù)NUM的值(步驟S68)。此時(shí),系統(tǒng)控制部20在塊編號i為塊數(shù)NUM的值以下的情況下(步驟S68:否),轉(zhuǎn)移到步驟S66。并且,系統(tǒng)控制部20在計(jì)算出樹搜索處理中提取出的所有內(nèi)容數(shù)據(jù)塊的出現(xiàn)頻度后(步驟S68 是),轉(zhuǎn)移到步驟S69。在步驟S69中,系統(tǒng)控制部20對從內(nèi)容數(shù)據(jù)塊1到塊數(shù)NUM所表示的塊編號為止的所有內(nèi)容數(shù)據(jù)塊的出現(xiàn)頻度彼此進(jìn)行比較,將出現(xiàn)頻度最小的內(nèi)容數(shù)據(jù)塊判定為特有的內(nèi)容數(shù)據(jù)塊(步驟S69)。系統(tǒng)控制部20在結(jié)束該處理后,結(jié)束特有內(nèi)容數(shù)據(jù)塊判定處理。圖12是示出本實(shí)施方式的內(nèi)容數(shù)據(jù)生成服務(wù)器1的系統(tǒng)控制部20的Flash內(nèi)容數(shù)據(jù)生成處理中的處理例的流程圖。另外,在本實(shí)施方式中,作為介紹登載于商品詳細(xì)頁面中的商品的內(nèi)容數(shù)據(jù),以下說明生成Flash內(nèi)容數(shù)據(jù)的例子,該Flash內(nèi)容數(shù)據(jù)對被判定為特有內(nèi)容數(shù)據(jù)塊的內(nèi)容數(shù)據(jù)塊所包含的各內(nèi)容數(shù)據(jù)進(jìn)行幻燈片顯示。如圖12所示,系統(tǒng)控制部20首先調(diào)整所指定的各內(nèi)容數(shù)據(jù)的顯示尺寸(步驟 S71)。例如,系統(tǒng)控制部20調(diào)整圖像數(shù)據(jù)的縱橫像素?cái)?shù)、并且調(diào)整文本數(shù)據(jù)的字體尺寸等, 以便與Flash內(nèi)容數(shù)據(jù)再現(xiàn)時(shí)的實(shí)際顯示尺寸一致。此外,系統(tǒng)控制部20在內(nèi)容數(shù)據(jù)的顯示尺寸遠(yuǎn)大于Flash內(nèi)容數(shù)據(jù)再現(xiàn)時(shí)的實(shí)際顯示尺寸時(shí),將該內(nèi)容數(shù)據(jù)分割為多個(gè)。此外, 系統(tǒng)控制部20在內(nèi)容數(shù)據(jù)的顯示尺寸遠(yuǎn)小于Flash內(nèi)容數(shù)據(jù)再現(xiàn)時(shí)的實(shí)際顯示尺寸時(shí),將多個(gè)內(nèi)容數(shù)據(jù)結(jié)合為1個(gè)。接著,系統(tǒng)控制部20決定各內(nèi)容數(shù)據(jù)的顯示順序(步驟S7》。各內(nèi)容數(shù)據(jù)的顯示順序基本上和樹搜索處理中與內(nèi)容數(shù)據(jù)塊對應(yīng)信息對應(yīng)的內(nèi)容數(shù)據(jù)的設(shè)定順序相同。艮口, 在HTML文檔中,內(nèi)容數(shù)據(jù)被規(guī)定得越接近該文檔的開頭,顯示順序越靠前。接著,系統(tǒng)控制部20決定各內(nèi)容數(shù)據(jù)的轉(zhuǎn)變方法(步驟S73)。S卩,系統(tǒng)控制部20 在幻燈片顯示中,決定對所顯示的內(nèi)容數(shù)據(jù)進(jìn)行切換時(shí)施加的效果(顯示效果)。作為效果,例如有淡入/淡出、滑動、隨機(jī)塊、移除、無效果等。接著,系統(tǒng)控制部20根據(jù)步驟S71中進(jìn)行調(diào)整后的各內(nèi)容數(shù)據(jù),并根據(jù)步驟S72 和S73中決定的條件來生成Flash內(nèi)容數(shù)據(jù)(步驟S74)。系統(tǒng)控制部20在結(jié)束該處理后, 結(jié)束Flash內(nèi)容數(shù)據(jù)生成處理。如以上所說明的那樣,根據(jù)本實(shí)施方式,內(nèi)容數(shù)據(jù)生成服務(wù)器1的系統(tǒng)控制部20 提取構(gòu)成與所指定的URL對應(yīng)的商品詳細(xì)頁面的內(nèi)容數(shù)據(jù),計(jì)算構(gòu)成與所指定的URL對應(yīng)的商品詳細(xì)頁面的各內(nèi)容數(shù)據(jù)的出現(xiàn)頻度,將構(gòu)成與所指定的URL對應(yīng)的商品詳細(xì)頁面的內(nèi)容數(shù)據(jù)中出現(xiàn)頻度最小的內(nèi)容數(shù)據(jù)判斷為該商品詳細(xì)頁面特有的內(nèi)容數(shù)據(jù)。因此,內(nèi)容數(shù)據(jù)的出現(xiàn)頻度越小,內(nèi)容數(shù)據(jù)在所指定的商品詳細(xì)頁面以外越不怎么出現(xiàn),因此,通過判斷出現(xiàn)頻度最小的內(nèi)容數(shù)據(jù),能夠確定所指定的商品詳細(xì)頁面特有的內(nèi)容數(shù)據(jù)。因此,能夠容易地提取商品詳細(xì)頁面特有的內(nèi)容數(shù)據(jù)。此外,內(nèi)容數(shù)據(jù)生成服務(wù)器1的系統(tǒng)控制部20根據(jù)被判斷為商品詳細(xì)頁面特有的內(nèi)容數(shù)據(jù)的內(nèi)容數(shù)據(jù)來生成Flash內(nèi)容數(shù)據(jù)。因此,能夠生成截取地表現(xiàn)登載于該商品詳細(xì)頁面中的商品內(nèi)容等或者表現(xiàn)該內(nèi)容的特征的內(nèi)容數(shù)據(jù)。此外,內(nèi)容數(shù)據(jù)生成服務(wù)器1的系統(tǒng)控制部20計(jì)算各內(nèi)容數(shù)據(jù)在購物站點(diǎn)所包含的多個(gè)商品詳細(xì)頁面上的出現(xiàn)頻度。因此,通過計(jì)算構(gòu)成所指定的商品詳細(xì)頁面的各內(nèi)容數(shù)據(jù)在購物站點(diǎn)所包含的多個(gè)網(wǎng)頁上的出現(xiàn)頻度,能夠判定出購物站點(diǎn)內(nèi)共同使用的內(nèi)容數(shù)據(jù)不是特有的內(nèi)容數(shù)據(jù), 從而能夠提高判斷精度。此外,內(nèi)容數(shù)據(jù)生成服務(wù)器1的系統(tǒng)控制部20針對構(gòu)成購物站點(diǎn)的所有商品詳細(xì)頁面,提取構(gòu)成商品詳細(xì)頁面的內(nèi)容數(shù)據(jù),將表示提取出的內(nèi)容數(shù)據(jù)的內(nèi)容數(shù)據(jù)塊對應(yīng)信息預(yù)先登記到素材提取數(shù)據(jù)庫101中,并根據(jù)登記在素材提取數(shù)據(jù)庫101中的各內(nèi)容數(shù)據(jù)塊對應(yīng)信息,計(jì)算構(gòu)成與所指定的URL對應(yīng)的商品詳細(xì)頁面的各內(nèi)容數(shù)據(jù)塊的出現(xiàn)頻度。因此,根據(jù)所有的商品詳細(xì)頁面來計(jì)算出現(xiàn)頻度,因而能夠提高判斷特有的內(nèi)容數(shù)據(jù)的精度。此外,內(nèi)容數(shù)據(jù)生成服務(wù)器1的系統(tǒng)控制部20以由1個(gè)以上的內(nèi)容數(shù)據(jù)構(gòu)成的內(nèi)容數(shù)據(jù)塊為單位,提取構(gòu)成商品詳細(xì)頁面的內(nèi)容數(shù)據(jù),計(jì)算構(gòu)成與所指定的URL對應(yīng)的商品詳細(xì)頁面的各內(nèi)容數(shù)據(jù)塊的出現(xiàn)頻度,將構(gòu)成與所指定的URL對應(yīng)的商品詳細(xì)頁面的內(nèi)容數(shù)據(jù)塊中出現(xiàn)頻度最小的內(nèi)容數(shù)據(jù)塊判斷為該商品詳細(xì)頁面特有的內(nèi)容數(shù)據(jù)塊。因此,在商品詳細(xì)頁面上,例如像標(biāo)題部分、導(dǎo)航部分、表示商品的詳細(xì)情況的部分、表示商品購買時(shí)的一般注意事項(xiàng)等的部分、版權(quán)顯示的部分等那樣,在1個(gè)以上的內(nèi)容數(shù)據(jù)集中地作為內(nèi)容數(shù)據(jù)塊進(jìn)行顯示的情況下,能夠提取出商品詳細(xì)頁面特有的內(nèi)容數(shù)據(jù)塊。此外,內(nèi)容數(shù)據(jù)生成服務(wù)器1的系統(tǒng)控制部20根據(jù)商品詳細(xì)頁面的HTML文檔提取構(gòu)成該商品詳細(xì)頁面的內(nèi)容數(shù)據(jù),在HTML文檔中根據(jù)DIV標(biāo)簽或TABLE標(biāo)簽來確定內(nèi)容數(shù)據(jù)塊。因此,能夠根據(jù)DIV標(biāo)簽,確定在HTML文檔生成時(shí)明確地分塊后的1個(gè)以上的內(nèi)容數(shù)據(jù),并且能夠利用TABLE標(biāo)簽來確定用表形式進(jìn)行分塊而表示的1個(gè)以上的內(nèi)容數(shù)據(jù), 因此,例如在利用這些標(biāo)簽對商品詳細(xì)頁面特有的內(nèi)容數(shù)據(jù)和非特有內(nèi)容數(shù)據(jù)進(jìn)行分塊化的情況下,能夠提高判斷網(wǎng)頁特有的內(nèi)容數(shù)據(jù)的精度。另外,在上述第1實(shí)施方式中,對與構(gòu)成所指定的商品詳細(xì)頁面的各內(nèi)容數(shù)據(jù)塊對應(yīng)的內(nèi)容數(shù)據(jù)塊對應(yīng)信息、和登記在素材提取數(shù)據(jù)庫101中的所有內(nèi)容數(shù)據(jù)塊對應(yīng)信息進(jìn)行比較來計(jì)算各出現(xiàn)頻度。即,在計(jì)算構(gòu)成所指定的商品詳細(xì)頁面的各內(nèi)容數(shù)據(jù)塊的出現(xiàn)頻度時(shí),計(jì)算在以購物站點(diǎn)所包含的所有商品詳細(xì)頁面為對象的范圍內(nèi)出現(xiàn)的頻度,但是也可以不以所有商品詳細(xì)頁面為對象。例如,可以構(gòu)成為能夠指定作為對象的店鋪,計(jì)算在以與所指定的店鋪對應(yīng)的所有商品詳細(xì)頁面為對象的范圍內(nèi)出現(xiàn)的頻度。此外,例如也可以將預(yù)定頁面數(shù)量的商品詳細(xì)頁面設(shè)為對象。此外,可以不從各商品詳細(xì)頁面預(yù)先提取內(nèi)容數(shù)據(jù)塊。例如,只要在Flash內(nèi)容數(shù)據(jù)生成時(shí),針對計(jì)算出現(xiàn)頻度所需的各商品詳細(xì)頁面提取內(nèi)容數(shù)據(jù)塊即可。此外,在上述第1實(shí)施方式中,在由系統(tǒng)管理者或店鋪工作人員指定了商品詳細(xì)頁面的HTML文檔的URL時(shí),生成了 Flash內(nèi)容數(shù)據(jù),但是,例如也可以在生成了新的商品詳細(xì)頁面時(shí)、或更新了商品詳細(xì)頁面時(shí),生成與新生成或更新后的商品詳細(xì)頁面相關(guān)的Flash 內(nèi)容數(shù)據(jù)。此外,在上述第1實(shí)施方式中,僅將出現(xiàn)頻度最小的內(nèi)容數(shù)據(jù)塊作為網(wǎng)頁特有的內(nèi)容數(shù)據(jù),但是,例如也可以將從出現(xiàn)頻度最小的內(nèi)容數(shù)據(jù)塊到第N(N為2以上的自然數(shù)) 小的內(nèi)容數(shù)據(jù)的N個(gè)內(nèi)容數(shù)據(jù)塊作為網(wǎng)頁特有的內(nèi)容數(shù)據(jù)塊。這例如適用于進(jìn)行期望處理所需的內(nèi)容數(shù)據(jù)塊的個(gè)數(shù)被預(yù)先設(shè)定為2個(gè)以上的情況。此外,例如將進(jìn)行期望處理所需的內(nèi)容數(shù)據(jù)(不是內(nèi)容數(shù)據(jù)塊)的個(gè)數(shù)預(yù)先設(shè)定為2個(gè)以上的情況下,也可以進(jìn)行如下處理在僅借助出現(xiàn)頻度最小的內(nèi)容數(shù)據(jù)塊所包含的內(nèi)容數(shù)據(jù)不夠時(shí),將出現(xiàn)頻度第2小的內(nèi)容數(shù)據(jù)塊追加認(rèn)定為網(wǎng)頁特有的內(nèi)容數(shù)據(jù),在僅借助出現(xiàn)頻度最小的內(nèi)容數(shù)據(jù)塊和第2 小的內(nèi)容數(shù)據(jù)塊所包含的內(nèi)容數(shù)據(jù)不夠時(shí),將出現(xiàn)頻度第3小的內(nèi)容數(shù)據(jù)塊追加認(rèn)定為網(wǎng)頁特有的內(nèi)容數(shù)據(jù)。此外,在上述第1實(shí)施方式中,使用網(wǎng)頁特有的內(nèi)容數(shù)據(jù)來生成Flash內(nèi)容數(shù)據(jù), 但是,也可以生成Flash內(nèi)容數(shù)據(jù)以外的內(nèi)容數(shù)據(jù)(例如動態(tài)圖像數(shù)據(jù)、靜態(tài)圖像數(shù)據(jù)、電子文檔等)。此外,作為網(wǎng)頁特有的內(nèi)容數(shù)據(jù)的用途,不限于新的內(nèi)容數(shù)據(jù)的生成。例如,也可以判定網(wǎng)頁特有的圖像數(shù)據(jù),將被判定為特有圖像數(shù)據(jù)的圖像數(shù)據(jù)作為代表該網(wǎng)頁的圖像數(shù)據(jù)顯示到檢索結(jié)果等中。[2.第2實(shí)施方式]下面,參照附圖來詳細(xì)說明本發(fā)明的實(shí)施方式。另外,以下說明的實(shí)施方式是將本發(fā)明應(yīng)用于提供博客服務(wù)的博客系統(tǒng)中進(jìn)行博客頁面發(fā)送的服務(wù)器裝置時(shí)的實(shí)施方式。[2-1.博客系統(tǒng)的結(jié)構(gòu)和功能概要]首先,使用圖13對本實(shí)施方式的博客系統(tǒng)BS的結(jié)構(gòu)和功能概要進(jìn)行說明。圖13是示出本實(shí)施方式的博客系統(tǒng)BS的概要結(jié)構(gòu)的一例的圖。在圖13中,針對與圖1相同的要素標(biāo)注相同標(biāo)號。如圖13所示,博客系統(tǒng)BS構(gòu)成為包含作為特有內(nèi)容數(shù)據(jù)判定裝置和關(guān)聯(lián)內(nèi)容數(shù)據(jù)插入裝置的一例的博客服務(wù)器6、管理終端3和多個(gè)用戶終端5。并且,博客服務(wù)器6和各用戶終端5可經(jīng)由網(wǎng)絡(luò)NW,例如使用通信協(xié)議中的TCP/IP等相互進(jìn)行數(shù)據(jù)的收發(fā)。此外,博客服務(wù)器6和管理終端3經(jīng)由LAN等網(wǎng)絡(luò)進(jìn)行連接。在這種結(jié)構(gòu)的博客系統(tǒng)BS中,博客服務(wù)器6是根據(jù)來自用戶終端5的請求,發(fā)送構(gòu)成博客服務(wù)站點(diǎn)的網(wǎng)頁的Web服務(wù)器。當(dāng)利用用戶終端5的用戶進(jìn)行了博客服務(wù)站點(diǎn)的用戶登記時(shí),該用戶能夠在該博客服務(wù)站點(diǎn)中對用戶自身的博客進(jìn)行管理。并且,進(jìn)行用戶登記后的用戶(博主)能夠訪問博客服務(wù)站點(diǎn),對自身的博客進(jìn)行更新(追加博客消息(每 1件博客的記錄))。因此,博客服務(wù)器6響應(yīng)于博客的更新,生成或更新登載有1個(gè)或多個(gè)博客消息的博客頁面,作為博客的網(wǎng)頁。并且,博客服務(wù)器6具有博客頁面數(shù)據(jù)庫601,并將博客頁面登記到該博客頁面數(shù)據(jù)庫601中。此外,博客服務(wù)器6對由系統(tǒng)管理者指定的博主的博客頁面插入廣告內(nèi)容數(shù)據(jù) (關(guān)聯(lián)內(nèi)容數(shù)據(jù)的一例)。作為廣告內(nèi)容數(shù)據(jù),例如有廣告文章的文本數(shù)據(jù)、橫幅廣告的圖像數(shù)據(jù)、動態(tài)圖像數(shù)據(jù)、由Adobe Flash (商標(biāo))或Silverlight (商標(biāo))等生成的富互聯(lián)網(wǎng)應(yīng)用(RIA)等。插入到各博客頁面的廣告內(nèi)容數(shù)據(jù)是表示與商品或服務(wù)相關(guān)的廣告的內(nèi)容數(shù)據(jù),該商品或服務(wù)與對象的博客頁面中登載的博客消息相關(guān)聯(lián)。因此,博客服務(wù)器6具有登記有多個(gè)廣告內(nèi)容數(shù)據(jù)的廣告數(shù)據(jù)庫602。并且,博客服務(wù)器6從博客頁面中提取博客消息,進(jìn)一步從博客消息中提取特征詞,選擇與提取出的特征詞相關(guān)聯(lián)的廣告內(nèi)容數(shù)據(jù)。用戶終端5是作為博主的用戶、或閱覽博客的博主所使用的終端裝置。作為用戶終端5,例如可采用個(gè)人計(jì)算機(jī)、PDA、移動電話機(jī)等。管理終端3是博客系統(tǒng)BS的系統(tǒng)管理者所使用的終端裝置。作為管理終端3,例如可采用個(gè)人計(jì)算機(jī)等。[2-2.博客服務(wù)器的結(jié)構(gòu)和功能]接著,使用圖14對博客服務(wù)器6的結(jié)構(gòu)和功能進(jìn)行說明。圖14是示出本實(shí)施方式的博客服務(wù)器6的概要結(jié)構(gòu)的一例的框圖。此外,圖15 是示出從指定博主到在博客頁面中插入廣告內(nèi)容數(shù)據(jù)為止的處理的概要的圖。此外,圖16 是示出網(wǎng)頁的結(jié)構(gòu)例的圖。并且,圖17是示出從HTML文檔生成的DOM樹的一例的圖。此外,圖18是示出存儲在存儲部65中的內(nèi)容數(shù)據(jù)塊對應(yīng)信息的內(nèi)容的一例的圖。如圖14所示,博客服務(wù)器6具有操作部61、顯示部62、通信部63、驅(qū)動部64、作為存儲單元的一例的存儲部65、輸入輸出接口部66和系統(tǒng)控制部70。并且,系統(tǒng)控制部70 和輸入輸出接口部66經(jīng)由系統(tǒng)總線71進(jìn)行連接。操作部61例如由鍵盤、鼠標(biāo)等構(gòu)成,受理來自系統(tǒng)管理者等的操作指示,并將其指示內(nèi)容作為指示信號輸出到系統(tǒng)控制部70。顯示部62例如由CRT顯示器、液晶顯示器等構(gòu)成,顯示字符或圖像等信息。通信部63連接到網(wǎng)絡(luò)NW等,對與管理終端3、用戶終端5 等之間的通信狀態(tài)進(jìn)行控制。驅(qū)動部64例如從軟盤、CD、DVD等盤式DK中讀出數(shù)據(jù)等,另一方面,向該盤式DK中記錄數(shù)據(jù)等。存儲部65例如由硬盤驅(qū)動器等構(gòu)成,存儲各種程序和數(shù)據(jù)等。此外,在存儲部65 中構(gòu)建有博客頁面數(shù)據(jù)庫601和廣告數(shù)據(jù)庫602。在博客頁面數(shù)據(jù)庫601中,例如與其頁面的URL和作為博主識別信息的用戶ID對應(yīng)地登記有構(gòu)成博客服務(wù)站點(diǎn)的各博客頁面(博客頁面的HTML文檔(文檔數(shù)據(jù)的一例)、作為博客頁面的素材的圖像數(shù)據(jù)等)。在廣告數(shù)據(jù)庫602中,與和該廣告內(nèi)容數(shù)據(jù)的廣告對象的商品或服務(wù)相關(guān)聯(lián)的關(guān)鍵詞對應(yīng)地登記有多個(gè)廣告內(nèi)容數(shù)據(jù)。此處,在廣告內(nèi)容數(shù)據(jù)中包含有文本數(shù)據(jù)以外的內(nèi)容數(shù)據(jù)的情況下,還對應(yīng)地登記有該內(nèi)容數(shù)據(jù)的URL。此外,為了在用戶選擇了顯示在博客頁面上的廣告內(nèi)容數(shù)據(jù)時(shí)移動到與廣告對象的商品或服務(wù)相關(guān)的網(wǎng)頁,還對應(yīng)地登記有該網(wǎng)頁的URL。輸入輸出接口部66進(jìn)行操作部61 存儲部65與系統(tǒng)控制部70之間的接口處理。 系統(tǒng)控制部70由CPU 67、ROM 68和RAM 69等構(gòu)成。系統(tǒng)控制部70通過CPU 67讀出并執(zhí)行存儲在ROM 68和存儲部65中的各種程序來控制博客服務(wù)器6的各個(gè)部分。此外,系統(tǒng)控制部70通過執(zhí)行廣告內(nèi)容數(shù)據(jù)插入軟件(特有內(nèi)容數(shù)據(jù)判定程序的一例),從而作為提取單元、計(jì)算單元、判定單元和插入單元發(fā)揮功能。另外,廣告內(nèi)容數(shù)據(jù)插入軟件等例如可經(jīng)由網(wǎng)絡(luò)NW從其他服務(wù)器裝置等中取得, 也可以記錄到⑶-ROM等盤式DK中并經(jīng)由驅(qū)動部64讀入。廣告內(nèi)容數(shù)據(jù)插入軟件是用于將廣告內(nèi)容數(shù)據(jù)插入到博客頁面的程序。如圖15 所示,廣告內(nèi)容數(shù)據(jù)插入軟件由管理部、素材提取引擎、文章分析引擎和廣告選擇部等構(gòu)成。管理部控制素材提取引擎、文章分析引擎和廣告選擇部的執(zhí)行。素材提取引擎是用于實(shí)現(xiàn)如下目的的軟件從博客頁面的HTML文檔中提取作為Web素材的內(nèi)容數(shù)據(jù),并且判定博客頁面特有的內(nèi)容數(shù)據(jù)。內(nèi)容數(shù)據(jù)的提取是以內(nèi)容數(shù)據(jù)塊(內(nèi)容數(shù)據(jù)組的一例)為單位進(jìn)行的。在本實(shí)施方式中,例如,包含其消息特有的內(nèi)容的博客消息相當(dāng)于博客頁面特有的內(nèi)容數(shù)據(jù)塊。文章分析引擎是用于從作為博客頁面特有的內(nèi)容數(shù)據(jù)而提取出的博客消息中提取該博客頁面的特征詞的軟件。廣告選擇部是將提取出的特征詞作為關(guān)鍵詞來選擇與博客頁面相關(guān)聯(lián)的廣告內(nèi)容數(shù)據(jù)的軟件。以下,對廣告內(nèi)容數(shù)據(jù)的插入概要進(jìn)行說明。如圖15所示,由系統(tǒng)管理者指定對象的博主的用戶ID(I)。于是,系統(tǒng)控制部70從博客頁面數(shù)據(jù)庫601中取得與所指定的用戶ID對應(yīng)的所有博客頁面的HTML文檔并進(jìn)行分析,以內(nèi)容數(shù)據(jù)塊為單位提取作為Web素材的內(nèi)容數(shù)據(jù)。并且,針對作為其提取結(jié)果提取出的每個(gè)內(nèi)容數(shù)據(jù)塊生成內(nèi)容數(shù)據(jù)塊對應(yīng)信息(內(nèi)容數(shù)據(jù)信息的一例M2)。接著,系統(tǒng)控制部70計(jì)算提取出的各內(nèi)容數(shù)據(jù)塊在與所指定的用戶ID對應(yīng)的所有博客頁面中的出現(xiàn)頻度。本實(shí)施方式中計(jì)算的出現(xiàn)頻度例如是出現(xiàn)次數(shù)(回?cái)?shù))。并且,系統(tǒng)控制部70根據(jù)出現(xiàn)頻度,判定各博客頁面特有的內(nèi)容數(shù)據(jù)塊。具體而言,系統(tǒng)控制部70將各博客頁面中出現(xiàn)頻度為預(yù)定閾值以下的內(nèi)容數(shù)據(jù)塊判定為該博客頁面特有的內(nèi)容數(shù)據(jù)塊(3)。系統(tǒng)控制部70對被判定為特有內(nèi)容數(shù)據(jù)塊的內(nèi)容數(shù)據(jù)塊、即博客消息進(jìn)行詞素分析等分析,提取每個(gè)博客頁面的特征詞。作為特征詞的提取方法,存在各種方法,并且是公知的,因此省略詳細(xì)說明。作為一例,將出現(xiàn)頻度最高的單詞設(shè)為特征詞。接著,系統(tǒng)控制部70參照廣告數(shù)據(jù)庫602,選擇與提取出的特征詞相關(guān)聯(lián)的廣告內(nèi)容數(shù)據(jù)(5)。接著,系統(tǒng)控制部70在博客頁面的HTML文檔中插入用于將所選擇的廣告內(nèi)容數(shù)據(jù)插入到博客頁面而進(jìn)行顯示的規(guī)定(標(biāo)簽或數(shù)據(jù)自身的描述等)。接著,對內(nèi)容數(shù)據(jù)塊的提取方法進(jìn)行說明。另外,在本實(shí)施方式中,提取文本數(shù)據(jù)和圖像數(shù)據(jù)作為Web素材。例如,博客頁面的結(jié)構(gòu)(布局)如圖16所示。作為Web素材的各內(nèi)容數(shù)據(jù)在博客頁面上,分別按照每個(gè)集合(塊)進(jìn)行顯示。該各個(gè)集合相當(dāng)于內(nèi)容數(shù)據(jù)塊。利用HTML文檔所描述的DIV標(biāo)簽和TABLE標(biāo)簽(預(yù)定的標(biāo)簽的一例)將各內(nèi)容數(shù)據(jù)分別分為內(nèi)容數(shù)據(jù)塊。即,各內(nèi)容數(shù)據(jù)利用DIV標(biāo)簽和TABLE標(biāo)簽而分塊化(分組化)。在圖16中,顯示了內(nèi)容數(shù)據(jù)塊701 706。內(nèi)容數(shù)據(jù)塊701例如是頁面的標(biāo)題部分的內(nèi)容數(shù)據(jù)塊,由文本A和圖像a構(gòu)成。此外,內(nèi)容數(shù)據(jù)塊702例如是用于移動到其他網(wǎng)頁的導(dǎo)航部分的內(nèi)容數(shù)據(jù)塊,例如由表示接向其他網(wǎng)頁的鏈接的文本B、文本C和文本D構(gòu)成。此外,內(nèi)容數(shù)據(jù)塊703例如是與博客的顯示區(qū)域?qū)?yīng)的內(nèi)容數(shù)據(jù)塊,由表示博客等的目錄的文本E、內(nèi)容數(shù)據(jù)塊704和內(nèi)容數(shù)據(jù)塊705構(gòu)成。由此,內(nèi)容數(shù)據(jù)塊有時(shí)成為嵌套狀、即
21層級結(jié)構(gòu)。此時(shí),設(shè)內(nèi)容數(shù)據(jù)塊703所包含的內(nèi)容數(shù)據(jù)僅為文本E,內(nèi)容數(shù)據(jù)塊704和內(nèi)容數(shù)據(jù)塊705與內(nèi)容數(shù)據(jù)塊703相獨(dú)立。內(nèi)容數(shù)據(jù)塊704和705分別是1件博客消息。內(nèi)容數(shù)據(jù)塊704由表示博客消息的標(biāo)題和正文的文本F和G構(gòu)成。內(nèi)容數(shù)據(jù)塊705由表示博客消息的標(biāo)題和正文的文本H、I和J、以及與博客消息相關(guān)聯(lián)地由博主登記的圖像b和c構(gòu)成。內(nèi)容數(shù)據(jù)塊706例如是表示版權(quán)顯示的內(nèi)容數(shù)據(jù)塊,由文本I構(gòu)成。這些內(nèi)容數(shù)據(jù)塊中的內(nèi)容數(shù)據(jù)塊701、702、703和706在圖16所示的博客頁面以外的博客頁面上也比較頻繁地出現(xiàn)。另一方面,內(nèi)容數(shù)據(jù)塊704和內(nèi)容數(shù)據(jù)塊705基本上僅用于該博客頁面。因此,將內(nèi)容數(shù)據(jù)塊704或內(nèi)容數(shù)據(jù)塊705判斷為該博客頁面特有的內(nèi)容數(shù)據(jù)塊。在本實(shí)施方式中,需要將與包含該消息特有的內(nèi)容的博客消息相應(yīng)的內(nèi)容數(shù)據(jù)塊判定為特有的內(nèi)容數(shù)據(jù)塊。這種包含特有內(nèi)容的博客消息有時(shí)在1個(gè)頁面內(nèi)包含多個(gè)。因此,將出現(xiàn)頻度為預(yù)定閾值以下的內(nèi)容數(shù)據(jù)塊全部視為特有的內(nèi)容數(shù)據(jù)塊。例如,將閾值的值設(shè)定為1次。于是,將包含特有內(nèi)容的博客消息判定為特有的內(nèi)容數(shù)據(jù)塊,不將僅包含與其他博客消息相同內(nèi)容的博客消息判定為特有的內(nèi)容數(shù)據(jù)塊。此外,標(biāo)題部分、導(dǎo)航部分、 版權(quán)顯示部分等這樣的、各博客頁面中公共的內(nèi)容數(shù)據(jù)塊的出現(xiàn)頻度分別為2次以上,因此也不將這些部分判定為特有的內(nèi)容數(shù)據(jù)塊。另外,將閾值預(yù)先存儲到存儲部65中。圖17用DOM樹、即樹形結(jié)構(gòu)來表示圖16所示的博客頁面的HTML文檔。另外,在圖17所示的DOM樹中,省略了本實(shí)施方式的說明中不需要的標(biāo)簽節(jié)點(diǎn)的圖示。在與第1實(shí)施方式的情況同樣地提取出內(nèi)容數(shù)據(jù)塊后,系統(tǒng)控制部70將表示提取結(jié)果的內(nèi)容數(shù)據(jù)塊對應(yīng)信息臨時(shí)保存到存儲部65中。如圖18所示,針對每個(gè)內(nèi)容數(shù)據(jù)塊保存內(nèi)容數(shù)據(jù)塊對應(yīng)信息(標(biāo)號401)。另外,在本實(shí)施方式中,從被判定為博客頁面特有的內(nèi)容數(shù)據(jù)塊的內(nèi)容數(shù)據(jù)塊、即博客消息中提取特征詞,因此,只要提取文本數(shù)據(jù)即可,可以不提取圖像數(shù)據(jù)。[2-3.博客系統(tǒng)的動作]接著,使用圖19至圖21對博客系統(tǒng)BS的動作進(jìn)行說明。圖19是示出本實(shí)施方式的博客服務(wù)器6的系統(tǒng)控制部70的廣告內(nèi)容數(shù)據(jù)插入處理中的處理例的流程圖。例如在根據(jù)系統(tǒng)管理者的操作從管理終端3發(fā)送來廣告內(nèi)容數(shù)據(jù)插入處理的執(zhí)行請求時(shí),開始廣告內(nèi)容數(shù)據(jù)插入處理。并且,當(dāng)系統(tǒng)管理者指定了管理作為廣告內(nèi)容數(shù)據(jù)插入對象的博客的博主的用戶 ID時(shí),如圖19所示,系統(tǒng)控制部70從管理終端3接收所指定的用戶ID (步驟S101)。接著,系統(tǒng)控制部70將塊數(shù)NUM設(shè)定為0 (步驟S102)。塊數(shù)NUM是當(dāng)前時(shí)刻已發(fā)現(xiàn)的內(nèi)容數(shù)據(jù)塊的個(gè)數(shù)。此外,NUM是全局變量,可從后述的單頁對應(yīng)提取處理和樹搜索處理進(jìn)行訪問。接著,系統(tǒng)控制部70從博客頁面數(shù)據(jù)庫601中取得與接收到的用戶ID對應(yīng)的最初的博客頁面的HTML文檔(步驟S103)。接著,系統(tǒng)控制部70指定所取得的HTML文檔,執(zhí)行后述的單頁對應(yīng)提取處理(步驟S104)。在該單頁對應(yīng)提取處理中,從所取得的HTML文檔中提取內(nèi)容數(shù)據(jù)塊,并保存內(nèi)容數(shù)據(jù)塊對應(yīng)信息。接著,系統(tǒng)控制部70判定是否已提取出與接收到的用戶ID對應(yīng)的所有博客頁面的內(nèi)容數(shù)據(jù)塊(步驟S105)。此時(shí),系統(tǒng)控制部70在存在尚未提取內(nèi)容數(shù)據(jù)塊的博客頁面的情況下(步驟S105 否),從博客頁面數(shù)據(jù)庫601中取得下一個(gè)博客頁面的HTML文檔(步驟S106),進(jìn)而轉(zhuǎn)移到步驟S104。并且,系統(tǒng)控制部70在反復(fù)執(zhí)行步驟S104 S106的處理而提取出所有博客頁面的內(nèi)容數(shù)據(jù)塊后(步驟S105 是),轉(zhuǎn)移到步驟S107。在步驟S107中,系統(tǒng)控制部70確定與接收到的用戶ID對應(yīng)的最初的博客頁面的 HTML文檔。接著,系統(tǒng)控制部70指定所取得的HTML文檔,執(zhí)行后述的特有內(nèi)容數(shù)據(jù)塊判定處理(步驟S108)。在該特有內(nèi)容數(shù)據(jù)塊判定處理中,從所確定的HTML文檔中提取內(nèi)容數(shù)據(jù)塊,判定博客頁面特有的內(nèi)容數(shù)據(jù)塊。接著,系統(tǒng)控制部70從構(gòu)成被判定為特有的內(nèi)容數(shù)據(jù)塊的各文本數(shù)據(jù)中提取博客頁面的特征詞(步驟S109)。接著,系統(tǒng)控制部70根據(jù)提取出的特征詞,將與博客頁面相關(guān)聯(lián)的廣告頁面插入到該博客頁面中(步驟S110)。具體而言,系統(tǒng)控制部70將提取出的特征詞作為關(guān)鍵詞,參照廣告數(shù)據(jù)庫602來選擇與該關(guān)鍵詞對應(yīng)的廣告內(nèi)容數(shù)據(jù)。接著,系統(tǒng)控制部70將所選擇的廣告內(nèi)容數(shù)據(jù)的規(guī)定插入到所確定的HTML文檔上的預(yù)定位置處。 例如,系統(tǒng)控制部70在廣告內(nèi)容數(shù)據(jù)中包含有文本數(shù)據(jù)的情況下,將該文本數(shù)據(jù)的內(nèi)容追加到HTML文檔中。此外,例如,系統(tǒng)控制部70在廣告內(nèi)容數(shù)據(jù)中包含有圖像數(shù)據(jù)的情況下, 將用于顯示該圖像數(shù)據(jù)的IMG標(biāo)簽追加到HTML文檔中。此外,例如,系統(tǒng)控制部70將接向與廣告對象的商品或服務(wù)相關(guān)的網(wǎng)頁的鏈接信息追加到HTML文檔中。系統(tǒng)控制部70在將廣告內(nèi)容數(shù)據(jù)的規(guī)定插入于所確定的HTML文檔后,用該HTML 文檔對登記在博客頁面數(shù)據(jù)庫601中的HTML文檔進(jìn)行更新(步驟S111)。接著,系統(tǒng)控制部70判定是否已在與接收到的用戶ID對應(yīng)的所有博客頁面中插入了廣告內(nèi)容數(shù)據(jù)(步驟S112)。此時(shí),系統(tǒng)控制部70在存在尚未插入廣告內(nèi)容數(shù)據(jù)的博客頁面的情況下(步驟S112:否),確定下一個(gè)博客頁面的HTML文檔(步驟S113),進(jìn)而轉(zhuǎn)移到步驟S108。并且,系統(tǒng)控制部70在反復(fù)執(zhí)行步驟S108 S113的處理而在所有博客頁面中插入了廣告內(nèi)容數(shù)據(jù)后(步驟S112 是),從存儲部65刪除保存在存儲部65中的所有內(nèi)容數(shù)據(jù)塊對應(yīng)信息(步驟S114)。系統(tǒng)控制部70在結(jié)束該處理后,結(jié)束廣告內(nèi)容數(shù)據(jù)插入處理。圖20是示出本實(shí)施方式的博客服務(wù)器6的系統(tǒng)控制部70的單頁對應(yīng)提取處理中的處理例的流程圖。如圖20所示,系統(tǒng)控制部70首先在RAM 69上生成所取得的HTML文檔的DOM樹 (步驟 S121)。接著,系統(tǒng)控制部70將層級LV設(shè)定為0 (步驟S122)。層級LV是DOM樹中當(dāng)前搜索中的節(jié)點(diǎn)所屬的內(nèi)容數(shù)據(jù)塊的層級。LV是全局變量,可從單頁對應(yīng)提取處理和樹搜索處理進(jìn)行訪問。接著,系統(tǒng)控制部70指定DOM樹的路由節(jié)點(diǎn)(步驟S123),執(zhí)行樹搜索處理(步驟 S124)。樹搜索處理的處理內(nèi)容與第1實(shí)施方式的情況相同,因此省略詳細(xì)說明。接著,系統(tǒng)控制部70將通過樹搜索處理生成的各內(nèi)容數(shù)據(jù)塊對應(yīng)信息保存到存儲部65中(步驟S125)。系統(tǒng)控制部70在結(jié)束該處理后,結(jié)束單頁對應(yīng)提取處理。圖21是示出本實(shí)施方式的內(nèi)容數(shù)據(jù)生成服務(wù)器1的系統(tǒng)控制部70的特有內(nèi)容數(shù)據(jù)塊判定處理中的處理例的流程圖。如圖21所示,系統(tǒng)控制部70首先與單頁對應(yīng)提取處理同樣地,生成所指定的HTML 文檔的DOM樹(步驟S161),將塊數(shù)NUM和層級LV設(shè)定為0 (步驟S162),指定DOM樹的路由節(jié)點(diǎn)(步驟S163),執(zhí)行樹搜索處理(步驟S164)。接著,系統(tǒng)控制部70將塊編號i設(shè)定為1 (步驟S165)。接著,系統(tǒng)控制部70計(jì)算塊編號i的內(nèi)容數(shù)據(jù)塊的出現(xiàn)頻度(步驟S166)。具體而言,系統(tǒng)控制部70對步驟S164的樹搜索處理中生成的內(nèi)容數(shù)據(jù)塊對應(yīng)信息i的塊構(gòu)成信息、和保存在存儲部65中的各內(nèi)容數(shù)據(jù)塊對應(yīng)信息的塊構(gòu)成信息進(jìn)行比較,計(jì)算出現(xiàn)頻度。出現(xiàn)頻度的計(jì)算方法與第1實(shí)施方式的情況相同。系統(tǒng)控制部70在計(jì)算了出現(xiàn)頻度后,判定計(jì)算出的出現(xiàn)頻度是否為存儲部65所存儲的閾值以下(步驟S167)。此時(shí),系統(tǒng)控制部70在出現(xiàn)頻度為閾值以下的情況下(步驟S167:是),將塊編號i的內(nèi)容數(shù)據(jù)塊判定為特有的內(nèi)容數(shù)據(jù)塊之一(步驟S168)。艮口, 系統(tǒng)控制部70將塊編號i的內(nèi)容數(shù)據(jù)塊添加到指定的HTML文檔所對應(yīng)的博客頁面特有的內(nèi)容數(shù)據(jù)塊中。系統(tǒng)控制部70在出現(xiàn)頻度大于閾值的情況下(步驟S167 否),或者在結(jié)束了步驟S168的處理的情況下,對塊編號i加1 (步驟S169),判定塊編號i是否大于塊數(shù)NUM的值 (步驟S170)。此時(shí),系統(tǒng)控制部70在塊編號i為塊數(shù)NUM的值以下的情況下(步驟S170: 否),轉(zhuǎn)移到步驟S166。并且,系統(tǒng)控制部70在計(jì)算出樹搜索處理中提取出的所有內(nèi)容數(shù)據(jù)塊的出現(xiàn)頻度后(步驟S170 是),結(jié)束特有內(nèi)容數(shù)據(jù)塊判定處理。另外,雖然系統(tǒng)控制部70是通過步驟S164的樹搜索處理來提取內(nèi)容數(shù)據(jù)塊,但是,由于在源于廣告內(nèi)容數(shù)據(jù)插入處理而執(zhí)行的單頁對應(yīng)提取處理(圖19步驟S104)中, 已針對與接收到的博主的用戶ID對應(yīng)的所有博客頁面提取了內(nèi)容數(shù)據(jù)塊,并將作為其結(jié)果的內(nèi)容數(shù)據(jù)塊對應(yīng)信息存儲到存儲部65中,因此,不用再次提取內(nèi)容數(shù)據(jù)塊。此時(shí),可根據(jù)所指定的HTML文檔的URL,從存儲部65中取得構(gòu)成該HTML文檔所對應(yīng)的博客頁面的各內(nèi)容數(shù)據(jù)塊的內(nèi)容數(shù)據(jù)塊對應(yīng)信息。[2-4.變形例 1]接著,使用圖22來說明本實(shí)施方式的變形例。在之前的說明中,當(dāng)由系統(tǒng)管理者指定了博主時(shí),將廣告內(nèi)容數(shù)據(jù)插入到所指定的博主的博客頁面中,但是也可以在更新了博客后的時(shí)機(jī),插入廣告內(nèi)容數(shù)據(jù)。圖22是示出本實(shí)施方式的變形例的博客服務(wù)器6的系統(tǒng)控制部70的博客更新時(shí)處理中的處理例的流程圖。另外,在圖22中,對與圖19同樣的處理標(biāo)注相同的步驟編號。首先,在博客的更新之前,博主操作用戶終端5而訪問博客服務(wù)站點(diǎn),并輸入自身的用戶ID和密碼而登錄到博客服務(wù)站點(diǎn)。響應(yīng)于該登錄,博客服務(wù)器6對用戶終端5發(fā)布會話ID,將會話ID和用戶ID對應(yīng)起來進(jìn)行管理。由于在從用戶終端5向博客服務(wù)器6的請求中包含有會話ID,因此博客服務(wù)器6能夠確定是來自哪個(gè)博主的請求。并且,當(dāng)博主進(jìn)行了新的博客消息的登記操作時(shí),用戶終端5將博客消息的數(shù)據(jù) (標(biāo)題和正文等文本數(shù)據(jù)、圖像數(shù)據(jù)等)發(fā)送到博客服務(wù)器6,如圖22所示,博客服務(wù)器6 的系統(tǒng)控制部70接收博客消息的數(shù)據(jù)(步驟S171)。接著,系統(tǒng)控制部70從博客頁面數(shù)據(jù)庫601中取得與博主的用戶ID對應(yīng)的博客頁面中應(yīng)更新的博客頁面的HTML文檔(步驟S172)。接著,系統(tǒng)控制部70根據(jù)接收到的博客消息的數(shù)據(jù)來更新所取得的HTML文檔(步驟S173)。例如,系統(tǒng)控制部70在所取得的HTML文檔中追加博客消息用的TABLE標(biāo)簽或 DIV標(biāo)簽,以被該標(biāo)簽夾著的形式,追加接收到的博客消息的標(biāo)題和正文的文本數(shù)據(jù)等。接著,系統(tǒng)控制部70用追加了博客消息的數(shù)據(jù)后的HTML文檔,對登記在博客頁面數(shù)據(jù)庫601 中的HTML文檔進(jìn)行更新(步驟S174)。接著,系統(tǒng)控制部70從與博主的用戶ID對應(yīng)的所有博客頁面中提取內(nèi)容數(shù)據(jù)塊 (步驟 S103 S106)。接著,系統(tǒng)控制部70指定在步驟S173中進(jìn)行更新后的HTML文檔,執(zhí)行特有內(nèi)容數(shù)據(jù)塊判定處理(步驟S108),從構(gòu)成被判定為特有的內(nèi)容數(shù)據(jù)塊的各文本數(shù)據(jù)中提取博客頁面的特征詞(步驟S109)。接著,系統(tǒng)控制部70從所指定的HTML文檔中刪除已有的廣告內(nèi)容數(shù)據(jù)的規(guī)定 (步驟S775),將提取出的特征詞作為關(guān)鍵詞插入相關(guān)聯(lián)的廣告內(nèi)容數(shù)據(jù)的規(guī)定(步驟 S110)。S卩,系統(tǒng)控制部70對顯示在博客頁面上的廣告內(nèi)容數(shù)據(jù)進(jìn)行變更。接著,系統(tǒng)控制部70用插入了廣告內(nèi)容數(shù)據(jù)的規(guī)定后的HTML文檔,對登記在博客頁面數(shù)據(jù)庫601中的HTML文檔進(jìn)行更新(步驟S111),從存儲部65中刪除所有的內(nèi)容數(shù)據(jù)塊對應(yīng)信息(步驟Sl 14)。另外,必須與博客的更新相伴地新生成博客頁面時(shí)的處理也基本與上述處理相同。但是,由于在新生成的博客頁面中尚未插入廣告內(nèi)容數(shù)據(jù),因此不進(jìn)行步驟S175中的廣告內(nèi)容數(shù)據(jù)的規(guī)定的刪除。[2-5.變形例 2]在之前的說明中,作為用于判定博客頁面特有的內(nèi)容數(shù)據(jù)的閾值,設(shè)定為1次,但是也可以將2次以上的值設(shè)定為閾值。例如,在將閾值設(shè)定為1次的情況下,提取出現(xiàn)頻度為1次的內(nèi)容數(shù)據(jù)塊(博客消息)作為博客頁面特有的內(nèi)容數(shù)據(jù),從提取出的博客消息的文本數(shù)據(jù)中提取特征詞。此時(shí), 如果提取出的各博客消息的文本數(shù)據(jù)的數(shù)據(jù)量較少,之后提取的單詞的數(shù)量減少。并且有時(shí),在不能提取出足夠數(shù)量的單詞時(shí),不能完全判斷哪個(gè)單詞是特征詞,或者不能準(zhǔn)確地進(jìn)行判斷。因此,通過提高閾值的值,放寬判定為博客頁面特有的內(nèi)容數(shù)據(jù)的條件,由此增加作為提取特征詞的對象的博客消息。由此,能夠提取出特征詞。具體而言,博客服務(wù)器6的系統(tǒng)控制部70最初將閾值設(shè)定為1次,并判定博客頁面特有的內(nèi)容數(shù)據(jù)塊,由此提取出現(xiàn)次數(shù)為1次的博客消息來提取特征詞。此時(shí),系統(tǒng)控制部70在判定為不能提取出特征詞的情況下,將閾值變更為2次,進(jìn)行博客消息的提取和特征詞的提取。系統(tǒng)控制部70在判定為即使這樣也不能提取出特征詞的情況下,將閾值變更為3次,進(jìn)行博客消息的提取和特征詞的提取。系統(tǒng)控制部70持續(xù)執(zhí)行這種處理,直至能夠提取出特征詞。即,在不能正常地進(jìn)行基于特有內(nèi)容數(shù)據(jù)塊的提取結(jié)果的處理的情況下, 提高閾值。但是,如果無限制地提高閾值,則也提取出并非博客消息的內(nèi)容,因此當(dāng)閾值提高到一定程度時(shí),中斷處理。例如,當(dāng)閾值提高到與所指定的博主對應(yīng)的博客頁面的頁數(shù)的值時(shí),會提取出各博客頁面中共同使用的內(nèi)容數(shù)據(jù)塊,因此,可以在閾值達(dá)到博客頁面的頁數(shù)的值時(shí),中斷處理。
并且例如,當(dāng)設(shè)每隔博客頁面的預(yù)定頁數(shù)僅出現(xiàn)1次的內(nèi)容數(shù)據(jù)塊為博客頁面特有的內(nèi)容數(shù)據(jù)塊時(shí),可以在系統(tǒng)管理者側(cè)預(yù)先進(jìn)行設(shè)定。此時(shí),可以與指定的博主所對應(yīng)的博客頁面的頁數(shù)成比例地改變閾值的出現(xiàn)次數(shù)。[2-6.變形例 3]在之前的說明中,作為用于判定博客頁面特有的內(nèi)容數(shù)據(jù)的閾值,使用了出現(xiàn)次數(shù)(回?cái)?shù)),但是,也可以使用出現(xiàn)次數(shù)相對于與指定的博主對應(yīng)的博客頁面的所有內(nèi)容數(shù)據(jù)塊的比例(相對回?cái)?shù))。例如設(shè)為可由其他用戶對博主登記的博客消息登記評論,且能夠與博客消息一起閱覽評論。該評論的文本數(shù)據(jù)也是構(gòu)成博客頁面的內(nèi)容數(shù)據(jù)之一。博客服務(wù)器6的系統(tǒng)控制部70在將評論的文本數(shù)據(jù)追加到博客頁面時(shí),在該博客頁面的HTML文檔中追加了分塊化標(biāo)簽的描述后,追加該文本數(shù)據(jù),由此使評論的文本數(shù)據(jù)成為與博客消息及其他評論的文本數(shù)據(jù)獨(dú)立的內(nèi)容數(shù)據(jù)塊。并且,系統(tǒng)控制部70在提取了評論的文本數(shù)據(jù)作為內(nèi)容數(shù)據(jù)塊,且提取出的評論的文本數(shù)據(jù)具有特有內(nèi)容的情況下,將與該評論相關(guān)聯(lián)的廣告內(nèi)容數(shù)據(jù)插入到博客頁面中。另外,在對某個(gè)博客消息登記了多條評論的情況下,多條評論的各個(gè)內(nèi)容例如有時(shí)會像多數(shù)派意見和少數(shù)派意見那樣,分為頻繁出現(xiàn)的內(nèi)容和不怎么頻繁出現(xiàn)的內(nèi)容。此時(shí),多數(shù)派意見是一般的意見,可認(rèn)為是不怎么具有特征性的內(nèi)容。另一方面,少數(shù)派意見是特別的意見,可認(rèn)為是博客頁面特有的內(nèi)容。在這種情況下,希望提取出表示少數(shù)派意見的評論作為博客頁面特有的內(nèi)容數(shù)據(jù)。但是,多數(shù)派意見的數(shù)量和少數(shù)派意見的數(shù)量是相對的,隨著評論的總數(shù)而變化。 在這種情況下,在使用回?cái)?shù)作為出現(xiàn)頻度時(shí),例如在將閾值設(shè)為1次時(shí),有時(shí)不能準(zhǔn)確地提取出不頻繁出現(xiàn)的內(nèi)容(少數(shù)派意見)。因此,使用相對回?cái)?shù)作為出現(xiàn)頻度,將閾值設(shè)定為預(yù)定的比例。此時(shí)的閾值可任意地進(jìn)行設(shè)定。例如,在將提取出的內(nèi)容數(shù)據(jù)塊的內(nèi)容分為 N個(gè)模式(N為2以上的整數(shù))的情況下,為了區(qū)別少數(shù)派意見,對于閾值,可以在小于1+N 的范圍內(nèi)設(shè)定閾值。由此,系統(tǒng)控制部70可以根據(jù)各個(gè)時(shí)刻的狀況來變更閾值。另外,作為能夠?qū)Σ┛偷饶菢拥南⒌怯浽u論等的系統(tǒng),例如有其他用戶可針對某個(gè)用戶所登記的微博發(fā)表對其進(jìn)行跟帖的微博的Twitter (商標(biāo))、和電子布告牌等。如以上說明的那樣,根據(jù)本實(shí)施方式,博客服務(wù)器6的系統(tǒng)控制部70提取構(gòu)成通過指定HTML文檔而依次指定的博客頁面的內(nèi)容數(shù)據(jù),計(jì)算構(gòu)成所指定的博客頁面的各內(nèi)容數(shù)據(jù)的出現(xiàn)頻度,將構(gòu)成所指定的博客頁面的內(nèi)容數(shù)據(jù)中出現(xiàn)頻度為預(yù)定閾值以下的內(nèi)容數(shù)據(jù)判斷為該博客頁面特有的內(nèi)容數(shù)據(jù)。因此,內(nèi)容數(shù)據(jù)的出現(xiàn)頻度越小,內(nèi)容數(shù)據(jù)在所指定的博客頁面以外越不怎么出現(xiàn),因此,通過判定出現(xiàn)頻度是否為閾值以下,由此將滿足該條件的所有內(nèi)容數(shù)據(jù)確定為所指定的博客頁面特有的內(nèi)容數(shù)據(jù)。因此,能夠容易地提取出博客頁面特有的內(nèi)容數(shù)據(jù)。此外,博客服務(wù)器6的系統(tǒng)控制部70將與所指定的博客頁面特有的內(nèi)容數(shù)據(jù)相關(guān)聯(lián)的廣告內(nèi)容數(shù)據(jù)插入到該博客頁面中。因此,能夠?qū)⑴c博客頁面的特征相關(guān)聯(lián)的信息追加到網(wǎng)頁中。此外,在構(gòu)成所指定的博客頁面的內(nèi)容數(shù)據(jù)中包含有博客消息的文本數(shù)據(jù)的情況下,博客服務(wù)器6的系統(tǒng)控制部70將該文本數(shù)據(jù)判定為該博客頁面特有的內(nèi)容數(shù)據(jù),從博客消息的文本數(shù)據(jù)中提取該博客頁面的特征詞,并將該特征詞作為關(guān)鍵詞,將預(yù)先關(guān)聯(lián)的廣告內(nèi)容數(shù)據(jù)插入到該博客頁面中。因此,能夠?qū)⑴c博客頁面中登載的博客內(nèi)容相關(guān)聯(lián)的廣告追加到該博客頁面中。此外,博客服務(wù)器6的系統(tǒng)控制部70計(jì)算各內(nèi)容數(shù)據(jù)在博客服務(wù)站點(diǎn)所包含的多個(gè)博客頁面上的出現(xiàn)頻度。因此,通過計(jì)算構(gòu)成所指定的博客頁面的各內(nèi)容數(shù)據(jù)在博客服務(wù)站點(diǎn)所包含的多個(gè)網(wǎng)頁(例如與所指定的博主的用戶ID對應(yīng)的多個(gè)博客頁面)上的出現(xiàn)頻度,能夠判定出博客服務(wù)站點(diǎn)內(nèi)共同使用的內(nèi)容數(shù)據(jù)不是特有的內(nèi)容數(shù)據(jù),從而能夠提高判斷精度。此外,博客服務(wù)器6的系統(tǒng)控制部70以由1個(gè)以上的內(nèi)容數(shù)據(jù)構(gòu)成的內(nèi)容數(shù)據(jù)塊為單位,提取構(gòu)成博客頁面的內(nèi)容數(shù)據(jù),計(jì)算構(gòu)成所指定的博客頁面的各內(nèi)容數(shù)據(jù)塊的出現(xiàn)頻度,將構(gòu)成所指定的博客頁面的內(nèi)容數(shù)據(jù)塊中出現(xiàn)頻度為閾值以下的內(nèi)容數(shù)據(jù)塊判斷為該博客頁面特有的內(nèi)容數(shù)據(jù)塊。因此,在博客頁面上,例如像標(biāo)題部分、導(dǎo)航部分、顯示博客的部分、版權(quán)顯示的部分等那樣,在1個(gè)以上的內(nèi)容數(shù)據(jù)集中地作為內(nèi)容數(shù)據(jù)塊進(jìn)行顯示的情況下,能夠提取出博客頁面特有的內(nèi)容數(shù)據(jù)塊。此外,博客服務(wù)器6的系統(tǒng)控制部70根據(jù)博客頁面的HTML文檔提取構(gòu)成該博客頁面的內(nèi)容數(shù)據(jù),并在HTML文檔中根據(jù)DIV標(biāo)簽或TABLE標(biāo)簽確定內(nèi)容數(shù)據(jù)塊。因此,能夠根據(jù)DIV標(biāo)簽,確定在HTML文檔生成時(shí)明確地分塊后的1個(gè)以上的內(nèi)容數(shù)據(jù),并且,能夠利用TABLE標(biāo)簽確定用表形式進(jìn)行分塊而顯示的1個(gè)以上的內(nèi)容數(shù)據(jù), 因此,例如在利用這些標(biāo)簽對博客頁面特有的內(nèi)容數(shù)據(jù)和非特有內(nèi)容數(shù)據(jù)進(jìn)行分塊的情況下,能夠提高判斷網(wǎng)頁特有的內(nèi)容數(shù)據(jù)的精度。另外,在上述第2實(shí)施方式中,對與構(gòu)成所指定的博客頁面的各內(nèi)容數(shù)據(jù)塊對應(yīng)的內(nèi)容數(shù)據(jù)塊對應(yīng)信息、和構(gòu)成與所指定的博主的用戶ID對應(yīng)的所有博客頁面的各內(nèi)容數(shù)據(jù)塊對應(yīng)信息進(jìn)行比較,由此計(jì)算出各出現(xiàn)頻度。即,在計(jì)算構(gòu)成所指定的博客頁面的各內(nèi)容數(shù)據(jù)塊的出現(xiàn)頻度時(shí),計(jì)算在以與所指定的博主對應(yīng)的所有博客頁面為對象的范圍內(nèi)出現(xiàn)的頻度,但是,對象范圍不限于此。例如,可以將預(yù)定頁數(shù)的博客頁面作為對象,也可以將構(gòu)成博客服務(wù)站點(diǎn)的所有博客頁面作為對象。此外,在上述第2實(shí)施方式中,作為與網(wǎng)頁特有的內(nèi)容數(shù)據(jù)相關(guān)聯(lián)的內(nèi)容數(shù)據(jù),將表示與商品或服務(wù)相關(guān)的廣告的廣告內(nèi)容數(shù)據(jù)插入到該網(wǎng)頁中,但是,只要是相關(guān)聯(lián)的內(nèi)容數(shù)據(jù)即可,不限于廣告內(nèi)容數(shù)據(jù)。例如,也可以插入與被判定為特有內(nèi)容數(shù)據(jù)的博客消息等內(nèi)容數(shù)據(jù)相關(guān)聯(lián)的圖像數(shù)據(jù)(靜態(tài)圖像或動態(tài)圖像)作為背景圖像或插入圖像(插圖等)。具體而言,例如構(gòu)建圖像數(shù)據(jù)用的數(shù)據(jù)庫,并在該數(shù)據(jù)庫中對應(yīng)地登記圖像數(shù)據(jù)和關(guān)鍵詞。與圖像數(shù)據(jù)對應(yīng)的關(guān)鍵詞是表示由該圖像數(shù)據(jù)顯示的圖像的單詞或與該圖像相關(guān)聯(lián)的單詞。并且,從被判定為特有內(nèi)容數(shù)據(jù)的內(nèi)容數(shù)據(jù)中提取特征詞,將提取出的特征詞作為關(guān)鍵詞,從數(shù)據(jù)庫中選擇關(guān)聯(lián)的圖像數(shù)據(jù)。而且,在作為對象的HTML文檔的BODY標(biāo)簽中, 插入所選擇的圖像數(shù)據(jù)的URL作為背景(kickgroimd)屬性,并且在作為對象的HTML文檔的預(yù)定位置處,插入表示所選擇的圖像數(shù)據(jù)的IMG標(biāo)簽。由此,能夠在網(wǎng)頁中插入與被判定為特有內(nèi)容數(shù)據(jù)的博客消息等內(nèi)容數(shù)據(jù)的內(nèi)容相適應(yīng)的圖像。此外,作為網(wǎng)頁特有的內(nèi)容數(shù)據(jù)的用途,不限于將關(guān)聯(lián)的內(nèi)容數(shù)據(jù)插入到網(wǎng)頁中。例如,也可以根據(jù)網(wǎng)頁特有的內(nèi)容數(shù)據(jù)生成新內(nèi)容數(shù)據(jù)。此外,在上述各實(shí)施方式中,作為構(gòu)成網(wǎng)頁的內(nèi)容數(shù)據(jù),提取出文本數(shù)據(jù)和圖像數(shù)據(jù),但是,提取對象的內(nèi)容數(shù)據(jù)不限于這些數(shù)據(jù)。例如,也可以是顯示在網(wǎng)頁上的內(nèi)容數(shù)據(jù)、 或者顯示網(wǎng)頁時(shí)再現(xiàn)的內(nèi)容數(shù)據(jù)(例如動態(tài)圖像數(shù)據(jù)、聲音數(shù)據(jù)、電子文檔等)。此外,也可以僅提取預(yù)定種類的內(nèi)容數(shù)據(jù)。此外,在上述各實(shí)施方式中,分組地提取出被DIV標(biāo)簽夾著的內(nèi)容數(shù)據(jù)以及被 TABLE標(biāo)簽夾著的內(nèi)容數(shù)據(jù),作為內(nèi)容數(shù)據(jù)塊,但是,作為對內(nèi)容數(shù)據(jù)進(jìn)行分組的標(biāo)簽,不限于這些標(biāo)簽。此外,在上述各實(shí)施方式中,以內(nèi)容數(shù)據(jù)塊為單位來提取網(wǎng)頁特有的內(nèi)容數(shù)據(jù),但是也可以直接逐個(gè)地提取各內(nèi)容數(shù)據(jù)。此外,在上述各實(shí)施方式中,將本發(fā)明的特有內(nèi)容數(shù)據(jù)判定裝置應(yīng)用于服務(wù)器裝置,但是,只要能夠從存儲單元或網(wǎng)絡(luò)上取得HTML文檔即可,也可以將特有內(nèi)容數(shù)據(jù)判定裝置應(yīng)用于終端裝置等。此外,在上述各實(shí)施方式中,將本發(fā)明的文檔數(shù)據(jù)應(yīng)用于HTML文檔,但是, 也可以將文檔數(shù)據(jù)應(yīng)用于用標(biāo)記語言描述的表示構(gòu)成網(wǎng)頁的內(nèi)容數(shù)據(jù)的數(shù)據(jù)(例如 XHTML (Extensible HyperText Markup Language 可擴(kuò)展超文本標(biāo)記語言)文檔等)。此外,在上述實(shí)施方式中,提取了構(gòu)成購物站點(diǎn)上的商品詳細(xì)頁面的內(nèi)容數(shù)據(jù)、構(gòu)成博客服務(wù)站點(diǎn)上的博客頁面的內(nèi)容數(shù)據(jù),但是,作為對象的站點(diǎn)和頁面的種類不限于此。標(biāo)號說明1 內(nèi)容數(shù)據(jù)生成服務(wù)器;2 購物服務(wù)器;3 管理終端;4 店鋪終端;5 用戶終端;11 操作部;12 顯示部;13 通信部;14 驅(qū)動部;15 存儲部;16 輸入輸出接口部;17 CPU ;18 =ROM ; 19 =RAM ;20 系統(tǒng)控制部;21 系統(tǒng)總線;101 素材提取數(shù)據(jù)庫;201 商品詳細(xì)頁面數(shù)據(jù)庫;NW 網(wǎng)絡(luò);S 購物系統(tǒng);6 博客服務(wù)器;61 操作部;62 顯示部;63 通信部;64 驅(qū)動部;65 存儲部;66 輸入輸出接口部;67 =CPU ;68 =ROM ;69 =RAM ;60 系統(tǒng)控制部;61 系統(tǒng)總線;601 博客頁面數(shù)據(jù)庫;602 廣告數(shù)據(jù)庫;BS 博客系統(tǒng)。
權(quán)利要求
1.一種特有內(nèi)容數(shù)據(jù)判定程序,其特征在于,該特有內(nèi)容數(shù)據(jù)判定程序使計(jì)算機(jī)作為以下單元發(fā)揮功能提取單元,其提取構(gòu)成所指定的網(wǎng)頁的內(nèi)容數(shù)據(jù);計(jì)算單元,其計(jì)算構(gòu)成所述指定的網(wǎng)頁的各內(nèi)容數(shù)據(jù)的出現(xiàn)頻度;以及判定單元,其根據(jù)所述計(jì)算的出現(xiàn)頻度,判定構(gòu)成所述指定的網(wǎng)頁的內(nèi)容數(shù)據(jù)中該網(wǎng)頁特有的內(nèi)容數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的特有內(nèi)容數(shù)據(jù)判定程序,其特征在于,該特有內(nèi)容數(shù)據(jù)判定程序使所述計(jì)算機(jī)發(fā)揮如下功能所述判定單元將構(gòu)成所述指定的網(wǎng)頁的內(nèi)容數(shù)據(jù)中出現(xiàn)頻度最小的內(nèi)容數(shù)據(jù)判定為該網(wǎng)頁特有的內(nèi)容數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的特有內(nèi)容數(shù)據(jù)判定程序,其特征在于,該特有內(nèi)容數(shù)據(jù)判定程序使所述計(jì)算機(jī)發(fā)揮如下功能所述判定單元將構(gòu)成所述指定的網(wǎng)頁的內(nèi)容數(shù)據(jù)中出現(xiàn)頻度為預(yù)定值以下的內(nèi)容數(shù)據(jù)判定為該網(wǎng)頁特有的內(nèi)容數(shù)據(jù)。
4.根據(jù)權(quán)利要求1 3中的任意一項(xiàng)所述的特有內(nèi)容數(shù)據(jù)判定程序,其特征在于,該特有內(nèi)容數(shù)據(jù)判定程序使所述計(jì)算機(jī)發(fā)揮如下功能所述計(jì)算單元計(jì)算各內(nèi)容數(shù)據(jù)在預(yù)定站點(diǎn)所包含的多個(gè)網(wǎng)頁上的出現(xiàn)頻度。
5.根據(jù)權(quán)利要求1 4中的任意一項(xiàng)所述的特有內(nèi)容數(shù)據(jù)判定程序,其特征在于,該特有內(nèi)容數(shù)據(jù)判定程序使所述計(jì)算機(jī)發(fā)揮如下功能所述提取單元針對所述預(yù)定的站點(diǎn)中包含的預(yù)定種類的各網(wǎng)頁提取構(gòu)成網(wǎng)頁的內(nèi)容數(shù)據(jù),將表示提取出的內(nèi)容數(shù)據(jù)的內(nèi)容數(shù)據(jù)信息預(yù)先存儲到存儲單元中,所述計(jì)算單元根據(jù)所述存儲的內(nèi)容數(shù)據(jù)信息,計(jì)算構(gòu)成所述指定的網(wǎng)頁的各內(nèi)容數(shù)據(jù)的出現(xiàn)頻度。
6.根據(jù)權(quán)利要求1 5中的任意一項(xiàng)所述的特有內(nèi)容數(shù)據(jù)判定程序,其特征在于,該特有內(nèi)容數(shù)據(jù)判定程序使所述計(jì)算機(jī)發(fā)揮如下功能所述提取單元以由1個(gè)以上的內(nèi)容數(shù)據(jù)構(gòu)成的內(nèi)容數(shù)據(jù)組為單位提取構(gòu)成網(wǎng)頁的內(nèi)容數(shù)據(jù),所述計(jì)算單元計(jì)算構(gòu)成所述指定的網(wǎng)頁的內(nèi)容數(shù)據(jù)組的出現(xiàn)頻度,所述判定單元判定構(gòu)成所述指定的網(wǎng)頁的內(nèi)容數(shù)據(jù)組中該網(wǎng)頁特有的內(nèi)容數(shù)據(jù)組。
7.根據(jù)權(quán)利要求6所述的特有內(nèi)容數(shù)據(jù)判定程序,其特征在于,該特有內(nèi)容數(shù)據(jù)判定程序使所述計(jì)算機(jī)發(fā)揮如下功能所述提取單元根據(jù)用預(yù)定的標(biāo)記語言描述的表示構(gòu)成網(wǎng)頁的內(nèi)容數(shù)據(jù)的文檔數(shù)據(jù),提取內(nèi)容數(shù)據(jù)組。
8.根據(jù)權(quán)利要求7所述的特有內(nèi)容數(shù)據(jù)判定程序,其特征在于,該特有內(nèi)容數(shù)據(jù)判定程序使所述計(jì)算機(jī)發(fā)揮如下功能所述提取單元在表示所述內(nèi)容數(shù)據(jù)的文檔數(shù)據(jù)中根據(jù)預(yù)定的標(biāo)簽來確定內(nèi)容數(shù)據(jù)組。
9.根據(jù)權(quán)利要求1 8中的任意一項(xiàng)所述的特有內(nèi)容數(shù)據(jù)判定程序,其特征在于,該特有內(nèi)容數(shù)據(jù)判定程序使所述計(jì)算機(jī)進(jìn)一步作為生成單元發(fā)揮功能,所述生成單元根據(jù)被判定為特有內(nèi)容數(shù)據(jù)的內(nèi)容數(shù)據(jù),生成新內(nèi)容數(shù)據(jù)。
10.根據(jù)權(quán)利要求9所述的特有內(nèi)容數(shù)據(jù)判定程序,其特征在于,該特有內(nèi)容數(shù)據(jù)判定程序使所述計(jì)算機(jī)發(fā)揮如下功能所述生成單元將被判定為特有內(nèi)容數(shù)據(jù)的內(nèi)容數(shù)據(jù)的顯示尺寸調(diào)整為與預(yù)先設(shè)定的顯示尺寸一致,生成包含調(diào)整了顯示尺寸后的內(nèi)容數(shù)據(jù)的新內(nèi)容數(shù)據(jù)。
11.根據(jù)權(quán)利要求9或10所述的特有內(nèi)容數(shù)據(jù)判定程序,其特征在于,該特有內(nèi)容數(shù)據(jù)判定程序使所述計(jì)算機(jī)發(fā)揮如下功能所述生成單元生成對被判定為特有內(nèi)容數(shù)據(jù)的內(nèi)容數(shù)據(jù)施加效果來再現(xiàn)該內(nèi)容數(shù)據(jù)的新內(nèi)容數(shù)據(jù)。
12.根據(jù)權(quán)利要求1 8中的任意一項(xiàng)所述的特有內(nèi)容數(shù)據(jù)判定程序,其特征在于, 該特有內(nèi)容數(shù)據(jù)判定程序使所述計(jì)算機(jī)進(jìn)一步作為插入單元發(fā)揮功能,所述插入單元將與被判定為特有內(nèi)容數(shù)據(jù)的內(nèi)容數(shù)據(jù)相關(guān)聯(lián)的關(guān)聯(lián)內(nèi)容數(shù)據(jù)插入到所述指定的網(wǎng)頁中。
13.根據(jù)權(quán)利要求12所述的特有內(nèi)容數(shù)據(jù)判定程序,其特征在于,該特有內(nèi)容數(shù)據(jù)判定程序使所述計(jì)算機(jī)發(fā)揮如下功能在構(gòu)成所述指定的網(wǎng)頁的內(nèi)容數(shù)據(jù)包含博客消息的文本數(shù)據(jù)的情況下,所述判定單元將該文本數(shù)據(jù)判定為該網(wǎng)頁特有的內(nèi)容數(shù)據(jù),所述插入單元從被所述特有內(nèi)容數(shù)據(jù)判定裝置判定為特有內(nèi)容數(shù)據(jù)的博客消息的文本數(shù)據(jù)中提取所述指定的網(wǎng)頁的特征詞,將與該特征詞相關(guān)聯(lián)的關(guān)聯(lián)內(nèi)容數(shù)據(jù)插入到該網(wǎng)頁中。
14.一種特有內(nèi)容數(shù)據(jù)判定裝置,其特征在于,該特有內(nèi)容數(shù)據(jù)判定裝置具有 提取單元,其提取構(gòu)成所指定的網(wǎng)頁的內(nèi)容數(shù)據(jù);計(jì)算單元,其計(jì)算構(gòu)成所述指定的網(wǎng)頁的各內(nèi)容數(shù)據(jù)的出現(xiàn)頻度;以及判定單元,其根據(jù)所述計(jì)算的出現(xiàn)頻度,判定構(gòu)成所述指定的網(wǎng)頁的內(nèi)容數(shù)據(jù)中該網(wǎng)頁特有的內(nèi)容數(shù)據(jù)。
15.根據(jù)權(quán)利要求14所述的特有內(nèi)容數(shù)據(jù)判定裝置,其特征在于,所述判定單元將構(gòu)成所述指定的網(wǎng)頁的內(nèi)容數(shù)據(jù)中出現(xiàn)頻度最小的內(nèi)容數(shù)據(jù)判定為該網(wǎng)頁特有的內(nèi)容數(shù)據(jù)。
16.根據(jù)權(quán)利要求14所述的特有內(nèi)容數(shù)據(jù)判定裝置,其特征在于,所述判定單元將構(gòu)成所述指定的網(wǎng)頁的內(nèi)容數(shù)據(jù)中出現(xiàn)頻度為預(yù)定值以下的內(nèi)容數(shù)據(jù)判定為該網(wǎng)頁特有的內(nèi)容數(shù)據(jù)。
17.根據(jù)權(quán)利要求14 16中的任意一項(xiàng)所述的特有內(nèi)容數(shù)據(jù)判定裝置,其特征在于, 所述計(jì)算單元計(jì)算各內(nèi)容數(shù)據(jù)在預(yù)定站點(diǎn)所包含的多個(gè)網(wǎng)頁上的出現(xiàn)頻度。
18.根據(jù)權(quán)利要求14 17中的任意一項(xiàng)所述的特有內(nèi)容數(shù)據(jù)判定裝置,其特征在于, 所述提取單元針對所述預(yù)定的站點(diǎn)中包含的預(yù)定種類的各網(wǎng)頁提取構(gòu)成網(wǎng)頁的內(nèi)容數(shù)據(jù),將表示提取出的內(nèi)容數(shù)據(jù)的內(nèi)容數(shù)據(jù)信息預(yù)先存儲到存儲單元中,所述計(jì)算單元根據(jù)所述存儲的內(nèi)容數(shù)據(jù)信息,計(jì)算構(gòu)成所述指定的網(wǎng)頁的各內(nèi)容數(shù)據(jù)的出現(xiàn)頻度。
19.根據(jù)權(quán)利要求14 18中的任意一項(xiàng)所述的特有內(nèi)容數(shù)據(jù)判定裝置,其特征在于, 所述提取單元以由1個(gè)以上的內(nèi)容數(shù)據(jù)構(gòu)成的內(nèi)容數(shù)據(jù)組為單位提取構(gòu)成網(wǎng)頁的內(nèi)容數(shù)據(jù),所述計(jì)算單元計(jì)算構(gòu)成所述指定的網(wǎng)頁的內(nèi)容數(shù)據(jù)組的出現(xiàn)頻度,所述判定單元判定構(gòu)成所述指定的網(wǎng)頁的內(nèi)容數(shù)據(jù)組中該網(wǎng)頁特有的內(nèi)容數(shù)據(jù)組。
20.根據(jù)權(quán)利要求19所述的特有內(nèi)容數(shù)據(jù)判定裝置,其特征在于,所述提取單元根據(jù)用預(yù)定的標(biāo)記語言描述的表示構(gòu)成網(wǎng)頁的內(nèi)容數(shù)據(jù)的文檔數(shù)據(jù),提取內(nèi)容數(shù)據(jù)組。
21.根據(jù)權(quán)利要求20所述的特有內(nèi)容數(shù)據(jù)判定裝置,其特征在于,所述提取單元在表示所述內(nèi)容數(shù)據(jù)的文檔數(shù)據(jù)中根據(jù)預(yù)定的標(biāo)簽來確定內(nèi)容數(shù)據(jù)組。
22.—種特有內(nèi)容數(shù)據(jù)判定方法,其特征在于,該特有內(nèi)容數(shù)據(jù)判定方法具有以下步驟提取步驟,提取構(gòu)成所指定的網(wǎng)頁的內(nèi)容數(shù)據(jù); 計(jì)算步驟,計(jì)算構(gòu)成所述指定的網(wǎng)頁的各內(nèi)容數(shù)據(jù)的出現(xiàn)頻度;以及判定步驟,根據(jù)所述計(jì)算的出現(xiàn)頻度,判定構(gòu)成所述指定的網(wǎng)頁的內(nèi)容數(shù)據(jù)中該網(wǎng)頁特有的內(nèi)容數(shù)據(jù)。
23.—種記錄介質(zhì),其特征在于,該記錄介質(zhì)以計(jì)算機(jī)可讀取的方式記錄有特有內(nèi)容數(shù)據(jù)判定程序,該特有內(nèi)容數(shù)據(jù)判定程序使計(jì)算機(jī)作為如下單元發(fā)揮功能提取單元,其提取構(gòu)成所指定的網(wǎng)頁的內(nèi)容數(shù)據(jù); 計(jì)算單元,其計(jì)算構(gòu)成所述指定的網(wǎng)頁的各內(nèi)容數(shù)據(jù)的出現(xiàn)頻度;以及判定單元,其根據(jù)所述計(jì)算的出現(xiàn)頻度,判定構(gòu)成所述指定的網(wǎng)頁的內(nèi)容數(shù)據(jù)中該網(wǎng)頁特有的內(nèi)容數(shù)據(jù)。
24.一種內(nèi)容數(shù)據(jù)生成裝置,其特征在于,該內(nèi)容數(shù)據(jù)生成裝置具有 權(quán)利要求14 21中的任意一項(xiàng)所述的特有內(nèi)容數(shù)據(jù)判定裝置;以及生成單元,其根據(jù)被所述特有內(nèi)容數(shù)據(jù)判定裝置判定為特有內(nèi)容數(shù)據(jù)的內(nèi)容數(shù)據(jù),生成新內(nèi)容數(shù)據(jù)。
25.根據(jù)權(quán)利要求M所述的內(nèi)容數(shù)據(jù)生成裝置,其特征在于,所述生成單元將被判定為特有內(nèi)容數(shù)據(jù)的內(nèi)容數(shù)據(jù)的顯示尺寸調(diào)整為與預(yù)先設(shè)定的顯示尺寸一致,生成包含調(diào)整了顯示尺寸后的內(nèi)容數(shù)據(jù)的新內(nèi)容數(shù)據(jù)。
26.根據(jù)權(quán)利要求M或25所述的內(nèi)容數(shù)據(jù)生成裝置,其特征在于,所述生成單元生成對被判定為特有內(nèi)容數(shù)據(jù)的內(nèi)容數(shù)據(jù)施加效果來再現(xiàn)該內(nèi)容數(shù)據(jù)的新內(nèi)容數(shù)據(jù)。
27.一種關(guān)聯(lián)內(nèi)容數(shù)據(jù)插入裝置,其特征在于,該關(guān)聯(lián)內(nèi)容數(shù)據(jù)插入裝置具有 權(quán)利要求14 21中的任意一項(xiàng)所述的特有內(nèi)容數(shù)據(jù)判定裝置;以及插入單元,其將與被所述特有內(nèi)容數(shù)據(jù)判定裝置判定為特有內(nèi)容數(shù)據(jù)的內(nèi)容數(shù)據(jù)相關(guān)聯(lián)的關(guān)聯(lián)內(nèi)容數(shù)據(jù)插入到所述指定的網(wǎng)頁中。
28.根據(jù)權(quán)利要求27所述的關(guān)聯(lián)內(nèi)容數(shù)據(jù)插入裝置,其特征在于,在構(gòu)成所述指定的網(wǎng)頁的內(nèi)容數(shù)據(jù)包含博客消息的文本數(shù)據(jù)的情況下,所述特有內(nèi)容數(shù)據(jù)判定裝置將該文本數(shù)據(jù)判定為該網(wǎng)頁特有的內(nèi)容數(shù)據(jù),所述插入單元從被所述特有內(nèi)容數(shù)據(jù)判定裝置判定為特有內(nèi)容數(shù)據(jù)的博客消息的文本數(shù)據(jù)中提取所述指定的網(wǎng)頁的特征詞,將與該特征詞相關(guān)聯(lián)的關(guān)聯(lián)內(nèi)容數(shù)據(jù)插入到該網(wǎng)頁中。
全文摘要
能夠容易地從構(gòu)成網(wǎng)頁的內(nèi)容數(shù)據(jù)中提取出該網(wǎng)頁特有的內(nèi)容數(shù)據(jù)。使計(jì)算機(jī)作為如下單元發(fā)揮功能提取單元,其提取構(gòu)成所指定的網(wǎng)頁的內(nèi)容數(shù)據(jù);計(jì)算單元,其計(jì)算構(gòu)成所指定的網(wǎng)頁的各內(nèi)容數(shù)據(jù)的出現(xiàn)頻度;以及判定單元,其根據(jù)計(jì)算出的出現(xiàn)頻度,判定構(gòu)成所指定的網(wǎng)頁的內(nèi)容數(shù)據(jù)中該網(wǎng)頁特有的內(nèi)容數(shù)據(jù)。
文檔編號G06Q30/00GK102598038SQ20108004892
公開日2012年7月18日 申請日期2010年10月25日 優(yōu)先權(quán)日2009年10月30日
發(fā)明者巖淵志學(xué) 申請人:樂天株式會社