欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

Wap頁面的結(jié)構(gòu)化顯示方法及裝置制造方法

文檔序號(hào):6489880閱讀:125來源:國知局
Wap頁面的結(jié)構(gòu)化顯示方法及裝置制造方法【專利摘要】本發(fā)明公開一種WAP頁面的結(jié)構(gòu)化顯示方法及裝置,該顯示方式包括:接收頁面瀏覽請(qǐng)求,獲取該頁面瀏覽請(qǐng)求所請(qǐng)求的原始頁面;對(duì)該原始頁面進(jìn)行切行,并以行為單位對(duì)原始網(wǎng)頁進(jìn)行掃描,獲得WAP頁面的結(jié)構(gòu)化字段;將所獲得的結(jié)構(gòu)化字段進(jìn)行組合,并對(duì)其進(jìn)行顯示。本發(fā)明通過獲取頁面瀏覽請(qǐng)求對(duì)應(yīng)的原始頁面后,對(duì)其進(jìn)行切行,并獲得WAP頁面的結(jié)構(gòu)化字段,然后對(duì)其進(jìn)行顯示。因此,相對(duì)于現(xiàn)有技術(shù)的模板抽取技術(shù),本發(fā)明可以適用不同網(wǎng)站的WAP頁面顯示,而不再需要配置相應(yīng)的模板,從而降低了人工對(duì)模板制作及維護(hù)的成本?!緦@f明】WAP頁面的結(jié)構(gòu)化顯示方法及裝置【
技術(shù)領(lǐng)域
】[0001]本發(fā)明涉及網(wǎng)頁顯示領(lǐng)域,尤其涉及一種WAP頁面的結(jié)構(gòu)化顯示方法及裝置。【
背景技術(shù)
】[0002]相對(duì)于WWW頁面,WAP頁面更加簡單且適合手機(jī)瀏覽器展現(xiàn)。而且,移動(dòng)終端的離線閱讀應(yīng)用越來越受到用戶的青睞,它給用戶提供了收集并統(tǒng)一管理待閱讀網(wǎng)頁的功能。對(duì)于此類閱讀應(yīng)用來說,直接呈現(xiàn)原網(wǎng)頁樣式及內(nèi)容會(huì)導(dǎo)致用戶體驗(yàn)不一、雜亂無章的感覺。因此將網(wǎng)頁結(jié)構(gòu)化顯示,并提供一致的閱讀體驗(yàn)非常重要。[0003]現(xiàn)有的網(wǎng)頁結(jié)構(gòu)化顯示主要利用模板抽取技術(shù)。由于同一網(wǎng)站中網(wǎng)頁的結(jié)構(gòu),均由固定的模板所承載,因此在網(wǎng)頁內(nèi)容更新時(shí),承載其的模板不會(huì)發(fā)生變化。因此,可以對(duì)網(wǎng)站配置相應(yīng)的模板,當(dāng)顯示網(wǎng)頁內(nèi)容時(shí),則從模板中提取需要顯示的信息進(jìn)行結(jié)構(gòu)化后,并對(duì)其進(jìn)行顯示。[0004]雖然上述模板抽取技術(shù)可以實(shí)現(xiàn)網(wǎng)頁結(jié)構(gòu)化顯示,但是其在實(shí)際的使用中仍存在以下問題:[0005](I)每個(gè)站點(diǎn)都必須配置相應(yīng)的模板,該模板無法對(duì)多個(gè)站點(diǎn)實(shí)現(xiàn)通用,由此造成的人工制作模板的成本較高;[0006](2)當(dāng)站點(diǎn)更新后,其配置的模板可能也會(huì)失效,因此需要人工及時(shí)地維護(hù),由此造成的人工維護(hù)的成本較高?!?br/>發(fā)明內(nèi)容】[0007]本發(fā)明的主要目的是提供一種WAP頁面的結(jié)構(gòu)化顯示方法,旨在降低了現(xiàn)有技術(shù)的WAP頁面的顯示中,人工對(duì)模板制作及維護(hù)的成本。[0008]本發(fā)明提供了一種WAP頁面的結(jié)構(gòu)化顯示方法,包括:[0009]接收頁面瀏覽請(qǐng)求,獲取該頁面瀏覽請(qǐng)求所請(qǐng)求的原始頁面;[0010]對(duì)該原始頁面進(jìn)行切行,并以行為單位對(duì)原始網(wǎng)頁進(jìn)行掃描,獲得WAP頁面的結(jié)構(gòu)化字段;[0011]將所獲得的結(jié)構(gòu)化字段進(jìn)行組合,并對(duì)其進(jìn)行顯示。[0012]本發(fā)明還提供了一種WAP頁面的結(jié)構(gòu)化顯示裝置,包括:[0013]頁面獲取模塊,用于接收頁面瀏覽請(qǐng)求,獲取該頁面瀏覽請(qǐng)求所請(qǐng)求的原始頁面;[0014]頁面結(jié)構(gòu)化模塊,用于對(duì)該原始頁面進(jìn)行切行,并以行為單位對(duì)原始網(wǎng)頁進(jìn)行掃描,獲得WAP頁面的結(jié)構(gòu)化字段;[0015]頁面顯示模塊,用于將所獲得的結(jié)構(gòu)化字段進(jìn)行組合,并對(duì)其進(jìn)行顯示。[0016]本發(fā)明通過獲取頁面瀏覽請(qǐng)求對(duì)應(yīng)的原始頁面后,對(duì)其進(jìn)行切行,并獲得WAP頁面的結(jié)構(gòu)化字段,然后對(duì)其進(jìn)行顯示。因此,相對(duì)于現(xiàn)有技術(shù)的模板抽取技術(shù),本發(fā)明可以適用不同網(wǎng)站的WAP頁面顯示,而不再需要配置相應(yīng)的模板,從而降低了人工對(duì)模板制作及維護(hù)的成本?!緦@綀D】【附圖說明】[0017]圖1是本發(fā)明WAP頁面的結(jié)構(gòu)化顯示方法一實(shí)施例的流程示意圖;[0018]圖2是本發(fā)明WAP頁面的結(jié)構(gòu)化顯示方法中,獲取WAP頁面的結(jié)構(gòu)化字段的流程示意圖;[0019]圖3是應(yīng)用現(xiàn)有技術(shù)的WAP頁面顯示方法而顯示的WAP頁面的示意圖;[0020]圖4是應(yīng)用本發(fā)明WAP頁面的結(jié)構(gòu)化顯示方法而顯示的WAP頁面的示意圖;[0021]圖5是本發(fā)明WAP頁面的結(jié)構(gòu)化顯示裝置一實(shí)施例的結(jié)構(gòu)示意圖;[0022]圖6是本發(fā)明WAP頁面的結(jié)構(gòu)化顯示裝置中頁面結(jié)構(gòu)化模塊的結(jié)構(gòu)示意圖;[0023]圖7是本發(fā)明WAP頁面的結(jié)構(gòu)化顯示裝置中頁面結(jié)構(gòu)化模塊的字段抽取單元一實(shí)施例的結(jié)構(gòu)示意圖;[0024]圖8是本發(fā)明WAP頁面的結(jié)構(gòu)化顯示裝置中頁面結(jié)構(gòu)化模塊的字段抽取單元另一實(shí)施例的結(jié)構(gòu)示意圖。[0025]本發(fā)明目的的實(shí)現(xiàn)、功能特點(diǎn)及優(yōu)點(diǎn)將結(jié)合實(shí)施例,參照附圖做進(jìn)一步說明?!揪唧w實(shí)施方式】[0026]以下結(jié)合說明書附圖及具體實(shí)施例進(jìn)一步說明本發(fā)明的技術(shù)方案。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。[0027]參照?qǐng)D1,提出了本發(fā)明WAP頁面的結(jié)構(gòu)化顯示方法一實(shí)施例。該WAP頁面的結(jié)構(gòu)化顯示方法包括以下步驟:[0028]步驟S110、接收頁面瀏覽請(qǐng)求,獲取該頁面瀏覽請(qǐng)求所請(qǐng)求的原始頁面;[0029]本發(fā)明主要用于移動(dòng)設(shè)備上的WAP頁面的顯示。該移動(dòng)設(shè)備的后臺(tái)服務(wù)器接收用戶端發(fā)出的頁面瀏覽請(qǐng)求,并將該頁面瀏覽請(qǐng)求發(fā)送至網(wǎng)絡(luò)服務(wù)器,以獲得頁面瀏覽請(qǐng)求所請(qǐng)求的原始頁面。該原始頁面為WAP頁面,有用戶端需要瀏覽的信息,也有其他的廣告信息、其他網(wǎng)頁的鏈接信息等等。[0030]步驟S120、對(duì)該原始頁面進(jìn)行切行,并以行為單位對(duì)原始網(wǎng)頁進(jìn)行掃描,獲得WAP頁面的結(jié)構(gòu)化字段;[0031]獲取到原始頁面后,將對(duì)其進(jìn)行切行,即以行為單位對(duì)頁面進(jìn)行切分。然后再對(duì)其進(jìn)行逐行掃描,獲得WAP頁面的結(jié)構(gòu)化字段。該結(jié)構(gòu)化字段可以包括通用的標(biāo)題、正文等字段。當(dāng)然也不限定于這些字段。[0032]應(yīng)當(dāng)理解,在獲取到原始頁面后,還可以提示用戶進(jìn)行顯示模式的選擇,該顯示模式可以包括普通模式、簡潔模式等。如果用戶的響應(yīng)是普通模式,則直接將原始頁面進(jìn)行顯示;如果用戶的響應(yīng)是簡潔模式,則進(jìn)行步驟S120、步驟S130。[0033]步驟S130、將所獲得的結(jié)構(gòu)化字段進(jìn)行組合,并對(duì)其進(jìn)行顯示。[0034]獲得WAP頁面的結(jié)構(gòu)化字段后,將其進(jìn)行組合,并對(duì)其進(jìn)行顯示。[0035]本發(fā)明WAP頁面的結(jié)構(gòu)化顯示方法通過獲取頁面瀏覽請(qǐng)求對(duì)應(yīng)的原始頁面后,對(duì)其進(jìn)行切行,并獲得WAP頁面的結(jié)構(gòu)化字段,然后對(duì)其進(jìn)行顯示。因此,相對(duì)于現(xiàn)有技術(shù)的模板抽取技術(shù),本發(fā)明可以適用不同網(wǎng)站的WAP頁面顯示,而不再需要配置相應(yīng)的模板,從而降低了人工對(duì)模板制作及維護(hù)的成本。[0036]進(jìn)一步的,參照?qǐng)D2,上述步驟S120包括:[0037]步驟S121、對(duì)原始頁面進(jìn)行解析,獲得解析樹;[0038]本實(shí)施例中,通過DOM方法對(duì)原始頁面進(jìn)行解析,獲得DOM樹,該DOM樹中每個(gè)節(jié)點(diǎn)都是由網(wǎng)頁中的所有標(biāo)記屬性構(gòu)成。[0039]步驟S122、查找解析樹中的換行標(biāo)記,并根據(jù)換行標(biāo)記對(duì)原始頁面以行為單位進(jìn)行切分;[0040]遍歷解析樹的所有節(jié)點(diǎn),查找獲得所有節(jié)點(diǎn)的標(biāo)記屬性中表示換行功能的節(jié)點(diǎn)信息,并根據(jù)該節(jié)點(diǎn)信息以行為單位對(duì)頁面內(nèi)容進(jìn)行切分。表示換行功能的標(biāo)記屬性可以包括br、p、div及table等。該對(duì)解析樹所有節(jié)點(diǎn)的遍歷可以由根節(jié)點(diǎn)向葉節(jié)點(diǎn)進(jìn)行遍歷,或者由葉節(jié)點(diǎn)向根節(jié)點(diǎn)進(jìn)行遍歷。[0041]步驟S123、以行為單位對(duì)原始頁面進(jìn)行掃描,獲得WAP頁面的標(biāo)題字段、正文信息行字段及正文字段。[0042]具體地,步驟S123包括:[0043]A、查找解析樹中是否存在標(biāo)題屬性的節(jié)點(diǎn),是則獲取該節(jié)點(diǎn)對(duì)應(yīng)的字段作為WAP頁面的標(biāo)題字段;[0044]由于頁面的標(biāo)題一般位于頁面內(nèi)容的最前面,所以由解析樹的根節(jié)點(diǎn)向葉節(jié)點(diǎn)進(jìn)行遍歷,直到獲得節(jié)點(diǎn)的標(biāo)記屬性為標(biāo)題的節(jié)點(diǎn)。例如DOM樹節(jié)點(diǎn)的class/id屬性含有“title”。當(dāng)然也可以為其他的查找方法,例如頁面的標(biāo)題一般都是單獨(dú)成行,且不含有其他內(nèi)容;或者標(biāo)題是居中設(shè)置,可以根據(jù)該標(biāo)題的特性進(jìn)行標(biāo)題字段的查找,以獲得WAP頁面的標(biāo)題字段。[0045]B、以標(biāo)題字段所在的行為起始行對(duì)原始頁面進(jìn)行逐行掃描,判斷當(dāng)前掃描行中是否存在時(shí)間字段或來源字段,是則獲取當(dāng)前掃描行的字段作為WAP頁面的正文信息行字段;否則繼續(xù)下一行掃描;[0046]WAP頁面的正文信息行字段主要是針對(duì)WAP資訊,例如資訊的發(fā)表時(shí)間或者信息來源等等,而且一般在標(biāo)題行后一段距離。所以,以標(biāo)題字段所在的行為起始行對(duì)原始頁面進(jìn)行逐行掃描,以獲取WAP頁面的正文信息行字段。[0047]C、以正文信息行字段所在的行為起始行對(duì)原始頁面進(jìn)行逐行掃描,統(tǒng)計(jì)正文信息行字段所在的行至所有掃描行之間的文字鏈接比,并將文字鏈接比最大的行作為正文字段的截止行,從而獲取正文信息行字段所在的行與截止行之間的字段作為WAP頁面的正文字段。[0048]本實(shí)施例中,主要通過確定文字密度最大的截止行而獲取WAP頁面的正文字段。即以正文信息行字段所在的行為起始行對(duì)原始頁面進(jìn)行逐行掃描,并統(tǒng)計(jì)該起始行與當(dāng)前掃描行之間的文字鏈接比。由于正文后面均會(huì)攜帶有超鏈接,因此通過在逐行掃描時(shí),統(tǒng)計(jì)起始行至掃描行之間的文字鏈接比,當(dāng)文字鏈接比逐漸減小時(shí),則表示已經(jīng)掃描至正文后面的超鏈接。最后再將文字鏈接比最大的行作為正文字段的截止行,并獲取正文信息行字段所在的行與截止行之間的字段作為WAP頁面的正文字段。[0049]由于移動(dòng)設(shè)備屏幕尺寸的限制,所有WAP頁面中的正文可能需要分為多頁進(jìn)行顯示,因此大多數(shù)WAP網(wǎng)頁均存在翻頁鏈接,例如“上一頁”、“下一頁”、“余下全文”等等。則步驟S123中在獲取正文字段后,還包括:[0050]D、判斷WAP頁面的正文字段中是否存在翻頁鏈接,是則獲取該翻頁鏈接字段。[0051]應(yīng)當(dāng)理解,上述獲得的WAP頁面的結(jié)構(gòu)化字段中,不但包括其基本的字段信息,還包括其他標(biāo)記,例如字體標(biāo)記、文本格式標(biāo)記、文本樣式標(biāo)記等等。由該結(jié)構(gòu)化字段所顯示的WAP頁面僅顯示標(biāo)題、正文信息行字段、正文字段及翻頁鏈接字段,從而使得WAP頁面過濾了多余的廣告、鏈接等信息,進(jìn)一步提高了用戶端的閱讀體驗(yàn)。[0052]參照?qǐng)D3及圖4,提出本發(fā)明應(yīng)用于移動(dòng)設(shè)備的閱讀業(yè)務(wù)的WAP頁面顯示。頁面瀏覽請(qǐng)求中URL為“http://tech.sina.cn/?sa=t84v44d21021263&vt=l”,根據(jù)該頁面瀏覽請(qǐng)求獲取的原始頁面顯示結(jié)果可參照?qǐng)D3所示。使用本發(fā)明的WAP頁面結(jié)構(gòu)化顯示結(jié)果可參照?qǐng)D4所示。由圖3及圖4可知,相對(duì)于現(xiàn)有技術(shù)的原始頁面顯示,應(yīng)用本發(fā)明的技術(shù)方案而實(shí)現(xiàn)的頁面過濾了廣告、其他新聞等鏈接信息,使得屏幕上顯示的均是用戶關(guān)注的信息,避免了用戶閱讀時(shí)不斷翻動(dòng)滾動(dòng)條而影響閱讀效果。[0053]參照?qǐng)D5,提出本發(fā)明WAP頁面的結(jié)構(gòu)化顯示裝置一實(shí)施例。該WAP頁面的結(jié)構(gòu)化顯示裝置包括:[0054]頁面獲取模塊110,用于接收頁面瀏覽請(qǐng)求,獲取該頁面瀏覽請(qǐng)求所請(qǐng)求的原始頁面;[0055]頁面結(jié)構(gòu)化模塊120,用于對(duì)該原始頁面進(jìn)行切行,并以行為單位對(duì)原始網(wǎng)頁進(jìn)行掃描,獲得WAP頁面的結(jié)構(gòu)化字段;[0056]頁面顯示模塊130,用于將所獲得的結(jié)構(gòu)化字段進(jìn)行組合,并對(duì)其進(jìn)行顯示。[0057]本發(fā)明主要用于移動(dòng)設(shè)備上的WAP頁面的顯示。該移動(dòng)設(shè)備的頁面獲取模塊110接收用戶端發(fā)出的頁面瀏覽請(qǐng)求,并將該頁面瀏覽請(qǐng)求發(fā)送至網(wǎng)絡(luò)服務(wù)器,以獲得頁面瀏覽請(qǐng)求所請(qǐng)求的原始頁面。該原始頁面為WAP頁面,有用戶端需要瀏覽的信息,也有其他的廣告信息、其他網(wǎng)頁的鏈接信息等等。獲取到原始頁面后,頁面結(jié)構(gòu)化模塊120將對(duì)其進(jìn)行切行,即以行為單位對(duì)頁面進(jìn)行切分。然后再對(duì)其進(jìn)行逐行掃描,獲得WAP頁面的結(jié)構(gòu)化字段。該結(jié)構(gòu)化字段可以包括通用的標(biāo)題、正文等字段。當(dāng)然也不限定于這些字段。最后,頁面顯示模塊130用于對(duì)結(jié)構(gòu)化字段進(jìn)行組合,并對(duì)其進(jìn)行顯示。[0058]本發(fā)明通過獲取頁面瀏覽請(qǐng)求對(duì)應(yīng)的原始頁面后,對(duì)其進(jìn)行切行,并獲得WAP頁面的結(jié)構(gòu)化字段,然后對(duì)其進(jìn)行顯示。因此,相對(duì)于現(xiàn)有技術(shù)的模板抽取技術(shù),本發(fā)明可以適用不同網(wǎng)站的WAP頁面顯示,而不再需要配置相應(yīng)的模板,從而降低了人工對(duì)模板制作及維護(hù)的成本。[0059]進(jìn)一步的,參照?qǐng)D6,上述頁面結(jié)構(gòu)化模塊120包括:[0060]切行單元121,用于對(duì)原始頁面進(jìn)行解析,獲得解析樹;查找解析樹中的換行標(biāo)記,并根據(jù)換行標(biāo)記對(duì)原始頁面以行為單位進(jìn)行切分;[0061]字段抽取單元122,用于以行為單位對(duì)原始頁面進(jìn)行掃描,獲得WAP頁面的標(biāo)題字段、正文信息行字段及正文字段。[0062]本實(shí)施例中,切行單元121通過D0M方法對(duì)原始頁面進(jìn)行解析,獲得D0M樹,該D0M樹中每個(gè)節(jié)點(diǎn)都是由網(wǎng)頁中的所有標(biāo)記屬性構(gòu)成。然后,遍歷解析樹的所有節(jié)點(diǎn),查找獲得所有節(jié)點(diǎn)的標(biāo)記屬性中表示換行功能的節(jié)點(diǎn)信息,并根據(jù)該節(jié)點(diǎn)信息以行為單位對(duì)頁面內(nèi)容進(jìn)行切分。表示換行功能的標(biāo)記屬性可以包括br、p、div及table等。[0063]進(jìn)一步,參照?qǐng)D7,上述字段抽取單元122包括:[0064]第一抽取子單1221,用于查找解析樹中是否存在標(biāo)題屬性的節(jié)點(diǎn),是則獲取該節(jié)點(diǎn)對(duì)應(yīng)的字段作為WAP頁面的標(biāo)題字段;[0065]第二抽取子單元1222,用于以標(biāo)題字段所在的行為起始行對(duì)原始頁面進(jìn)行逐行掃描,判斷當(dāng)前掃描行中是否存在時(shí)間字段或來源字段,是則獲取當(dāng)前掃描行的字段作為WAP頁面的正文信息行字段;否則繼續(xù)下一行掃描;[0066]第三抽取子單元1223,用于以正文信息行字段所在的行為起始行對(duì)原始頁面進(jìn)行逐行掃描,統(tǒng)計(jì)正文信息行字段所在的行至所有掃描行之間的文字鏈接比,并將文字鏈接比最大的行作為正文字段的截止行,從而獲取正文信息行字段所在的行與截止行之間的字段作為WAP頁面的正文字段。[0067]由于頁面的標(biāo)題一般位于頁面內(nèi)容的最前面,所以第一抽取子單元1221由解析樹的根節(jié)點(diǎn)向葉節(jié)點(diǎn)進(jìn)行遍歷,直到獲得節(jié)點(diǎn)的標(biāo)記屬性為標(biāo)題的節(jié)點(diǎn)。例如DOM樹節(jié)點(diǎn)的class/id屬性含有“title”。當(dāng)然也可以為其他的查找方法,例如頁面的標(biāo)題一般都是單獨(dú)成行,且不含有其他內(nèi)容;或者標(biāo)題是居中設(shè)置,可以根據(jù)該標(biāo)題的特性進(jìn)行標(biāo)題字段的查找,以獲得WAP頁面的標(biāo)題字段。[0068]第二抽取子單元1222中獲取的WAP頁面的正文信息行字段主要是針對(duì)WAP資訊,例如資訊的發(fā)表時(shí)間或者信息來源等等,而且一般在標(biāo)題行后一段距離。所以,該第二抽取子單元122以標(biāo)題字段所在的行為起始行對(duì)原始頁面進(jìn)行逐行掃描,以獲取WAP頁面的正文信息行字段。[0069]本實(shí)施例中,第三抽取子單元1223主要通過確定文字密度最大的截止行而獲取WAP頁面的正文字段。即以正文信息行字段所在的行為起始行對(duì)原始頁面進(jìn)行逐行掃描,并統(tǒng)計(jì)該起始行與當(dāng)前掃描行之間的文字鏈接比。由于正文后面均會(huì)攜帶有超鏈接,因此第三抽取子單元1223通過在逐行掃描時(shí),統(tǒng)計(jì)起始行至掃描行之間的文字鏈接比,當(dāng)文字鏈接比逐漸減小時(shí),則表示已經(jīng)掃描至正文后面的超鏈接。最后第三抽取子單元1223再將文字鏈接比最大的行作為正文字段的截止行,并獲取正文信息行字段所在的行與截止行之間的字段作為WAP頁面的正文字段。[0070]進(jìn)一步的,參照?qǐng)D8,上述字段抽取單元122還包括:[0071]第四抽取子單元1224,用于判斷WAP頁面的正文字段中是否存在翻頁鏈接,是則獲取該翻頁鏈接字段。[0072]由于移動(dòng)設(shè)備屏幕尺寸的限制,所有WAP頁面中的正文可能需要分為多頁進(jìn)行顯示,因此大多數(shù)WAP網(wǎng)頁均存在翻頁鏈接,例如“上一頁”、“下一頁”、“余下全文”等等。即第四抽取子單元1224用于獲取WAP頁面的正文字段中存在的翻頁鏈接字段。[0073]應(yīng)當(dāng)理解,上述頁面結(jié)構(gòu)化模塊120獲得的WAP頁面的結(jié)構(gòu)化字段中,不但包括其基本的字段信息,還包括其他標(biāo)記,例如字體標(biāo)記、文本格式標(biāo)記、文本樣式標(biāo)記等等。由該結(jié)構(gòu)化字段所顯示的WAP頁面僅顯示標(biāo)題、正文信息行字段、正文字段及翻頁鏈接字段,從而使得WAP頁面過濾了多余的廣告、鏈接等信息,進(jìn)一步提高了用戶端的閱讀體驗(yàn)。[0074]以上所述僅為本發(fā)明的優(yōu)選實(shí)施例,并非因此限制其專利范圍,凡是利用本發(fā)明說明書及附圖內(nèi)容所作的等效結(jié)構(gòu)或等效流程變換,直接或間接運(yùn)用在其他相關(guān)的【
技術(shù)領(lǐng)域
】,均同理包括在本發(fā)明的專利保護(hù)范圍內(nèi)?!緳?quán)利要求】1.一種WAP頁面的結(jié)構(gòu)化顯示方法,其特征在于,包括:接收頁面瀏覽請(qǐng)求,獲取該頁面瀏覽請(qǐng)求所請(qǐng)求的原始頁面;對(duì)該原始頁面進(jìn)行切行,并以行為單位對(duì)原始網(wǎng)頁進(jìn)行掃描,獲得WAP頁面的結(jié)構(gòu)化字段;將所獲得的結(jié)構(gòu)化字段進(jìn)行組合,并對(duì)其進(jìn)行顯示。2.根據(jù)權(quán)利要求1所述的WAP頁面的結(jié)構(gòu)化顯示方法,其特征在于,所述對(duì)原始頁面進(jìn)行切行,并以行為單位對(duì)原始網(wǎng)頁進(jìn)行掃描,獲得WAP頁面的結(jié)構(gòu)化字段包括:對(duì)原始頁面進(jìn)行解析,獲得解析樹;查找解析樹中的換行標(biāo)記,并根據(jù)換行標(biāo)記對(duì)原始頁面以行為單位進(jìn)行切分;以行為單位對(duì)原始頁面進(jìn)行掃描,獲得WAP頁面的標(biāo)題字段、正文信息行字段及正文字段。3.根據(jù)權(quán)利要求2所述的WAP頁面的結(jié)構(gòu)化顯示方法,其特征在于,所述以行為單位對(duì)原始頁面進(jìn)行掃描,獲得WAP頁面的標(biāo)題字段包括:查找解析樹中是否存在標(biāo)題屬性的節(jié)點(diǎn),是則獲取該節(jié)點(diǎn)對(duì)應(yīng)的字段作為WAP頁面的標(biāo)題字段。4.根據(jù)權(quán)利要求2所述的WAP頁面的結(jié)構(gòu)化顯示方法,其特征在于,所述以行為單位對(duì)原始頁面進(jìn)行掃描,獲得WAP頁面的正文信息行字段包括:以標(biāo)題字段所在的行為起始行對(duì)原始頁面進(jìn)行逐行掃描,判斷當(dāng)前掃描行中是否存在時(shí)間字段或來源字段,是則獲取當(dāng)前掃描行的字段作為WAP頁面的正文信息行字段;否則繼續(xù)下一行掃描。5.根據(jù)權(quán)利要求2所述的WAP頁面的結(jié)構(gòu)化顯示方法,其特征在于,所述以行為單位對(duì)原始頁面進(jìn)行掃描,獲得WAP頁面的正文字段包括:以正文信息行字段所在的行為起始行對(duì)原始頁面進(jìn)行逐行掃描,統(tǒng)計(jì)正文信息行字段所在的行至所有掃描行之間的文字鏈接比,并將文字鏈接比最大的行作為正文字段的截止行,從而獲取正文信息行字段所在的行與截止行之間的字段作為WAP頁面的正文字段。6.根據(jù)權(quán)利要求2-5中任一項(xiàng)所述的WAP頁面的結(jié)構(gòu)化顯示方法,其特征在于,所述以行為單位對(duì)原始頁面進(jìn)行掃描,獲得WAP頁面的標(biāo)題字段、正文信息行字段及正文字段之后還包括:判斷WAP頁面的正文字段中是否存在翻頁鏈接,是則獲取該翻頁鏈接字段。7.一種WAP頁面的結(jié)構(gòu)化顯示裝置,其特征在于,包括:頁面獲取模塊,用于接收頁面瀏覽請(qǐng)求,獲取該頁面瀏覽請(qǐng)求所請(qǐng)求的原始頁面;頁面結(jié)構(gòu)化模塊,用于對(duì)該原始頁面進(jìn)行切行,并以行為單位對(duì)原始網(wǎng)頁進(jìn)行掃描,獲得WAP頁面的結(jié)構(gòu)化字段;頁面顯示模塊,用于將所獲得的結(jié)構(gòu)化字段進(jìn)行組合,并對(duì)其進(jìn)行顯示。8.根據(jù)權(quán)利要求7所述的WAP頁面的結(jié)構(gòu)化顯示裝置,其特征在于,所述頁面結(jié)構(gòu)化模塊包括:切行單元,用于對(duì)原始頁面進(jìn)行解析,獲得解析樹;查找解析樹中的換行標(biāo)記,并根據(jù)換行標(biāo)記對(duì)原始頁面以行為單位進(jìn)行切分;字段抽取單元,用于以行為單位對(duì)原始頁面進(jìn)行掃描,獲得WAP頁面的標(biāo)題字段、正文信息行字段及正文字段。9.根據(jù)權(quán)利要求8所述的WAP頁面的結(jié)構(gòu)化顯示裝置,其特征在于,所述字段抽取單元包括:第一抽取子單元,用于查找解析樹中是否存在標(biāo)題屬性的節(jié)點(diǎn),是則獲取該節(jié)點(diǎn)對(duì)應(yīng)的字段作為WAP頁面的標(biāo)題字段;第二抽取子單元,用于以標(biāo)題字段所在的行為起始行對(duì)原始頁面進(jìn)行逐行掃描,判斷當(dāng)前掃描行中是否存在時(shí)間字段或來源字段,是則獲取當(dāng)前掃描行的字段作為WAP頁面的正文信息行字段;否則繼續(xù)下一行掃描;第三抽取子單元,用于以正文信息行字段所在的行為起始行對(duì)原始頁面進(jìn)行逐行掃描,統(tǒng)計(jì)正文信息行字段所在的行至所有掃描行之間的文字鏈接比,并將文字鏈接比最大的行作為正文字段的截止行,從而獲取正文信息行字段所在的行與截止行之間的字段作為WAP頁面的正文字段。10.根據(jù)權(quán)利要求9所述的WAP頁面的結(jié)構(gòu)化顯示裝置,其特征在于,所述字段抽取單元還包括:第四抽取子單元,用于判斷WAP頁面的正文字段中是否存在翻頁鏈接,是則獲取該翻頁鏈接字段?!疚臋n編號(hào)】G06F17/30GK103729382SQ201210392560【公開日】2014年4月16日申請(qǐng)日期:2012年10月16日優(yōu)先權(quán)日:2012年10月16日【發(fā)明者】蔡兵申請(qǐng)人:騰訊科技(深圳)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
武宁县| 甘孜| 英山县| 新和县| 太原市| 凌源市| 长岭县| 卓尼县| 南乐县| 仪征市| 永和县| 惠东县| 太谷县| 墨竹工卡县| 景泰县| 梁平县| 远安县| 吴旗县| 淳安县| 宜川县| 海南省| 平江县| 霞浦县| 偃师市| 涡阳县| 开封市| 马龙县| 彩票| 德钦县| 封开县| 华阴市| 高清| 衡东县| 穆棱市| 陇川县| 江达县| 高安市| 长武县| 临猗县| 同江市| 辉县市|