本發(fā)明涉及圖片過濾技術(shù)領(lǐng)域,特別是涉及基于網(wǎng)頁文章中圖片過濾技術(shù)的一種文章中圖片處理的方法及裝置。
背景技術(shù):
目前,資訊類網(wǎng)站主要是通過文章來傳播新聞信息。一般情況下,文章主要是依靠文字作為載體,同時除了文字信息以外,還放置一些圖片,以更加形象直觀地體現(xiàn)文章內(nèi)容。根據(jù)某些需要,比如要對文章中的文字內(nèi)容進(jìn)行單獨(dú)的編輯時,就需要將網(wǎng)頁文章中的圖片過濾出來并且進(jìn)行相應(yīng)的移除。同時,在某些情況下也會將移除掉的圖片進(jìn)行對應(yīng)的恢復(fù)。而現(xiàn)有技術(shù)中,還沒有直接從文章中過濾出所有圖片并對相應(yīng)的圖片進(jìn)行移除,并且能夠?qū)σ瞥蟮膱D片進(jìn)行恢復(fù)的技術(shù),并且相關(guān)方面的研究也比較少。
技術(shù)實現(xiàn)要素:
針對于上述問題,本發(fā)明提供一種網(wǎng)頁文章中圖片處理的方法及裝置,實現(xiàn)了直接從網(wǎng)頁文章中過濾出所有圖片,并對圖片進(jìn)行相應(yīng)的處理的目的。
為了實現(xiàn)上述目的,根據(jù)本發(fā)明的第一方面,提供了一種網(wǎng)頁文章中圖片處理的方法,該方法包括:
獲取所述網(wǎng)頁文章的html源代碼,根據(jù)所述html源代碼的html標(biāo)簽提取所述網(wǎng)頁文章的主體內(nèi)容;
根據(jù)所述html標(biāo)簽中的圖片標(biāo)簽,獲取到所述網(wǎng)頁文章的主體內(nèi)容中的圖片,并提取所述圖片的網(wǎng)絡(luò)路徑地址;
提取出獲取到的所述圖片并進(jìn)行備份保存至本地服務(wù)器,并將所述圖片的網(wǎng)絡(luò)路徑地址替換為對應(yīng)的本地路徑地址,并生成圖片文件列表發(fā)送至所述本地服務(wù)器,其中,所述圖片文件列表包含被提取出的所述圖片和與所述圖片對應(yīng)的本地路徑地址;
當(dāng)將所述本地服務(wù)器上的所述圖片文件列表中的圖片刪除時,對所述網(wǎng)頁文章中對應(yīng)的圖片進(jìn)行移除。
優(yōu)選的,所述將所述本地服務(wù)器上的所述圖片文件列表中的圖片刪除時,該方法還包括:
生成針對所刪除圖片對應(yīng)的圖片恢復(fù)指令。
優(yōu)選的,該方法還包括:
當(dāng)對刪除后的所述網(wǎng)頁文章中的圖片進(jìn)行恢復(fù)時,調(diào)用圖片恢復(fù)指令,獲取所述本地服務(wù)器上的所述圖片文件列表;
根據(jù)所述圖片文件列表中的所述圖片對應(yīng)的本地路徑,查找到在所述本地服務(wù)器上備份的所述圖片;
將所述圖片恢復(fù)至所述網(wǎng)頁文章中。
根據(jù)本發(fā)明的第二方面,提供了一種網(wǎng)頁文章中圖片處理的裝置,該裝置包括:
獲取模塊,用于獲取所述網(wǎng)頁文章的html源代碼,根據(jù)所述html源代碼的html標(biāo)簽提取所述網(wǎng)頁文章的主體內(nèi)容;
提取模塊,用于根據(jù)所述html標(biāo)簽中的圖片標(biāo)簽,獲取到所述網(wǎng)頁文章的主體內(nèi)容中的圖片,并提取所述圖片的網(wǎng)絡(luò)路徑地址;
文件生成模塊,用于提取出獲取到的所述圖片并進(jìn)行備份保存至本地服務(wù)器,并將所述圖片的網(wǎng)絡(luò)路徑地址替換為對應(yīng)的本地路徑地址,并生成圖片文件列表發(fā)送至所述本地服務(wù)器,其中,所述圖片文件列表包含被提取出的所述圖片和與所述圖片對應(yīng)的本地路徑地址;
刪除模塊,用于當(dāng)將所述本地服務(wù)器上的所述圖片文件列表中的圖片刪除時,對所述網(wǎng)頁文章中對應(yīng)的圖片進(jìn)行移除。
優(yōu)選的,所述將所述本地服務(wù)器上的所述圖片文件列表中的圖片刪除時,該裝置還包括:
指令生成模塊,用于生成針對所刪除圖片對應(yīng)的圖片恢復(fù)指令。
優(yōu)選的,該裝置還包括:
調(diào)用單元,用于當(dāng)對刪除后的所述網(wǎng)頁文章中的圖片進(jìn)行恢復(fù)時,調(diào)用圖片恢復(fù)指令,獲取所述本地服務(wù)器上的所述圖片文件列表;
查找單元,用于根據(jù)所述圖片文件列表中的所述圖片對應(yīng)的本地路徑,查找到在所述本地服務(wù)器上備份的所述圖片;
恢復(fù)單元,用于將所述圖片恢復(fù)至所述網(wǎng)頁文章中。
相較于現(xiàn)有技術(shù),本發(fā)明通過根據(jù)所述網(wǎng)頁文章的html標(biāo)簽提取所述網(wǎng)頁文章的主體內(nèi)容,并根據(jù)html標(biāo)簽中的圖片標(biāo)簽,獲取到所述網(wǎng)頁文章的主體內(nèi)容中的圖片,快速獲得了網(wǎng)頁文章中的所有圖片;同時,將獲得的圖片備份至本地服務(wù)器,并將其對應(yīng)的網(wǎng)絡(luò)路徑地址替換為本地路徑地址,生成圖片文件列表,當(dāng)將所述本地服務(wù)器上的所述圖片文件列表中的圖片刪除時,對所述網(wǎng)頁文章中對應(yīng)的圖片進(jìn)行移除,并生成針對所刪除圖片對應(yīng)的圖片恢復(fù)指令。進(jìn)而可以對獲得的網(wǎng)頁文章中的所有圖片進(jìn)行相應(yīng)的刪除或刪除后的恢復(fù)的處理。實現(xiàn)了直接從網(wǎng)頁文章中過濾出所有圖片,并對圖片進(jìn)行相應(yīng)的處理的目的。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)提供的附圖獲得其他的附圖。
圖1為本發(fā)明實施例一提供的一種網(wǎng)頁文章中圖片處理的方法的流程示意圖;
圖2為本發(fā)明實施例二提供的一種網(wǎng)頁文章中圖片處理的裝置的結(jié)構(gòu)示意圖。
具體實施方式
下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護(hù)的范圍。
本發(fā)明的說明書和權(quán)利要求書及上述附圖中的術(shù)語“第一”和“第二”等是用于區(qū)別不同的對象,而不是用于描述特定的順序。此外術(shù)語“包括”和“具有”以及他們?nèi)魏巫冃危鈭D在于覆蓋不排他的包含。例如包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備沒有設(shè)定于已列出的步驟或單元,而是可包括沒有列出的步驟或單元。
實施例一
參見圖1為為本發(fā)明實施例一提供的一種網(wǎng)頁文章中圖片處理的方法的流程示意圖,該方法包括以下步驟:
s11、獲取所述網(wǎng)頁文章的html源代碼,根據(jù)所述html源代碼的html標(biāo)簽提取所述網(wǎng)頁文章的主體內(nèi)容;
具體的,在網(wǎng)頁文章中,除了文章的主體內(nèi)容以外還有其他的一些干擾因素,比如網(wǎng)頁文章中的時間或者重復(fù)的內(nèi)容等,需要根據(jù)html標(biāo)簽提取出網(wǎng)頁文章的主體內(nèi)容,進(jìn)而對所述的主體內(nèi)容進(jìn)行進(jìn)一步的操作。
s12、根據(jù)所述html標(biāo)簽中的圖片標(biāo)簽,獲取到所述網(wǎng)頁文章的主體內(nèi)容中的圖片,并提取所述圖片的網(wǎng)絡(luò)路徑地址;
優(yōu)選的,在根據(jù)圖片標(biāo)簽提取出網(wǎng)頁文章的主體內(nèi)容中的圖片時,選用的是通過正則表達(dá)式進(jìn)行匹配選擇的,由于采用的正則表達(dá)式的匹配規(guī)則是動態(tài)添加的,并非固定式的,要根據(jù)具體的網(wǎng)頁的html源代碼進(jìn)行制定。
s13、提取出獲取到的所述圖片并進(jìn)行備份保存至本地服務(wù)器,并將所述圖片的網(wǎng)絡(luò)路徑地址替換為對應(yīng)的本地路徑地址,并生成圖片文件列表發(fā)送至所述本地服務(wù)器,其中,所述圖片文件列表包含被提取出的所述圖片和與所述圖片對應(yīng)的本地路徑地址;
s14、當(dāng)將所述本地服務(wù)器上的所述圖片文件列表中的圖片刪除時,對所述網(wǎng)頁文章中對應(yīng)的圖片進(jìn)行移除。
相應(yīng)的,所述將所述本地服務(wù)器上的所述圖片文件列表中的圖片刪除時,該方法還包括生成針對所刪除圖片對應(yīng)的圖片恢復(fù)指令。
具體的,當(dāng)生成針對所刪除圖片對應(yīng)的圖片恢復(fù)指令時,該方法還包括:
當(dāng)對刪除后的所述網(wǎng)頁文章中的圖片進(jìn)行恢復(fù)時,調(diào)用圖片恢復(fù)指令,獲取所述本地服務(wù)器上的所述圖片文件列表;
根據(jù)所述圖片文件列表中的所述圖片對應(yīng)的本地路徑,查找到在所述本地服務(wù)器上備份的所述圖片;
將所述圖片恢復(fù)至所述網(wǎng)頁文章中。
通過本發(fā)明實施例一公開的技術(shù)方案,首先根據(jù)所述網(wǎng)頁文章的html標(biāo)簽提取所述網(wǎng)頁文章的主體內(nèi)容,并根據(jù)html標(biāo)簽中的圖片標(biāo)簽,獲取到所述網(wǎng)頁文章的主體內(nèi)容中的圖片,快速獲得了網(wǎng)頁文章中的所有圖片;其次,將獲得的圖片備份至本地服務(wù)器,并將其對應(yīng)的網(wǎng)絡(luò)路徑地址替換為本地路徑地址,生成圖片文件列表;最后,當(dāng)將所述本地服務(wù)器上的所述圖片文件列表中的圖片刪除時,對所述網(wǎng)頁文章中對應(yīng)的圖片進(jìn)行移除,并生成針對所刪除圖片對應(yīng)的圖片恢復(fù)指令。進(jìn)而可以對獲得的網(wǎng)頁文章中的所有圖片進(jìn)行相應(yīng)的刪除或刪除后的恢復(fù)的處理。實現(xiàn)了直接從網(wǎng)頁文章中過濾出所有圖片,并對圖片進(jìn)行相應(yīng)的處理的目的。
實施例二
與本發(fā)明實施例一公開的網(wǎng)頁文章中圖片處理的方法相對應(yīng),本發(fā)明的實施例二還提供了一種網(wǎng)頁中圖片處理的裝置,參見圖2為本發(fā)明實施例二提供的一種網(wǎng)頁文章中圖片處理的裝置的結(jié)構(gòu)示意圖,該裝置包括:
獲取模塊1,用于獲取所述網(wǎng)頁文章的html源代碼,根據(jù)所述html源代碼的html標(biāo)簽提取所述網(wǎng)頁文章的主體內(nèi)容;
提取模塊2,用于根據(jù)所述html標(biāo)簽中的圖片標(biāo)簽,獲取到所述網(wǎng)頁文章的主體內(nèi)容中的圖片,并提取所述圖片的網(wǎng)絡(luò)路徑地址;
文件生成模塊3,用于提取出獲取到的所述圖片并進(jìn)行備份保存至本地服務(wù)器,并將所述圖片的網(wǎng)絡(luò)路徑地址替換為對應(yīng)的本地路徑地址,并生成圖片文件列表發(fā)送至所述本地服務(wù)器,其中,所述圖片文件列表包含被提取出的所述圖片和與所述圖片對應(yīng)的本地路徑地址;
刪除模塊4,用于當(dāng)將所述本地服務(wù)器上的所述圖片文件列表中的圖片刪除時,對所述網(wǎng)頁文章中對應(yīng)的圖片進(jìn)行移除。
相應(yīng)的,所述將所述本地服務(wù)器上的所述圖片文件列表中的圖片刪除時,該裝置還包括:
指令生成模塊5,用于生成針對所刪除圖片對應(yīng)的圖片恢復(fù)指令。
具體的,該裝置還包括:
調(diào)用單元,用于當(dāng)對刪除后的所述網(wǎng)頁文章中的圖片進(jìn)行恢復(fù)時,調(diào)用圖片恢復(fù)指令,獲取所述本地服務(wù)器上的所述圖片文件列表;
查找單元,用于根據(jù)所述圖片文件列表中的所述圖片對應(yīng)的本地路徑,查找到在所述本地服務(wù)器上備份的所述圖片;
恢復(fù)單元,用于將所述圖片恢復(fù)至所述網(wǎng)頁文章中。
在本發(fā)明的實施例三中,通過獲取模塊獲得了所述網(wǎng)頁文章的主體內(nèi)容,并根據(jù)提取模塊快速獲得了網(wǎng)頁文章中的所有圖片;然后在文件生成模塊中將獲得的圖片備份至本地服務(wù)器,并將其對應(yīng)的網(wǎng)絡(luò)路徑地址替換為本地路徑地址,生成圖片文件列表;最后在刪除模塊中當(dāng)將所述本地服務(wù)器上的所述圖片文件列表中的圖片刪除時,對所述網(wǎng)頁文章中對應(yīng)的圖片進(jìn)行移除,同時在指令生成模塊中生成針對所刪除圖片對應(yīng)的圖片恢復(fù)指令。進(jìn)而可以對獲得的網(wǎng)頁文章中的所有圖片進(jìn)行相應(yīng)的刪除或刪除后的恢復(fù)的處理。實現(xiàn)了直接從網(wǎng)頁文章中過濾出所有圖片,并對圖片進(jìn)行相應(yīng)的處理的目的。
本說明書中各個實施例采用遞進(jìn)的方式描述,每個實施例重點(diǎn)說明的都是與其他實施例的不同之處,各個實施例之間相同相似部分互相參見即可。對于實施例公開的裝置而言,由于其與實施例公開的方法相對應(yīng),所以描述的比較簡單,相關(guān)之處參見方法部分說明即可。
對所公開的實施例的上述說明,使本領(lǐng)域?qū)I(yè)技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。對這些實施例的多種修改對本領(lǐng)域的專業(yè)技術(shù)人員來說將是顯而易見的,本文中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實施例中實現(xiàn)。因此,本發(fā)明將不會被限制于本文所示的這些實施例,而是要符合與本文所公開的原理和新穎特點(diǎn)相一致的最寬的范圍。