專利名稱:一種基于預(yù)測(cè)搜索的網(wǎng)絡(luò)文件傳輸方法
技術(shù)領(lǐng)域:
本發(fā)明屬于網(wǎng)絡(luò)傳輸領(lǐng)域,具體涉及一種基于預(yù)測(cè)搜索的網(wǎng)絡(luò)文件傳輸方法。
背景技術(shù):
隨著網(wǎng)絡(luò)帶寬和網(wǎng)絡(luò)應(yīng)用的發(fā)展,網(wǎng)絡(luò)文件特別是大數(shù)據(jù)量的媒體文件在網(wǎng)絡(luò)中越來(lái)越普及,例如不少網(wǎng)站都提供了大量的視頻點(diǎn)播、直播應(yīng)用,多媒體雜志和報(bào)紙、flash動(dòng)畫,甚至是網(wǎng)絡(luò)游戲,軟件發(fā)布等各種應(yīng)用。其中,網(wǎng)絡(luò)視頻應(yīng)用的發(fā)展最為快速,網(wǎng)絡(luò)電視如IPTV大量建設(shè),而播客更是一種更廣泛的網(wǎng)民交流視頻文件的網(wǎng)絡(luò)應(yīng)用。
現(xiàn)有技術(shù)中,用戶希望實(shí)時(shí)流暢播放網(wǎng)絡(luò)中的視頻文件,快速的下載網(wǎng)絡(luò)文件,傳統(tǒng)的即客戶/服務(wù)器模式將網(wǎng)站視頻文件集中通過(guò)流媒體服務(wù)器發(fā)表,這種模式受到并發(fā)用戶數(shù)的限制,而且服務(wù)器也會(huì)由于用戶的負(fù)載增加而服務(wù)器質(zhì)量下降。目前大量出現(xiàn)的基于點(diǎn)對(duì)點(diǎn)(P2P)系統(tǒng),解決了客戶/服務(wù)器模式系統(tǒng)集中發(fā)布網(wǎng)絡(luò)視頻文件的瓶頸缺陷,使得用戶播放視頻文件更加流暢和快速。P2P系統(tǒng)的工作過(guò)程式這樣的客戶端發(fā)送搜索網(wǎng)絡(luò)文件請(qǐng)求,根據(jù)搜索請(qǐng)求在P2P系統(tǒng)中進(jìn)行搜索,然后根據(jù)搜索結(jié)果定位網(wǎng)絡(luò)文件所在的下載地址,客戶端從該網(wǎng)絡(luò)下載地址獲取文件。由于搜索網(wǎng)絡(luò)文件這一步普遍比較耗時(shí),約30秒到1分鐘,甚至更多??蛻舳吮仨毜鹊剿阉鞣祷亟Y(jié)果后才能確定獲取文件的地址,再下載文件,在這段時(shí)間內(nèi)用戶只能等待,對(duì)于特別是網(wǎng)絡(luò)視頻文件這種要求實(shí)時(shí)性播放的應(yīng)用,用戶更是希望能減少啟動(dòng)時(shí)間,現(xiàn)有的P2P系統(tǒng)的啟動(dòng)時(shí)間影響了用戶網(wǎng)絡(luò)視頻文件播放的體驗(yàn)和接受程度,進(jìn)而阻礙了網(wǎng)絡(luò)視頻應(yīng)用的發(fā)展。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)中所存在的上述問(wèn)題和缺陷,本發(fā)明的目的在于提供一種基于預(yù)測(cè)搜索的網(wǎng)絡(luò)文件傳輸方法,該方法能夠減少用戶點(diǎn)擊網(wǎng)絡(luò)文件鏈接的等待時(shí)間,大大提升用戶網(wǎng)絡(luò)文件傳輸?shù)捏w驗(yàn)。
為達(dá)到以上目的,本發(fā)明采用的技術(shù)方案是一種基于預(yù)測(cè)搜索的視頻文件傳輸方法,包括以下步驟a)獲取P2P系統(tǒng)用戶當(dāng)前瀏覽的網(wǎng)頁(yè)中存在的所有網(wǎng)絡(luò)文件的鏈接;b)提取鏈接中的網(wǎng)絡(luò)文件信息;c)預(yù)測(cè)分析,形成預(yù)測(cè)搜索的請(qǐng)求;d)在P2P系統(tǒng)中發(fā)送預(yù)測(cè)搜索請(qǐng)求,搜索預(yù)測(cè)的網(wǎng)絡(luò)文件的下載地址;e)保存預(yù)測(cè)搜索結(jié)果到客戶端;f)當(dāng)用戶點(diǎn)擊網(wǎng)頁(yè)中的網(wǎng)絡(luò)文件鏈接時(shí),截取該實(shí)際請(qǐng)求;g)檢查該實(shí)際請(qǐng)求和預(yù)測(cè)的請(qǐng)求是否匹配;h)如果匹配,則利用預(yù)測(cè)搜索結(jié)果,直接獲取網(wǎng)絡(luò)文件的下載地址,否則按照原有P2P系統(tǒng)的搜索流程處理;i)建立請(qǐng)求客戶端和網(wǎng)絡(luò)文件所在下載地址的客戶端的通訊,下載網(wǎng)絡(luò)文件;上述的網(wǎng)絡(luò)文件包括視頻數(shù)據(jù)文件、流媒體文件、流媒體流數(shù)據(jù)、音頻文件和其他可播放的視音頻數(shù)據(jù)和其他網(wǎng)絡(luò)大數(shù)據(jù)量的文件。
為使本發(fā)明具有更好的效果,步驟a)中所述的網(wǎng)頁(yè)是含有能夠利用P2P技術(shù)下載的網(wǎng)絡(luò)文件鏈接的網(wǎng)頁(yè)。
更進(jìn)一步,步驟b)在提取鏈接中的文件信息時(shí),結(jié)合該網(wǎng)頁(yè),提取網(wǎng)頁(yè)中與該鏈接相關(guān)的文件標(biāo)注做為文件信息的擴(kuò)展信息。文件標(biāo)注是指頁(yè)面內(nèi)容中與該文件鏈接有解釋說(shuō)明的文字內(nèi)容。
進(jìn)一步,步驟c)中,系統(tǒng)還建立有用戶的網(wǎng)絡(luò)文件瀏覽偏好日志,根據(jù)瀏覽偏好日志做用戶行為分析,根據(jù)用戶偏好來(lái)進(jìn)行預(yù)測(cè)分析。
更進(jìn)一步,系統(tǒng)還提供一個(gè)設(shè)置選項(xiàng),用戶根據(jù)個(gè)人的偏好來(lái)設(shè)定瀏覽偏好,根據(jù)用戶設(shè)定的偏好進(jìn)行預(yù)測(cè)分析。
進(jìn)一步,步驟c)中只是針對(duì)網(wǎng)頁(yè)中部分鏈接形成預(yù)測(cè)搜索的請(qǐng)求。
更進(jìn)一步,系統(tǒng)設(shè)定一個(gè)預(yù)測(cè)分析請(qǐng)求數(shù)目的上限,如果步驟a)、b)中提取的鏈接數(shù)少于系統(tǒng)設(shè)定的預(yù)測(cè)分析請(qǐng)求數(shù)目的上限,則步驟c中的預(yù)測(cè)分析可以采取武斷的方式將所有這些鏈接作為預(yù)測(cè)請(qǐng)求。
進(jìn)一步,步驟d)中還設(shè)有預(yù)測(cè)搜索停止條件,當(dāng)滿足預(yù)測(cè)搜索停止條件時(shí),停止預(yù)測(cè)搜索。所述的預(yù)測(cè)搜索停止條件是設(shè)定的搜索時(shí)間或者搜索次數(shù),或者是用戶切換網(wǎng)頁(yè)的操作。
進(jìn)一步,d)中預(yù)測(cè)搜索優(yōu)先在同一網(wǎng)段中搜索,所述的統(tǒng)一網(wǎng)段是指網(wǎng)絡(luò)地址在同一局域網(wǎng)或者同一網(wǎng)絡(luò)服務(wù)提供商。
更進(jìn)一步,步驟e)中還包括對(duì)搜索結(jié)果進(jìn)行管理,記錄請(qǐng)求搜索時(shí)間消耗,有效時(shí)間戳,利用這些搜索結(jié)果來(lái)優(yōu)化下一次的搜索路徑。
更進(jìn)一步,步驟i)中在用戶下載文件過(guò)程中對(duì)后續(xù)文件片斷進(jìn)行預(yù)測(cè)搜索,當(dāng)獲取文件的網(wǎng)絡(luò)下載地址失效時(shí)直接切換到下一個(gè)可用的網(wǎng)絡(luò)下載地址。
本發(fā)明的效果在于采用本發(fā)明所述的方法,可以使用戶在發(fā)送實(shí)際播放視頻文件請(qǐng)求時(shí)就提前進(jìn)行搜索,減少了用戶等待的時(shí)間,提升用戶網(wǎng)絡(luò)媒體播放體驗(yàn)。
圖1是一種基于預(yù)測(cè)搜索的網(wǎng)絡(luò)文件傳輸方法的流程圖。
具體實(shí)施例方式
下面以一個(gè)客戶端用戶采用本發(fā)明所述的方法瀏覽網(wǎng)絡(luò)上的網(wǎng)絡(luò)文件的過(guò)程為例,結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步地描述。本實(shí)施例中,用戶是P2P客戶端用戶并安裝了客戶端軟件。
實(shí)施例1假定本實(shí)施例系統(tǒng)設(shè)置的預(yù)測(cè)搜索個(gè)數(shù)上限為5個(gè),如圖1所示,用戶瀏覽包含視頻文件的網(wǎng)頁(yè),查看感興趣的視頻,此時(shí)客戶端的計(jì)算機(jī)系統(tǒng)做如下預(yù)測(cè)搜索工作;a)分析網(wǎng)頁(yè)的HTML語(yǔ)言內(nèi)容,利用HTML語(yǔ)言標(biāo)注特性分析包含的鏈接信息,本實(shí)施例僅獲取網(wǎng)頁(yè)中存在的所有可播放的視頻數(shù)據(jù)文件的鏈接,這些鏈接組成一個(gè)鏈接集合L。
b)在鏈接集合L中,提取鏈接中的視頻文件信息,得到集合F;所述的視頻文件信息包括視頻文件的名稱、格式、服務(wù)器地址等。
c)在集合F中,做預(yù)測(cè)分析,選取網(wǎng)頁(yè)中的部分鏈接形成提前搜索的預(yù)測(cè)請(qǐng)求集合S;本實(shí)施例中,集合F中的元素個(gè)數(shù)大于集合S中的元素個(gè)數(shù),即預(yù)測(cè)請(qǐng)求只是針對(duì)網(wǎng)頁(yè)中部分鏈接。當(dāng)然,如果集合F中的元素個(gè)數(shù)小于5,則集合F的所有鏈接都作為預(yù)測(cè)請(qǐng)求。
所述的預(yù)測(cè)分析方法是根據(jù)用戶的瀏覽習(xí)慣建立有用戶的網(wǎng)絡(luò)視頻文件瀏覽偏好日志,根據(jù)瀏覽偏好日志做用戶行為分析,根據(jù)用戶偏好來(lái)進(jìn)行預(yù)測(cè)分析。比如說(shuō),用戶經(jīng)常瀏覽一些體育類的視頻文件,則表明該用戶對(duì)此類視頻有愛(ài)好,則在預(yù)測(cè)分析時(shí),根據(jù)步驟b中所收集的視頻文件的信息首先選取體育類的視頻文件的鏈接形成提前搜索的預(yù)測(cè)請(qǐng)求集合S。當(dāng)然,如果用戶設(shè)定了偏好選項(xiàng),比如設(shè)定了電影、訪談?lì)愐曨l文件,則也可以結(jié)合用戶偏好設(shè)置來(lái)進(jìn)行預(yù)測(cè)分析,選取電影、訪談?lì)愐曨l文件的鏈接形成提前搜索的預(yù)測(cè)請(qǐng)求集合S。
d)在P2P系統(tǒng)中,選取預(yù)測(cè)請(qǐng)求集合S中的每一個(gè)搜索請(qǐng)求,進(jìn)行發(fā)送,搜索預(yù)測(cè)的視頻文件的網(wǎng)絡(luò)下載地址;具體來(lái)說(shuō),預(yù)測(cè)搜索優(yōu)先在同一網(wǎng)段中搜索,所述的統(tǒng)一網(wǎng)段是指網(wǎng)絡(luò)地址在同一局域網(wǎng)或者同一網(wǎng)絡(luò)服務(wù)提供商。另外,還設(shè)立預(yù)測(cè)搜索停止條件,停止條件可以為搜索時(shí)間,搜索次數(shù)和用戶切換網(wǎng)頁(yè)操作。在對(duì)搜索結(jié)果進(jìn)行管理時(shí),記錄請(qǐng)求搜索時(shí)間消耗,有效時(shí)間戳,利用這些搜索結(jié)果來(lái)優(yōu)化下一次的搜索路徑。
e)返回搜索結(jié)果集合R,保存到客戶端;所述的搜索結(jié)果包含的信息有搜索的文件名,下載地址,包含的文件片斷及其文件片斷大小,搜索的時(shí)間戳和消耗時(shí)間。
當(dāng)用戶從當(dāng)前的網(wǎng)頁(yè)中點(diǎn)擊一個(gè)視頻文件鏈接時(shí),f)系統(tǒng)監(jiān)測(cè)IE瀏覽器中的視頻播放器對(duì)外發(fā)送一個(gè)視頻文件請(qǐng)求準(zhǔn)備播放時(shí)刻,截獲該請(qǐng)求q1;g)在預(yù)測(cè)請(qǐng)求集合S中,逐個(gè)比較預(yù)測(cè)請(qǐng)求Qs和實(shí)際請(qǐng)求q1,,如果相等,則為匹配;h)如果匹配,則利用提前的搜索結(jié)果獲取視頻文件的網(wǎng)絡(luò)下載地址;否則,按照原有P2P系統(tǒng)的原有搜索流程處理。
具體來(lái)說(shuō),在實(shí)際搜索匹配預(yù)測(cè)搜索的情況下,用戶不需要在實(shí)際點(diǎn)擊鏈接后再進(jìn)行搜索請(qǐng)求,而是利用已經(jīng)提前預(yù)測(cè)的搜索結(jié)果直接得到視頻文件的下載地址。倘若實(shí)際的請(qǐng)求和預(yù)測(cè)的請(qǐng)求不匹配,則預(yù)測(cè)失效,按照原有P2P系統(tǒng)流程來(lái)獲取視頻文件。
i)利用原有的P2P系統(tǒng)通訊功能,建立客戶端和該網(wǎng)絡(luò)位置的通訊,獲取文件進(jìn)行播放。
在用戶播放視頻文件中還可繼續(xù)對(duì)后續(xù)視頻片斷進(jìn)行預(yù)測(cè)搜索,當(dāng)獲取視頻文件的網(wǎng)絡(luò)位置失效時(shí)直接切換到下一個(gè)可用的網(wǎng)絡(luò)位置。
實(shí)施例2其他步驟與實(shí)施例1相同,不同之處在于預(yù)測(cè)搜索和傳輸?shù)囊曨l文件是音頻文件。
實(shí)施例3其他步驟與實(shí)施例1相同,不同之處在于預(yù)測(cè)搜索和傳輸?shù)囊曨l文件是流媒體文件。
本發(fā)明所述的方法并不限于具體實(shí)施方式
中所述的實(shí)施例,本領(lǐng)域技術(shù)人員根據(jù)本發(fā)明的技術(shù)方案得出其他的實(shí)施方式,同樣屬于本發(fā)明的技術(shù)創(chuàng)新范圍。
權(quán)利要求
1.一種基于預(yù)測(cè)搜索的網(wǎng)絡(luò)文件傳輸方法,包括以下步驟a)獲取P2P系統(tǒng)用戶當(dāng)前瀏覽的網(wǎng)頁(yè)中存在的所有網(wǎng)絡(luò)文件的鏈接;b)提取鏈接中的網(wǎng)絡(luò)文件信息;c)預(yù)測(cè)分析,形成預(yù)測(cè)搜索的請(qǐng)求;d)在P2P系統(tǒng)中發(fā)送預(yù)測(cè)搜索請(qǐng)求,搜索預(yù)測(cè)的網(wǎng)絡(luò)文件的下載地址;e)保存預(yù)測(cè)搜索結(jié)果到客戶端;f)當(dāng)用戶點(diǎn)擊網(wǎng)頁(yè)中的網(wǎng)絡(luò)文件鏈接時(shí),截取該實(shí)際請(qǐng)求;g)檢查該實(shí)際請(qǐng)求和預(yù)測(cè)的請(qǐng)求是否匹配;h)如果匹配,則利用預(yù)測(cè)搜索結(jié)果,直接獲取網(wǎng)絡(luò)文件的下載地址,否則按照原有P2P系統(tǒng)的搜索流程處理;i)建立請(qǐng)求客戶端和網(wǎng)絡(luò)文件所在下載地址的客戶端的通訊,下載網(wǎng)絡(luò)文件。
2.如權(quán)利要求1所述的一種基于預(yù)測(cè)搜索的網(wǎng)絡(luò)文件傳輸方法,其特征是步驟a)中所述的網(wǎng)頁(yè)是含有能夠利用P2P技術(shù)下載的網(wǎng)絡(luò)文件鏈接的網(wǎng)頁(yè)。
3.如權(quán)利要求1所述的一種基于預(yù)測(cè)搜索的網(wǎng)絡(luò)文件傳輸方法,其特征是步驟c)中,系統(tǒng)建立有用戶下載網(wǎng)絡(luò)文件偏好日志,根據(jù)偏好日志做用戶行為分析,根據(jù)用戶偏好來(lái)進(jìn)行預(yù)測(cè)分析。
4.如權(quán)利要求3所述的一種基于預(yù)測(cè)搜索的網(wǎng)絡(luò)文件傳輸方法,其特征是步驟c)中,系統(tǒng)還提供一個(gè)設(shè)置選項(xiàng),用戶根據(jù)個(gè)人的偏好來(lái)設(shè)定瀏覽偏好,根據(jù)用戶設(shè)定的偏好進(jìn)行預(yù)測(cè)分析。
5.如權(quán)利要求1、2或3所述的一種基于預(yù)測(cè)搜索的網(wǎng)絡(luò)文件傳輸方法,其特征是步驟c)中預(yù)測(cè)搜索優(yōu)先在同一網(wǎng)段中搜索,所述的統(tǒng)一網(wǎng)段是指網(wǎng)絡(luò)地址在同一局域網(wǎng)或者同一網(wǎng)絡(luò)服務(wù)提供商。
6.如權(quán)利要求1、2或3所述的一種基于預(yù)測(cè)搜索的網(wǎng)絡(luò)文件傳輸方法,其特征是步驟c)中只是針對(duì)網(wǎng)頁(yè)中部分鏈接形成預(yù)測(cè)搜索的請(qǐng)求。
7.如權(quán)利要求1、2或3所述的一種基于預(yù)測(cè)搜索的網(wǎng)絡(luò)文件傳輸方法,其特征是步驟c)中,系統(tǒng)設(shè)定一個(gè)預(yù)測(cè)分析請(qǐng)求數(shù)目的上限,如果步驟a)、b)中提取的鏈接數(shù)少于系統(tǒng)設(shè)定的預(yù)測(cè)分析請(qǐng)求數(shù)目的上限,則將所有這些鏈接作為預(yù)測(cè)請(qǐng)求。
8.如權(quán)利要求1、2或3所述的一種基于預(yù)測(cè)搜索的網(wǎng)絡(luò)文件傳輸方法,其特征是步驟d)中還設(shè)有預(yù)測(cè)搜索停止條件,當(dāng)滿足預(yù)測(cè)搜索停止條件時(shí),停止預(yù)測(cè)搜索。
9.如權(quán)利要求8所述的一種基于預(yù)測(cè)搜索的網(wǎng)絡(luò)文件傳輸方法,其特征是所述的預(yù)測(cè)搜索停止條件是設(shè)定的搜索時(shí)間或者搜索次數(shù),或者是用戶切換網(wǎng)頁(yè)的操作。
10.如權(quán)利要求1、2或3所述的一種基于預(yù)測(cè)搜索的網(wǎng)絡(luò)文件傳輸方法,其特征是步驟e)中還包括對(duì)搜索結(jié)果進(jìn)行管理,記錄請(qǐng)求搜索時(shí)間消耗,有效時(shí)間戳,利用這些搜索結(jié)果來(lái)優(yōu)化下一次的搜索路徑。
11.如權(quán)利要求10所述的一種基于預(yù)測(cè)搜索的網(wǎng)絡(luò)文件傳輸方法,其特征是所述的搜索結(jié)果包含的信息包括搜索的文件名,下載地址,包含的文件片斷及其文件片斷大小,搜索的時(shí)間戳和消耗時(shí)間。
12.如權(quán)利要求1、2或3所述的一種基于預(yù)測(cè)搜索的網(wǎng)絡(luò)文件傳輸方法,其特征是步驟i)中在用戶下載網(wǎng)絡(luò)文件過(guò)程中對(duì)后續(xù)文件片斷進(jìn)行預(yù)測(cè)搜索,當(dāng)下載網(wǎng)絡(luò)文件的網(wǎng)絡(luò)地址失效時(shí)直接切換到下一個(gè)可用的網(wǎng)絡(luò)下載位置。
13.如權(quán)利要求8所述的一種基于預(yù)測(cè)搜索的網(wǎng)絡(luò)文件傳輸方法,其特征是步驟d)中還設(shè)有預(yù)測(cè)搜索停止條件,當(dāng)滿足預(yù)測(cè)搜索停止條件時(shí),停止預(yù)測(cè)搜索,所述的預(yù)測(cè)搜索停止條件是設(shè)定的搜索時(shí)間或者搜索次數(shù),或者是用戶切換網(wǎng)頁(yè)的操作;步驟e)中還包括對(duì)搜索結(jié)果進(jìn)行管理,記錄請(qǐng)求搜索時(shí)間消耗,有效時(shí)間戳,利用這些搜索結(jié)果來(lái)優(yōu)化下一次的搜索路徑;步驟i)中在用戶下載文件過(guò)程中對(duì)后續(xù)文件片斷進(jìn)行預(yù)測(cè)搜索,當(dāng)獲取文件的網(wǎng)絡(luò)下載地址失效時(shí)直接切換到下一個(gè)可用的網(wǎng)絡(luò)下載地址。
14.如權(quán)利要求1、2或3所述的一種基于預(yù)測(cè)搜索的網(wǎng)絡(luò)文件傳輸方法,其特征是所述的網(wǎng)絡(luò)文件是視頻數(shù)據(jù)文件、流媒體文件、流媒體流數(shù)據(jù)、音頻文件、視音頻數(shù)據(jù)或網(wǎng)絡(luò)大數(shù)據(jù)量的文件。
全文摘要
本發(fā)明涉及一種基于預(yù)測(cè)搜索的網(wǎng)絡(luò)文件傳輸方法,屬于網(wǎng)絡(luò)傳輸領(lǐng)域。在點(diǎn)對(duì)點(diǎn)(P2P)系統(tǒng)中,客戶端獲取大文件、大軟件特別是網(wǎng)絡(luò)視頻文件前必須先搜索網(wǎng)絡(luò)文件所在的網(wǎng)絡(luò)位置即下載地址,而現(xiàn)有的搜索方法通常比較耗時(shí),客戶端必須等到搜索返回結(jié)果后才能進(jìn)行獲取文件操作,導(dǎo)致用戶只能等待,無(wú)法及時(shí)播放視頻文件,用戶體驗(yàn)啟動(dòng)時(shí)間長(zhǎng)非常不好。本發(fā)明所述的方法,在客戶端未發(fā)送請(qǐng)求前,根據(jù)客戶端當(dāng)時(shí)的特征信息進(jìn)行預(yù)測(cè)分析,提前搜索,當(dāng)用戶實(shí)際發(fā)送請(qǐng)求時(shí)匹配預(yù)測(cè)的搜索結(jié)果,即可從定位到的網(wǎng)絡(luò)位置獲取視頻文件。采用本發(fā)明所述的方法,可以在很大程度上減少了用戶網(wǎng)絡(luò)文件下載的啟動(dòng)的時(shí)間,促進(jìn)視頻網(wǎng)絡(luò)應(yīng)用的普及和發(fā)展。
文檔編號(hào)G06F17/30GK1885823SQ200610012118
公開(kāi)日2006年12月27日 申請(qǐng)日期2006年6月6日 優(yōu)先權(quán)日2006年6月6日
發(fā)明者李春華, 管雷, 楊列森, 郭宗明 申請(qǐng)人:北京北大方正電子有限公司, 北京大學(xué)