欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種自動更改字幕播放時間的方法和裝置的制作方法

文檔序號:6782511閱讀:143來源:國知局
專利名稱:一種自動更改字幕播放時間的方法和裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,特別涉及一種自動更改字幕播放時間的方法和裝置。
背景技術(shù)
目前,互聯(lián)網(wǎng)上有很多試聽媒體資源,通過一些播放器及播放頁面,互聯(lián)網(wǎng)上的音 頻視頻資源能夠?qū)崿F(xiàn)同步播放,即,在播放歌曲的同時同步播放該句歌曲所對應(yīng)的歌詞。
能夠?qū)崿F(xiàn)上述播放方式的歌詞,通常是一種具有特殊格式的歌詞——格式歌詞 (LRC),所謂格式歌詞是一種具有時間標記的歌詞數(shù)據(jù),即第N行歌詞應(yīng)該在第M秒展現(xiàn)出 來,當然,也可以精確到令歌詞的每個字在哪個時刻展現(xiàn)出來,最常見的有應(yīng)用于卡拉OK 的滾動歌詞等等。 播放歌曲與歌詞同步的過程是由程序控制的,即將當前的播放時間與LRC歌詞的 時間對應(yīng)起來。 為了方便說明本發(fā)明,下面先介紹幾個概念 媒體資源內(nèi)容,通常,一個媒體資源內(nèi)容本身存在兩部分信息,標識信息和數(shù)據(jù)實 體,標識信息起到標簽的作用,如記錄歌名、歌手、比特率等等,該標識信息可以作為信息頭 也可以作為信息尾;數(shù)據(jù)實體即是實際播放的媒體信息,播放器通過對數(shù)據(jù)的解析可以實 現(xiàn)播放。 資源,可以被理解為一個鏈接(link),此時期是指在互聯(lián)網(wǎng)上的統(tǒng)一資源定位符 (URL)地址;其還可以被理解為通過地址可以進行播放的音頻、視頻等文件。 一個音頻、視 頻文件通常對應(yīng)多個URL地址。 文本組,對標識信息描述相同的一組數(shù)據(jù),如存在信息A和信息B所描述的歌名、 歌手都是"小城故事"、"鄧麗君",那么,信息A和信息B就屬于同一個文本組。
由上述關(guān)系可知, 一個文本組是標識信息相同的一組數(shù)據(jù),但是,這些標識信息雖 然相同,但其所對應(yīng)的媒體資源內(nèi)容卻很可能不同。比如,標識信息同為"小城故事"、"鄧麗 君",但有的是MP3格式的,有的則可能是wma格式的。 在現(xiàn)有技術(shù)中,不同的商家或音樂愛好者對音樂文件的制作方式不同,如,壓制方 式不同,或者,為了自身的需要抹掉了一部分數(shù)據(jù),這樣,很可能出現(xiàn)這種情況原來在開始 后10秒開始播放的歌詞變?yōu)閼?yīng)該在開始后6秒開始播放,而歌詞本身是不能獲知具體什么 時候開始播放的,而是仍按照原來已設(shè)定的時間標記進行播放,進而導(dǎo)致歌詞的播放時間 與原歌曲不同步,如,可能造成提前或錯后播放歌詞字幕。

發(fā)明內(nèi)容
本發(fā)明實施例在于提供一種自動更改字幕播放時間的方法和裝置,以解決音樂文
件在被通過不同的方式制作后,字幕與歌曲不同步的問題。 本發(fā)明實施例提供了一種自動更改字幕播放時間的方法,包括
收集資源的字幕時間信息; 對所有該資源所在的聚類所對應(yīng)字幕時間信息中的時間信息進行計算,利用該計 算結(jié)果修正字幕播放時間; 將所述聚類中所有資源播放字幕的時間對應(yīng)為修正后的字幕播放時間。 其中,所述收集到的字幕時間信息來源于終端,所述字幕時間信息中包括時間信息。 其中,所述收集到的字幕時間信息來源于網(wǎng)絡(luò)側(cè);所述字幕時間信息中包括時間信息。 其中,所述時間信息為字幕播放時間或字幕調(diào)整時間。 其中,所述方法進一步包括將所收集到的字幕播放時間保存到時間數(shù)據(jù)庫。
其中,所述收集到資源的字幕時間信息之后,還包括 判斷所述字幕時間信息中的時間信息是否為噪聲數(shù)據(jù),若是則丟棄,否則保存該 字幕播放時間。
其中,所述判斷字幕時間信息是否為噪聲數(shù)據(jù)的方式包括 判斷所述字幕時間信息是否來自于位于黑名單中的設(shè)備標識,若是,則判定所述
收集到的字幕時間信息為噪聲數(shù)據(jù), 禾P /或, 判斷所述字幕時間信息中的時間信息是否大于已設(shè)置的調(diào)整量閾值,若是,則判
定所述收集到的字幕時間信息為噪聲數(shù)據(jù),否則判定為非噪聲數(shù)據(jù)。 其中,對該資源所在的聚類所對應(yīng)所有的時間信息進行計算之前,還包括 判斷當前已保存的針對同一聚類的時間信息的個數(shù)是否大于等于已設(shè)置的計算
閾值,若是,再對該資源所在的聚類所對應(yīng)所有的時間信息進行計算,否則,重復(fù)執(zhí)行當前
的判斷操作。 其中,所述字幕時間信息中還包括資源識別參數(shù); 所述對該資源所在的聚類所對應(yīng)所有的時間信息進行計算,利用該計算結(jié)果修正 字幕播放時間的步驟包括 根據(jù)所述字幕時間信息中的資源識別參數(shù)獲得該資源所在的聚類;
獲取所在的聚類所對應(yīng)所有的時間信息; 對所述所有的時間信息按照預(yù)設(shè)策略進行計算,利用該計算結(jié)果修正字幕播放時 間。 其中,所述按照預(yù)設(shè)策略進行計算得到的計算結(jié)果是時間偏移量或修正后的結(jié)果 時間。 其中,如果所述按照預(yù)設(shè)策略進行計算得到的計算結(jié)果是時間偏移量,則利用該 計算結(jié)果修正字幕播放時間的步驟包括 應(yīng)用當前計算出的時間偏移量與該聚類所對應(yīng)的歷史時間偏移量相加,獲得最終 的字幕播放時間偏移量; 用該最終的字幕播放時間偏移量來修正字幕播放時間。 其中,所述方法還包括將所述修正后的字幕播放時間保存到時間數(shù)據(jù)庫,且所述 修正后的字幕播放時間與其所對應(yīng)的聚類和/或資源識別參數(shù)關(guān)聯(lián)保存;
6
將所述聚類中所有資源播放字幕的時間對應(yīng)為修正后的字幕播放時間的步驟包 括 根據(jù)所述字幕時間信息中的資源識別參數(shù)獲得該字幕時間信息所指示的聚類; 從所述時間數(shù)據(jù)庫中獲取該聚類所對應(yīng)的修正后的字幕播放時間; 將所述聚類所對應(yīng)字幕整體提前或延后至所述修正后的字幕播放時間。 其中,所述方法還包括將所述修正后的字幕播放時間保存到時間數(shù)據(jù)庫,且所述
修正后的字幕播放時間與其所對應(yīng)的聚類中的詞句、及資源識別參數(shù)關(guān)聯(lián)保存; 將所述的聚類中所有資源播放字幕的時間調(diào)整為修正后的字幕播放時間的步驟
包括 根據(jù)所述字幕時間信息中的資源識別參數(shù)獲得該字幕時間信息所指示的聚類;
從所述時間數(shù)據(jù)庫中獲取該聚類中的詞句所對應(yīng)的修正后的字幕播放時間;
將所述聚類所對應(yīng)詞句提前或延后至所述修正后的字幕播放時間。
其中,所述字幕時間信息中的資源識別參數(shù)包括資源的大小(Size)、資源的后 綴名(postfix)和資源的比特率(bitrate)。 其中,所述字幕時間信息中的資源識別參數(shù)還包括資源的時長(duration)。
本發(fā)明實施例還提供了一種自動更改字幕播放時間的裝置,包括
收集單元,用于收集資源的字幕時間信息; 計算單元,用于對所有該資源所在的聚類所對應(yīng)的字幕時間信息中的時間信息進 行計算,利用該計算結(jié)果修正字幕播放時間; 調(diào)整單元,用于將所述聚類中所有資源播放字幕的時間對應(yīng)為修正后的字幕播放 時間。 其中,所述裝置還包括 噪聲識別單元,用于判斷所述字幕時間信息中的時間信息為噪聲數(shù)據(jù)時,丟棄所
收集到的數(shù)據(jù),判斷所述時間信息為非噪聲數(shù)據(jù)時再通知計算單元進行計算。 其中,所述裝置還包括 計算啟動單元,用于判斷當前針對同一聚類的時間信息的個數(shù)是否大于等于已設(shè) 置的計算閾值,若是,再通知計算單元開始計算,否則,重復(fù)執(zhí)行當前的判斷操作。
其中,所述字幕時間信息中還包括資源識別參數(shù);
所述計算單元包括 聚類獲取單元,用于根據(jù)所述字幕時間信息中的資源識別參數(shù)獲得該資源所在的 聚類; 時間信息獲取單元,獲取所在的聚類所對應(yīng)所有的時間信息; 計算子單元,用于對所述所有的時間信息按照預(yù)設(shè)策略進行計算,利用該計算結(jié)
果修正字幕播放時間。
其中,所述裝置還包括 時間數(shù)據(jù)庫,用于保存所述修正后的字幕播放時間,且所述修正后的字幕播放時 間與其所對應(yīng)的聚類和/或資源識別參數(shù)關(guān)聯(lián)保存;
所述調(diào)整單元包括 第一獲取子單元,用于根據(jù)所述字幕時間信息中的資源識別參數(shù)獲得該字幕時間
7信息所指示的聚類;從所述時間數(shù)據(jù)庫中獲取該聚類所對應(yīng)的修正后的字幕播放時間;
第一調(diào)整子單元,用于將所述聚類所對應(yīng)字幕整體提前或延后至所述修正后的字 幕播放時間。 其中,所述裝置還包括 時間數(shù)據(jù)庫,用于保存所述修正后的字幕播放時間,且所述修正后的字幕播放時 間與其所對應(yīng)的聚類中的詞句、及資源識別參數(shù)關(guān)聯(lián)保存;
所述調(diào)整單元包括 第二獲取子單元,用于根據(jù)所述字幕時間信息中的資源識別參數(shù)獲得該字幕時間 信息所指示的聚類;從所述時間數(shù)據(jù)庫中獲取該聚類中的詞句所對應(yīng)的修正后的字幕播放 時間; 第二調(diào)整子單元,用于將所述聚類所對應(yīng)詞句提前或延后至所述修正后的字幕播 放時間。 其中,所述收集資源的字幕時間信息中包括時間信息,所述時間信息為修正后的 結(jié)果字幕播放時間或字幕調(diào)整時間。 應(yīng)用本發(fā)明實施例提供的自動更改字幕播放時間的方法和裝置,不但解決了字幕 與歌曲不同步的問題,而且至少還具有以下優(yōu)點 不需要人為生產(chǎn)出多份冗余數(shù)據(jù)就可實現(xiàn)自動更新,減少了實現(xiàn)成本。 在不需要人為干預(yù)的情況下,能夠糾正大量錯誤信息,提高了糾錯的效率;再有,
對于一些熱門的歌曲,糾錯的反饋量會比較大,也比較及時,通過本發(fā)明提供的實現(xiàn)方案,
可以快速的糾正錯誤,使下一位用戶受益,從而極大地提高了糾錯的時效性。
由于音像制品的特點是持續(xù)、不間斷的發(fā)布,而變種(壓縮、改變)的資源也是層
出不窮,而本發(fā)明的優(yōu)勢就在于對這類數(shù)據(jù)具有持續(xù)性糾正的能力。 此外,本發(fā)明實施例所提供的自動更改字幕播放時間的方法是針對一個聚類的, 這意味著,當一個資源所對應(yīng)的字幕被調(diào)整后,這個資源所屬聚類的字幕也就被調(diào)整了 ;相 應(yīng)的,對這個聚類中任何一個資源的反饋,都可以認為是對這個聚類的某個資源的反饋,可 以直接參考計算,進而放大了的糾正面積以及收集面積。


為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例中所需要使用的 附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng) 域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附 圖。
圖1是根據(jù)本發(fā)明實施例的自動更改字幕播放時間的方法流程圖;
圖2是根據(jù)本發(fā)明實施例的一較佳實施例的流程圖; 圖3是根據(jù)本發(fā)明實施例的自動更改格式歌詞播放時間的系統(tǒng)結(jié)構(gòu)示意圖。
具體實施例方式
下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完 整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他 實施例,都屬于本發(fā)明保護的范圍。 圖1是根據(jù)本發(fā)明實施例的一種自動更改格式歌詞播放時間的方法流程圖,具體 包括步驟如下 步驟101,收集資源的字幕時間信息; 上述字幕時間信息包括時間信息,還可以包括資源識別參數(shù);其中,時間信息為 字幕播放時間或字幕調(diào)整時間;資源識別參數(shù)包括資源的大小(Size)、資源的后綴名 (postfix)和資源的比特率(bitrate),還可以包括資源的時長(duration)。根據(jù)資源識別 參數(shù)即可得到與之匹配的聚類。 通常,在試聽頁面的歌詞同步功能中,會有用于調(diào)整歌詞時間的時間軸調(diào)整工具, 一般的,可以通過拖拽或加減時間的方式實現(xiàn)對歌詞時間軸的調(diào)整。當用戶發(fā)現(xiàn)歌詞的時 間軸與歌曲不同步時,會有部分用戶嘗試修正,即通過拖拽或加減時間的方式實現(xiàn)對歌詞 時間軸的調(diào)整,以使歌詞與歌曲同步。也就是說,所收集的字幕時間信息可以來源于用戶終
丄山順。 需要說明的是,還有可能的情況是,用戶沒有對歌詞時間進行修改,完全認可現(xiàn)在 的播放時間,還有可能的情況是,網(wǎng)上存放的未經(jīng)修改過的歌詞播放時間,這種播放時間可 以通過服務(wù)器端識別是否存在相同的聚類,如果存在,就把這種網(wǎng)上保存的字幕播放時間 也作為參考數(shù)據(jù)記錄在時間數(shù)據(jù)庫中。 例如,甲乙丙丁四個用戶,他們都得到了一個屬于相同聚類的mp3文件及其對應(yīng) 的相同或不同版本的歌詞播放時間,甲聽過歌曲并看了歌詞之后,認為歌詞播放時間正確, 于是,網(wǎng)絡(luò)服務(wù)器獲取了一份與甲得到的原歌詞播放時間相同的數(shù)據(jù)信息。然后,乙認為他 的歌詞播放時間也正確,于是把mp3文件和歌詞播放時間上傳到了網(wǎng)上,那么網(wǎng)絡(luò)服務(wù)器 通過識別乙上傳的mp3文件所在聚類,獲知乙上傳的歌詞播放時間所對應(yīng)的聚類,于是把 乙對應(yīng)上傳的歌詞播放時間也對應(yīng)該聚類進行記錄。丙聽完之后認為歌曲中某歌詞的播放 時間需要提前1秒,于是進行了修改,這種修改和原先的字幕播放時間被網(wǎng)絡(luò)服務(wù)器獲取, 于是網(wǎng)絡(luò)服務(wù)器把修改后的歌詞播放時間也保存在了對應(yīng)聚類的時間數(shù)據(jù)庫中。丁聽完之 后認為歌曲中某句歌詞的播放時間需要提前0. 5秒,于是也進行了修改,并把修改后的歌 詞播放時間與mp3文件所屬聚類或者資源識別參數(shù)或者mp3文件對應(yīng)上傳至網(wǎng)絡(luò)中,這種 修改后的字幕播放時間被網(wǎng)絡(luò)服務(wù)器獲取,并保存在相同聚類對應(yīng)的時間數(shù)據(jù)庫中。
也就是說,所述收集到的字幕時間信息可以來源于終端,也可以來源于網(wǎng)絡(luò)側(cè)。
收集之后,還可以進一步包括將所收集到的時間信息保存到時間數(shù)據(jù)庫。
步驟102,對該資源所在的聚類所對應(yīng)所有的時間信息進行計算,利用該計算結(jié)果 修正字幕播放時間; 由于所述字幕時間信息中還包括資源識別參數(shù),因而,步驟102可以具體包括
I)根據(jù)所述字幕時間信息中的資源識別參數(shù)獲得該資源所在的聚類;
II)獲取所在的聚類所對應(yīng)所有的時間信息; 需要說明的是,所有歷史數(shù)據(jù)對時間偏移量都具有相同的參考意義。S卩,歌曲、歌 詞不會隨著時間變化而發(fā)生改變,簡單的說就是半年前的反饋信息與今天剛剛反饋的信息 價值一樣,因而,對所述聚類所對應(yīng)的所有時間信息進行計算的含義就是會將以前的反饋(如半年前的反饋)與當前的反饋綜合起來一起計算。本步驟中的所有時間信息即包括所
收集到所有信息,其是沒有時間限制的,可能有一年前的也有今天剛剛收集到的。 III)對所述所有的時間信息按照預(yù)設(shè)策略進行計算,利用該計算結(jié)果修正字幕播
放時間。 在實際計算時可以有多種實現(xiàn)方式,例如,一種可能的實現(xiàn)方式是假設(shè)針對一個 聚類共有12個已保存的調(diào)整時間,其中8個調(diào)整時間指示提前3秒播放,兩個指示提前2秒 播放,兩個指示延后1. 5秒播放,那么在假設(shè)上述數(shù)據(jù)都不屬于噪音數(shù)據(jù)的前提下,可以對 12個數(shù)進行簡單加平均后得到提前2. 08秒,即得到當前計算出的時間偏移量為2. 08秒。
需要說明的是,本發(fā)明實施例并不對具體的計算策略進行限定,在實際應(yīng)用中,可 以根據(jù)實際情況隨時制定及調(diào)整。 上述按照預(yù)設(shè)策略進行計算得到的計算結(jié)果是時間偏移量或修正后的結(jié)果時間。 如果所述按照預(yù)設(shè)策略進行計算得到的計算結(jié)果是時間偏移量,則利用該計算結(jié)果修正字 幕播放時間的步驟包括應(yīng)用當前計算出的時間偏移量與該聚類所對應(yīng)的歷史時間偏移量 相加,獲得最終的字幕播放時間偏移量;用該最終的字幕播放時間偏移量來修正后字幕播 放時間。需要說明的是,如果之前已經(jīng)計算過時間偏移量,則此時的歷史時間偏移量就是之 前已經(jīng)計算出的偏移量;如果之前沒有計算過時間偏移量,則此時的歷史偏移量為0。
例如,可以根據(jù)所述字幕時間信息中的資源識別參數(shù)獲得該字幕時間信息所指示 的聚類,對所述聚類所對應(yīng)的所有時間信息進行計算,獲得字幕播放時間偏移量;將所述字 幕播放時間偏移量保存到時間數(shù)據(jù)庫中。 步驟103,將所述聚類中所有資源播放字幕的時間對應(yīng)為修正后的字幕播放時間。
需要說明的是,還可以將所述修正后的字幕播放時間保存到時間數(shù)據(jù)庫,且所述 修正后的字幕播放時間與其所對應(yīng)的聚類和/或資源識別參數(shù)關(guān)聯(lián)保存;那么,步驟103可 以具體包括 根據(jù)所述字幕時間信息中的資源識別參數(shù)獲得該字幕時間信息所指示的聚類;
從所述時間數(shù)據(jù)庫中獲取該聚類所對應(yīng)的修正后的字幕播放時間;
將所述聚類所對應(yīng)字幕整體提前或延后至所述修正后的字幕播放時間。
例如,如果已設(shè)置字幕的播放時間為從開始后IO秒開始播放,而時間偏移量為提 前3. 5秒,那么該字幕如歌曲所對應(yīng)的歌詞將從開始后6. 5秒開始播放,從而將整體開始播 放的時間提前;可以理解,如果已設(shè)置字幕的播放時間為從開始后IO秒開始播放,而時間 偏移量為延后3. 5秒,那么該歌曲所對應(yīng)的字幕如歌詞將從開始后13. 5秒開始播放,從而 將整體開始播放的時間延后,這樣,通過在整體上提前或延后播放時間,達到自動調(diào)整播放 時間的目的,以使歌曲和歌詞對應(yīng)。 需要說明的是,還可以將所述修正后的字幕播放時間保存到時間數(shù)據(jù)庫,且所述 修正后的字幕播放時間與其所對應(yīng)的聚類中的詞句、及資源識別參數(shù)關(guān)聯(lián)保存;那么,步驟 103可以具體包括 根據(jù)所述字幕時間信息中的資源識別參數(shù)獲得該字幕時間信息所指示的聚類;
從所述時間數(shù)據(jù)庫中獲取該聚類中的詞句所對應(yīng)的修正后的字幕播放時間;
將所述聚類所對應(yīng)詞句提前或延后至所述修正后的字幕播放時間。
—種可能的情況是,當播放所述聚類所對應(yīng)的資源時,從所述時間數(shù)據(jù)庫中獲得字幕播放時間偏移量,根據(jù)所述時間偏移量確定字幕的實際的播放時間。具體的,有兩種更 改字幕播放時間的方式一種是更改字幕的整體播放時間,即將待播放字幕整體的提前或 延后一段時間進行播放;另一種是更改詞句的播放時間,即對待播放字幕中的某一句或幾 句,某一個字或幾個字進行調(diào)整。兩種調(diào)整方式的實現(xiàn)原理都是一樣的,區(qū)別僅在于實現(xiàn)的 粒度。 需要說明的是,在上述步驟101中,對收集到的數(shù)據(jù)保存之前,還可以包括判斷 所收集到的字幕時間信息中的時間信息是否為噪聲數(shù)據(jù),若是則丟棄,否則再保存。從而避 免惡意信息來擾亂本發(fā)明實施例所提供的調(diào)整方法。例如,一首歌曲總長5分鐘,而反饋的 歌詞時間調(diào)整數(shù)據(jù)中的調(diào)整時間是4分鐘,通常,認為這種反饋是惡意反饋的,屬于噪聲數(shù) 據(jù),而如果多次接收到這個用戶的這種惡意反饋,則可以將這個設(shè)備標識加入到黑名單,之 后不再采納此設(shè)備標識反饋的字幕時間信息。當然,具體的除噪策略及實現(xiàn)方法會根據(jù)需 求的不同而不同,這里并不對具體的除噪策略及除噪方法進行限定,只是說明需要除去不 符合需求的噪聲數(shù)據(jù)。以下僅以兩種可能的方式為例,來說明如何判斷字幕時間信息中的 時間信息是否為噪聲數(shù)據(jù) 方式一,首先,判斷字幕時間信息中的時間信息是否來自于位于黑名單中的設(shè)備 標識,若是,則判定所述收集到的字幕時間信息為噪聲數(shù)據(jù),否則, 再判斷所述歌詞時間調(diào)整數(shù)據(jù)中的時間信息是否大于已設(shè)置的調(diào)整量閾值,若 是,則判定所述收集到的字幕時間信息為噪聲數(shù)據(jù),否則判定為非噪聲數(shù)據(jù);其中,上述調(diào) 整量閾值為預(yù)先根據(jù)需要或經(jīng)驗設(shè)定的值,例如,可以設(shè)置為歌曲時長的10%,即對于時長 為5分鐘的歌曲,如果時間信息超過30秒即判定其是噪聲數(shù)據(jù)。 方式二,判斷字幕時間信息中的時間信息是否大于已設(shè)置的調(diào)整量閾值,若是,則 判定所述收集到的字幕時間信息為噪聲數(shù)據(jù),否則判定為非噪聲數(shù)據(jù)。 方式三,判斷字幕時間信息中的時間信息是否來自于位于黑名單中的設(shè)備標識,
若是,則判定所述收集到的字幕時間信息為噪聲數(shù)據(jù),否則判定為非噪聲數(shù)據(jù)。 上述方式二與方式一,相比,少了對黑名單的判斷,方式三與方式一,相比,少了對
調(diào)整量閾值的判斷,以上僅僅是幾個實施例而已,并不用于限制本發(fā)明中對噪聲數(shù)據(jù)的具
體限定方法。 需要說明的說,如存在較特殊的情況,例如,大量對同一首歌反饋的時間調(diào)整都超 過了歌曲時長的10%即超過了所設(shè)定的調(diào)整量閾值,則需要特殊對待,這屬于比較特殊的 情況,本文對此不再論述。 需要說明的是,在上述步驟102中,對同一聚類所對應(yīng)的所有時間信息進行計算
之前,還可以包括判斷當前已保存的針對同一所述聚類的時間信息的個數(shù)是否大于等于
已設(shè)置的計算閾值,若是,再對所述聚類所對應(yīng)的所有時間信息進行計算,否則,重復(fù)執(zhí)行
當前的判斷操作。具體而言,每當接收到一個用戶終端反饋的字幕時間信息時,就會判斷當
前已保存的針對該聚類的時間信息的個數(shù)是否已經(jīng)大于等于已設(shè)置的計算閾值。 上述計算閾值可以根據(jù)需要或經(jīng)驗確定,例如,可以設(shè)置為10或50等,以表明當
有10個或50個累積保存的歌詞時間調(diào)整數(shù)據(jù)時,就開始對同一聚類所對應(yīng)的所有時間信
息進行計算,也就是說,對于初始階段,即針對某一聚類反饋的數(shù)量小于計算閾值時,不會
進行計算,當反饋的數(shù)量一旦等于或超過計算閾值,則對該聚類而言每接收到一個反饋都會執(zhí)行一次計算。增加這個步驟的目的是,可以避免個別的錯誤反饋導(dǎo)致服務(wù)器的調(diào)整錯誤。 需要說明的是,對于更改字幕的整體播放時間且反饋方為用戶終端的情況,可以 認為在一預(yù)設(shè)的時間段內(nèi)同一用戶終端對同一首歌的多次反饋中最后一次是有效的,具體 的,可通過替換或其他事項方式實現(xiàn),當然還可以有其他的多種實現(xiàn)方法,這里不再詳述, 本發(fā)明實施例并不對該具體的實現(xiàn)方式做限定。對于更改詞句的播放時間,可以認為同一 用戶終端每次發(fā)出的針對不同詞句的反饋都是有效的,具體的實現(xiàn)方式也有很多種,這里 并不對具體的實現(xiàn)方式加以限定。 參見圖2,其是根據(jù)本發(fā)明實施例的一較佳實施例的流程圖。本實施例中,用戶可 以通過拖動右側(cè)的時間軸來調(diào)整歌詞的播放時間,也可以通過調(diào)整右上部的"歌詞快一秒" 和"歌詞慢一秒"的按鈕來調(diào)整歌詞的播放時間,無論哪種方式,用戶終端都會將用戶作出 的字幕時間信息發(fā)送出去。該字幕時間信息中包括資源識別參數(shù)以及時間信息;其中,資源 識別參數(shù)包括用于識別某個資源的Size、postf ix和bitrate,還可以包括duration,根據(jù) 資源識別參數(shù)即可得到與之匹配的資源內(nèi)容。 糾正信息收集平臺將收集到的來自用戶終端的字幕時間信息傳送給信息糾正平 臺,信息糾正平臺中的噪音分析模塊判斷接收到的字幕時間信息是否為噪聲數(shù)據(jù),若是則 丟棄或?qū)⒔邮盏降臄?shù)據(jù)存入惡意反饋數(shù)據(jù)庫,否則再將接收到的字幕時間信息傳送給信息 糾正平臺中的糾正計算模塊。 糾正計算模塊判斷當前已保存的針對同一聚類的時間信息的個數(shù)是否大于等于 已設(shè)置的計算閾值,若否,則重復(fù)執(zhí)行當前的判斷操作;若是,則對同一聚類所對應(yīng)的所有 時間信息進行計算,獲得字幕播放時間偏移量;將該字幕播放時間偏移量保存到時間數(shù)據(jù) 庫中。 當再次播放所述聚類所對應(yīng)的資源時,根據(jù)待播放字幕的實際時間和字幕播放時 間偏移量確定實際的播放時間,例如,提前或延后一段時間來播放整段歌詞,或者,提前或 延后一段時間來播放某個詞句。 應(yīng)用本發(fā)明實施例提供的自動更字幕播放時間的方法,不需要人為生產(chǎn)出多份冗 余數(shù)據(jù)就可實現(xiàn)自動更新,減少了實現(xiàn)成本;并且,在不需要人為干預(yù)的情況下,能夠糾正 大量錯誤信息,提高了糾錯的效率;再有,對于一些熱門的歌曲,糾錯的反饋量會比較大,也 比較及時,通過本發(fā)明提供的實現(xiàn)方案,可以快速的糾正錯誤,使下一位用戶受益,從而極 大地提高了糾錯的時效性。再有,由于音像制品的特點是持續(xù)、不間斷的發(fā)布,而變種(壓 縮、改變)的資源也是層出不窮,而本發(fā)明的優(yōu)勢就在于對這類數(shù)據(jù)具有持續(xù)性糾正的能 力。 此外,根據(jù)前述可知,本發(fā)明實施例所提供的自動更改字幕播放時間的方法是針 對一個聚類的,這意味著,當一個資源鏈接所對應(yīng)的歌詞被調(diào)整后,這個資源鏈接所屬聚類 的歌詞也就被調(diào)整了 ;相應(yīng)的,對這個聚類中任何一個資源鏈接的反饋,都可以認為是對這 個聚類的某個資源鏈接的反饋,可以直接參考計算,進而放大了的糾正面積以及收集面積。
本發(fā)明實施例還提供了一種自動更改字幕播放時間的系統(tǒng),參見圖3,具體包括
收集單元301,用于收集資源的字幕時間信息; 計算單元302,用于對所有該資源所在的聚類所的字幕時間信息的時間信息進行計算,利用該計算結(jié)果修正字幕播放時間; 調(diào)整單元303,用于將所述聚類中所有資源播放字幕的時間對應(yīng)為修正后的字幕 播放時間。 上述裝置還可以包括 噪聲識別單元(圖未示),用于判斷所述字幕時間信息為噪聲數(shù)據(jù)時,丟棄所收 集到的數(shù)據(jù),判斷所述字幕時間信息中的時間信息為非噪聲數(shù)據(jù)時再通知計算單元進行計算。 上述裝置還可以包括 計算啟動單元(圖未示),用于判斷當前針對同一聚類的時間信息的個數(shù)是否大 于等于已設(shè)置的計算閾值,若是,再通知計算單元開始計算,否則,重復(fù)執(zhí)行當前的判斷操 作。 上述字幕時間信息中還包括資源識別參數(shù);所述計算單元可以具體包括 聚類獲取單元,用于根據(jù)所述字幕時間信息中的資源識別參數(shù)獲得該資源所在的
聚類; 時間信息獲取單元,獲取所在的聚類所對應(yīng)所有的時間信息; 計算子單元,用于對所述所有的時間信息按照預(yù)設(shè)策略進行計算,利用該計算結(jié) 果修正字幕播放時間。 上述裝置還可以包括時間數(shù)據(jù)庫,用于保存所述修正后的字幕播放時間,且所述 修正后的字幕播放時間與其所對應(yīng)的聚類和/或資源識別參數(shù)關(guān)聯(lián)保存;所述調(diào)整單元包 括 第一獲取子單元,用于根據(jù)所述字幕時間信息中的資源識別參數(shù)獲得該字幕時間 信息所指示的聚類;從所述時間數(shù)據(jù)庫中獲取該聚類所對應(yīng)的修正后的字幕播放時間;
第一調(diào)整子單元,用于將所述聚類所對應(yīng)字幕整體提前或延后至所述修正后的字 幕播放時間。 上述裝置還可以包括時間數(shù)據(jù)庫,用于保存所述修正后的字幕播放時間,且所述 修正后的字幕播放時間與其所對應(yīng)的聚類中的詞句、及資源識別參數(shù)關(guān)聯(lián)保存;所述調(diào)整 單元可以具體包括 第二獲取子單元,用于根據(jù)所述字幕時間信息中的資源識別參數(shù)獲得該字幕時間 信息所指示的聚類;從所述時間數(shù)據(jù)庫中獲取該聚類中的詞句所對應(yīng)的修正后的字幕播放 時間; 第二調(diào)整子單元,用于將所述聚類所對應(yīng)詞句提前或延后至所述修正后的字幕播 放時間。 所述收集資源的字幕時間信息中包括時間信息,所述時間信息為修正后的結(jié)果字 幕播放時間或字幕調(diào)整時間。 應(yīng)用本發(fā)明實施例提供的自動更字幕播放時間的裝置,不需要人為生產(chǎn)出多份冗 余數(shù)據(jù)就可實現(xiàn)自動更新,減少了實現(xiàn)成本;并且,在不需要人為干預(yù)的情況下,能夠糾正 大量錯誤信息,提高了糾錯的效率;再有,對于一些熱門的歌曲,糾錯的反饋量會比較大,也 比較及時,通過本發(fā)明提供的實現(xiàn)方案,可以快速的糾正錯誤,使下一位用戶受益,從而極 大地提高了糾錯的時效性。再有,由于音像制品的特點是持續(xù)、不間斷的發(fā)布,而變種(壓
13縮、改變)的資源也是層出不窮,而本發(fā)明的優(yōu)勢就在于對這類數(shù)據(jù)具有持續(xù)性糾正的能 力。 此外,根據(jù)前述可知,本發(fā)明實施例所提供的自動更改字幕播放時間的方法是針 對一個聚類的,這意味著,當一個資源鏈接所對應(yīng)的歌詞被調(diào)整后,這個資源鏈接所屬聚類 的歌詞也就被調(diào)整了 ;相應(yīng)的,對這個聚類中任何一個資源鏈接的反饋,都可以認為是對這 個聚類的某個資源鏈接的反饋,可以直接參考計算,進而放大了的糾正面積以及收集面積。
對于裝置實施例而言,由于其基本相似于方法實施例,所以描述的比較簡單,相關(guān) 之處參見方法實施例的部分說明即可。 需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個實 體或者操作與另一個實體或操作區(qū)分開來,而不一定要求或者暗示這些實體或操作之間存 在任何這種實際的關(guān)系或者順序。而且,術(shù)語"包括"、"包含"或者其任何其他變體意在涵 蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要 素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備
所固有的要素。在沒有更多限制的情況下,由語句"包括一個......"限定的要素,并不排
除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。 本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述方法實施方式中的全部或部分步驟是可
以通過程序來指令相關(guān)的硬件來完成,所述的程序可以存儲于計算機可讀取存儲介質(zhì)中,
這里所稱得的存儲介質(zhì),如R0M/RAM、磁碟、光盤等。 以上所述僅為本發(fā)明的較佳實施例而已,并非用于限定本發(fā)明的保護范圍。凡在 本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換、改進等,均包含在本發(fā)明的保護范圍 內(nèi)。
權(quán)利要求
一種自動更改字幕播放時間的方法,其特征在于,包括收集資源的字幕時間信息;對所有該資源所在的聚類所對應(yīng)字幕時間信息中的時間信息進行計算,利用該計算結(jié)果修正字幕播放時間;將所述聚類中所有資源播放字幕的時間對應(yīng)為修正后的字幕播放時間。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述收集到的字幕時間信息來源于終端,所述字幕時間信息中包括時間信息。
3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述收集到的字幕時間信息來源于網(wǎng)絡(luò)側(cè);所述字幕時間信息中包括時間信息。
4. 根據(jù)權(quán)利要求1、2或3所述的方法,其特征在于,所述時間信息為字幕播放時間或字幕調(diào)整時間。
5. 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述方法進一步包括將所收集到的字幕播放時間保存到時間數(shù)據(jù)庫。
6. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述收集到資源的字幕時間信息之后,還包括判斷所述字幕時間信息中的時間信息是否為噪聲數(shù)據(jù),若是則丟棄,否則保存該字幕播放時間。
7. 根據(jù)權(quán)利要求6所述的方法,其特征在于,所述判斷字幕時間信息是否為噪聲數(shù)據(jù)的方式包括判斷所述字幕時間信息是否來自于位于黑名單中的設(shè)備標識,若是,則判定所述收集到的字幕時間信息為噪聲數(shù)據(jù),和/或,判斷所述字幕時間信息中的時間信息是否大于已設(shè)置的調(diào)整量閾值,若是,則判定所述收集到的字幕時間信息為噪聲數(shù)據(jù),否則判定為非噪聲數(shù)據(jù)。
8. 根據(jù)權(quán)利要求1所述的方法,其特征在于,對該資源所在的聚類所對應(yīng)所有的時間信息進行計算之前,還包括判斷當前已保存的針對同一聚類的時間信息的個數(shù)是否大于等于已設(shè)置的計算閾值,若是,再對該資源所在的聚類所對應(yīng)所有的時間信息進行計算,否則,重復(fù)執(zhí)行當前的判斷操作。
9. 根據(jù)權(quán)利要求l所述的方法,其特征在于,所述字幕時間信息中還包括資源識別參數(shù);所述對該資源所在的聚類所對應(yīng)所有的時間信息進行計算,利用該計算結(jié)果修正字幕播放時間的步驟包括根據(jù)所述字幕時間信息中的資源識別參數(shù)獲得該資源所在的聚類;獲取所在的聚類所對應(yīng)所有的時間信息;對所述所有的時間信息按照預(yù)設(shè)策略進行計算,利用該計算結(jié)果修正字幕播放時間。
10. 根據(jù)權(quán)利要求9所述的方法,其特征在于,所述按照預(yù)設(shè)策略進行計算得到的計算結(jié)果是時間偏移量或修正后的結(jié)果時間。
11. 根據(jù)權(quán)利要求io所述的方法,其特征在于,如果所述按照預(yù)設(shè)策略進行計算得到的計算結(jié)果是時間偏移量,則利用該計算結(jié)果修正字幕播放時間的步驟包括應(yīng)用當前計算出的時間偏移量與該聚類所對應(yīng)的歷史時間偏移量相加,獲得最終的字幕播放時間偏移量;用該最終的字幕播放時間偏移量來修正字幕播放時間。
12. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括將所述修正后的字幕播放時間保存到時間數(shù)據(jù)庫,且所述修正后的字幕播放時間與其所對應(yīng)的聚類和/或資源識別參數(shù)關(guān)聯(lián)保存;將所述聚類中所有資源播放字幕的時間對應(yīng)為修正后的字幕播放時間的步驟包括根據(jù)所述字幕時間信息中的資源識別參數(shù)獲得該字幕時間信息所指示的聚類;從所述時間數(shù)據(jù)庫中獲取該聚類所對應(yīng)的修正后的字幕播放時間;將所述聚類所對應(yīng)字幕整體提前或延后至所述修正后的字幕播放時間。
13. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括將所述修正后的字幕播放時間保存到時間數(shù)據(jù)庫,且所述修正后的字幕播放時間與其所對應(yīng)的聚類中的詞句、及資源識別參數(shù)關(guān)聯(lián)保存;將所述的聚類中所有資源播放字幕的時間調(diào)整為修正后的字幕播放時間的步驟包括根據(jù)所述字幕時間信息中的資源識別參數(shù)獲得該字幕時間信息所指示的聚類;從所述時間數(shù)據(jù)庫中獲取該聚類中的詞句所對應(yīng)的修正后的字幕播放時間;將所述聚類所對應(yīng)詞句提前或延后至所述修正后的字幕播放時間。
14. 根據(jù)權(quán)利要求9所述的方法,其特征在于,所述字幕時間信息中的資源識別參數(shù)包括資源的大小(Size)、資源的后綴名(postfix)和資源的比特率(bitrate)。
15. 根據(jù)權(quán)利要求14所述的方法,其特征在于,所述字幕時間信息中的資源識別參數(shù)還包括資源的時長(duration)。
16. —種自動更改字幕播放時間的裝置,其特征在于,包括收集單元,用于收集資源的字幕時間信息;計算單元,用于對所有該資源所在的聚類所對應(yīng)的字幕時間信息中的時間信息進行計算,利用該計算結(jié)果修正字幕播放時間;調(diào)整單元,用于將所述聚類中所有資源播放字幕的時間對應(yīng)為修正后的字幕播放時間。
17. 根據(jù)權(quán)利要求16所述的裝置,其特征在于,所述裝置還包括噪聲識別單元,用于判斷所述字幕時間信息中的時間信息為噪聲數(shù)據(jù)時,丟棄所收集到的數(shù)據(jù),判斷所述時間信息為非噪聲數(shù)據(jù)時再通知計算單元進行計算。
18. 根據(jù)權(quán)利要求16或17所述的裝置,其特征在于,所述裝置還包括計算啟動單元,用于判斷當前針對同一聚類的時間信息的個數(shù)是否大于等于已設(shè)置的計算閾值,若是,再通知計算單元開始計算,否則,重復(fù)執(zhí)行當前的判斷操作。
19. 根據(jù)權(quán)利要求16所述的裝置,其特征在于,所述字幕時間信息中還包括資源識別參數(shù);所述計算單元包括聚類獲取單元,用于根據(jù)所述字幕時間信息中的資源識別參數(shù)獲得該資源所在的聚類;時間信息獲取單元,獲取所在的聚類所對應(yīng)所有的時間信息;計算子單元,用于對所述所有的時間信息按照預(yù)設(shè)策略進行計算,利用該計算結(jié)果修正字幕播放時間。
20. 根據(jù)權(quán)利要求16所述的裝置,其特征在于,所述裝置還包括時間數(shù)據(jù)庫,用于保存所述修正后的字幕播放時間,且所述修正后的字幕播放時間與其所對應(yīng)的聚類和/或資源識別參數(shù)關(guān)聯(lián)保存;所述調(diào)整單元包括第一獲取子單元,用于根據(jù)所述字幕時間信息中的資源識別參數(shù)獲得該字幕時間信息所指示的聚類;從所述時間數(shù)據(jù)庫中獲取該聚類所對應(yīng)的修正后的字幕播放時間;第一調(diào)整子單元,用于將所述聚類所對應(yīng)字幕整體提前或延后至所述修正后的字幕播放時間。
21. 根據(jù)權(quán)利要求16所述的裝置,其特征在于,所述裝置還包括時間數(shù)據(jù)庫,用于保存所述修正后的字幕播放時間,且所述修正后的字幕播放時間與其所對應(yīng)的聚類中的詞句、及資源識別參數(shù)關(guān)聯(lián)保存;所述調(diào)整單元包括第二獲取子單元,用于根據(jù)所述字幕時間信息中的資源識別參數(shù)獲得該字幕時間信息所指示的聚類;從所述時間數(shù)據(jù)庫中獲取該聚類中的詞句所對應(yīng)的修正后的字幕播放時間;第二調(diào)整子單元,用于將所述聚類所對應(yīng)詞句提前或延后至所述修正后的字幕播放時間。
22. 根據(jù)權(quán)利要求16所述的裝置,其特征在于,所述收集資源的字幕時間信息中包括時間信息,所述時間信息為修正后的結(jié)果字幕播放時間或字幕調(diào)整時間。
全文摘要
本發(fā)明公開了一種自動更改字幕播放時間的方法和裝置,所述方法包括收集資源的字幕時間信息;對所有該資源所在的聚類所對應(yīng)字幕時間信息中的時間信息進行計算,利用該計算結(jié)果修正字幕播放時間;將所述聚類中所有資源播放字幕的時間對應(yīng)為修正后的字幕播放時間。應(yīng)用本發(fā)明,不但解決了字幕與歌曲不同步的問題,而且還具有成本低,糾錯效率高、時效性強,持續(xù)性長等優(yōu)點。
文檔編號G11B27/10GK101727951SQ20091024128
公開日2010年6月9日 申請日期2009年11月27日 優(yōu)先權(quán)日2009年11月27日
發(fā)明者尹卓 申請人:北京搜狗科技發(fā)展有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
大名县| 宁海县| 大新县| 梅河口市| 临江市| 建宁县| 贞丰县| 壶关县| 江达县| 通城县| 南皮县| 方山县| 鄢陵县| 荥阳市| 龙江县| 丹凤县| 石棉县| 体育| 同德县| 广河县| 平和县| 黄龙县| 邹城市| 五台县| 于田县| 普格县| 西林县| 江安县| 广丰县| 任丘市| 新乐市| 家居| 寻乌县| 长海县| 百色市| 通许县| 宁南县| 永兴县| 阳城县| 墨玉县| 牙克石市|