一種智能播放視頻中語音信息的方法及裝置與流程

文檔序號：12279845閱讀：400來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

本發(fā)明涉及視頻播放技術(shù)領(lǐng)域，特別涉及一種智能播放視頻中語音信息的方法及裝置。

背景技術(shù)：

通過各種類型的視頻來學(xué)習(xí)外語，是非常流行的一種外語學(xué)習(xí)方式。通過跟讀的模式可以很好的對比出用戶本人的口語的不足，不看字幕只是聽視頻中語音也可以很好的鍛煉外語聽力能力。但是，除了專門的外語教學(xué)視頻之外，針對一般的外語視頻，用戶需要頻繁的按下暫停鍵和后退鍵，來學(xué)習(xí)其中某一句或幾句的外語語句。這對于用戶而言，長時間內(nèi)頻繁的操作會帶給用戶疲勞的感受，不言而喻用戶體驗是不夠友善的。還有兒童在學(xué)習(xí)語言時，具有很強的模仿傾向，但是除了教學(xué)視頻之外的其他視頻中，因為對話內(nèi)容是緊密相連的，兒童通常沒有足夠的時間去模仿。如何妥善的解決上述問題，就成了業(yè)界亟待解決的課題。

技術(shù)實現(xiàn)要素：

本發(fā)明提供一種智能播放視頻中語音信息的方法及裝置，用以幫助語言學(xué)習(xí)者通過觀賞非語言教學(xué)視頻來學(xué)習(xí)聽力和口語，提高了語言學(xué)習(xí)者的用戶體驗。

根據(jù)本發(fā)明實施例的第一方面，提供一種智能播放視頻中語音信息的方法，包括：

分析視頻中的語句信息；

根據(jù)所述語句信息，識別出所述視頻中的所有整句；

在一個整句播放結(jié)束后，在滿足預(yù)設(shè)的繼續(xù)播放條件的情況下，繼續(xù)播放所述視頻的下一個整句。

在一個實施例中，所述在一個整句播放結(jié)束后，在滿足預(yù)設(shè)的繼續(xù)播放條件的情況下，繼續(xù)播放所述視頻的下一個整句，包括：

在一個整句播放結(jié)束后，重復(fù)播放所述整句；

統(tǒng)計播放所述整句的次數(shù)；

當(dāng)所述次數(shù)達到預(yù)設(shè)的終止閾值時，終止播放所述整句。

在一個實施例中，所述在一個整句播放結(jié)束后，在滿足預(yù)設(shè)的繼續(xù)播放條件的情況下，繼續(xù)播放所述視頻的下一個整句，還包括：

在一個整句播放結(jié)束后，統(tǒng)計出所述整句的播放時長；

根據(jù)所述整句的播放時長和預(yù)設(shè)的擴大系數(shù)，設(shè)置出暫停所述整句的暫停時長；

在當(dāng)一個整句結(jié)束時，在暫停所述暫停時長之后，繼續(xù)播放所述視頻的下一個整句。

在一個實施例中，所述在當(dāng)一個整句結(jié)束時，暫停所述暫停時長之后，繼續(xù)播放所述視頻的下一個整句，包括：

在所述暫停時長的時間間隔內(nèi)，獲取用戶輸入的語音信息；

當(dāng)用戶輸入的語音信息與所述整句的語音信息的相似度大于或等于預(yù)設(shè)的相似度閾值時，繼續(xù)播放所述視頻的下一個整句。

在一個實施例中，所述在當(dāng)一個整句結(jié)束時，暫停所述暫停時長之后，繼續(xù)播放所述視頻的下一個整句，還包括：

在所述暫停時長的時間間隔內(nèi)，獲取用戶輸入的語音信息；

當(dāng)用戶輸入的語音信息與所述整句的語音信息的相似度低于預(yù)設(shè)的相似度閾值時，標記所述整句為用戶需要注意的整句；

詢問用戶是否重復(fù)播放所述整句；

根據(jù)用戶的輸入信息，判斷是否重復(fù)播放所述整句。

根據(jù)本發(fā)明實施例的第二方面，提供一種智能播放視頻中語音信息的裝置，包括：

分析模塊，用于分析視頻中的語句信息；

識別模塊，用于根據(jù)所述語句信息，識別出所述視頻中的所有整句；

播放模塊，用于在一個整句播放結(jié)束后，在滿足預(yù)設(shè)的繼續(xù)播放條件的情況下，繼續(xù)播放所述視頻的下一個整句。

在一個實施例中，所述播放模塊，包括：

第一播放子模塊，用于在一個整句播放結(jié)束后，重復(fù)播放所述整句；

第一統(tǒng)計子模塊，用于統(tǒng)計播放所述整句的次數(shù)；

終止子模塊，用于當(dāng)所述次數(shù)達到預(yù)設(shè)的終止閾值時，終止播放所述整句。

在一個實施例中，所述播放模塊，還包括：

第二統(tǒng)計子模塊，用于在一個整句播放結(jié)束后，統(tǒng)計出所述整句的播放時長；

設(shè)置子模塊，用于根據(jù)所述整句的播放時長和預(yù)設(shè)的擴大系數(shù)，設(shè)置出暫停所述整句的暫停時長；

第二播放子模塊，用于在當(dāng)一個整句結(jié)束時，在暫停所述暫停時長之后，繼續(xù)播放所述視頻的下一個整句。

在一個實施例中，所述第二播放子模塊，還用于在所述暫停時長的時間間隔內(nèi)，獲取用戶輸入的語音信息；當(dāng)用戶輸入的語音信息與所述整句的語音信息的相似度大于或等于預(yù)設(shè)的相似度閾值時，繼續(xù)播放所述視頻的下一個整句。

在一個實施例中，所述第二播放子模塊，還用于在所述暫停時長的時間間隔內(nèi)，獲取用戶輸入的語音信息；當(dāng)用戶輸入的語音信息與所述整句的語音信息的相似度低于預(yù)設(shè)的相似度閾值時，標記所述整句為用戶需要注意的整句；詢問用戶是否重復(fù)播放所述整句；根據(jù)用戶的輸入信息，判斷是否重復(fù)播放所述整句。

本發(fā)明的其它特征和優(yōu)點將在隨后的說明書中闡述，并且，部分地從說明書中變得顯而易見，或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點可通過在所寫的說明書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。

下面通過附圖和實施例，對本發(fā)明的技術(shù)方案做進一步的詳細描述。

附圖說明

附圖用來提供對本發(fā)明的進一步理解，并且構(gòu)成說明書的一部分，與本發(fā)明的實施例一起用于解釋本發(fā)明，并不構(gòu)成對本發(fā)明的限制。在附圖中：

圖1為本發(fā)明一示例性實施例示出的一種智能播放視頻中語音信息的方法的流程圖；

圖2為本發(fā)明一示例性實施例示出的一種智能播放視頻中語音信息的方法的步驟S13的實施方式一的流程圖；

圖3為本發(fā)明一示例性實施例示出的一種智能播放視頻中語音信息的方法的步驟S13的實施方式二的流程圖；

圖4為本發(fā)明一示例性實施例示出的一種智能播放視頻中語音信息的方法的步驟S33的實施方式一的流程圖；

圖5為本發(fā)明一示例性實施例示出的一種智能播放視頻中語音信息的方法的步驟S33的實施方式二的流程圖；

圖6為本發(fā)明一示例性實施例示出的一種智能播放視頻中語音信息的裝置的框圖；

圖7為本發(fā)明一示例性實施例示出的一種智能播放視頻中語音信息的裝置的播放模塊63的框圖；

圖8為本發(fā)明另一示例性實施例示出的一種智能播放視頻中語音信息的裝置的播放模塊63的框圖。

具體實施方式

以下結(jié)合附圖對本發(fā)明的優(yōu)選實施例進行說明，應(yīng)當(dāng)理解，此處所描述的優(yōu)選實施例僅用于說明和解釋本發(fā)明，并不用于限定本發(fā)明。

圖1是根據(jù)一示例性實施例示出的一種智能播放視頻中語音信息的方法流程圖，如圖1所示，該智能播放視頻中語音信息的方法，包括以下步驟S11-S13：

在步驟S11中，分析視頻中的語句信息；

在步驟S12中，根據(jù)所述語句信息，識別出所述視頻中的所有整句；

在步驟S13中，在一個整句播放結(jié)束后，在滿足預(yù)設(shè)的繼續(xù)播放條件的情況下，繼續(xù)播放所述視頻的下一個整句。

在一個實施例中，視頻包括任意類型的有臺詞的視頻。首先，需要分析視頻中的語句信息，剔除掉視頻中背景音樂和與視頻中人物對話無關(guān)的聲音信息，排除掉干擾語音信息之后，可加強分析視頻中的語句信息的正確率。接著，根據(jù)所述語句信息，識別出所述視頻中的所有整句，并根據(jù)音色等信息，標記出不同人物對應(yīng)的所有對話內(nèi)容。進一步的，可以根據(jù)語句信息和詞匯信息，標記出某個場景下的所有語句和出現(xiàn)某個詞匯的所有語句。

在播放視頻的過程中，在某一個整句播放結(jié)束后，判斷是否滿足預(yù)設(shè)的繼續(xù)播放條件。在滿足預(yù)設(shè)的繼續(xù)播放條件的情況下，繼續(xù)播放所述視頻的下一個整句。

其中，預(yù)設(shè)的繼續(xù)播放條件的具體判定方式一為下述的技術(shù)方案：

在播放視頻的過程中，某一個整句播放結(jié)束后，系統(tǒng)立即執(zhí)行重復(fù)播放所述整句的操作，同時統(tǒng)計播放所述整句的次數(shù)，當(dāng)所述次數(shù)達到預(yù)設(shè)的終止閾值時，終止播放所述整句。進一步的，可以根據(jù)某一個整句的復(fù)雜程度和整句持續(xù)長度來設(shè)置不同的終止閾值。例如，對播放時長在10秒以內(nèi)的整句的預(yù)設(shè)的終止閾值為3次，對播放時長在10秒以上且在20秒以內(nèi)的整句的預(yù)設(shè)的終止閾值為2次，對播放時長在20秒以上且在30秒以內(nèi)的整句的預(yù)設(shè)的終止閾值為3次。

其中，預(yù)設(shè)的繼續(xù)播放條件的具體判定方式二為下述的技術(shù)方案：

在播放視頻的過程中，在某一個整句播放結(jié)束后，統(tǒng)計出所述整句的播放時長。根據(jù)所述整句的播放時長和預(yù)設(shè)的擴大系數(shù)，設(shè)置出暫停所述整句的暫停時長。人們在重復(fù)該整句的時候，因為不熟悉等原因，通常復(fù)述該整句需要比視頻中的該整句更長的時長。例如，通過大次數(shù)的測試發(fā)現(xiàn)，設(shè)置該擴大系數(shù)為1.2到1.5之間，可以很好的滿足人們的復(fù)述需求。在當(dāng)一個整句結(jié)束時，在暫停所述暫停時長之后，以便給用戶留有充足的時長來復(fù)述該整句，在判定滿足繼續(xù)播放該視頻下一個整句的條件下，然后繼續(xù)播放所述視頻的下一個整句。

進一步的，繼續(xù)播放該視頻下一個整句的具體判定方式一為下述的技術(shù)方案：

在所述暫停時長的時間間隔內(nèi)，系統(tǒng)獲取用戶輸入的語音信息。當(dāng)用戶輸入的語音信息與所述整句的語音信息的相似度大于或等于預(yù)設(shè)的相似度閾值時，繼續(xù)播放所述視頻的下一個整句。

進一步的，繼續(xù)播放該視頻下一個整句的具體判定方式二為下述的技術(shù)方案：

在所述暫停時長的時間間隔內(nèi)，獲取用戶輸入的語音信息。當(dāng)用戶輸入的語音信息與所述整句的語音信息的相似度低于預(yù)設(shè)的相似度閾值時，標記所述整句為用戶需要注意的整句，以備用戶在觀看完該視頻以后重點復(fù)習(xí)用戶自己掌握程度不高的整句。接著，系統(tǒng)通過對話框的方式，詢問用戶是否重復(fù)播放所述整句，根據(jù)用戶的輸入信息，系統(tǒng)判斷是否重復(fù)播放所述整句。

本發(fā)明可幫助語言學(xué)習(xí)者通過觀賞非語言教學(xué)視頻來學(xué)習(xí)聽力和口語，提高了語言學(xué)習(xí)者的用戶體驗。

在一個實施例中，如圖2所示，步驟S13包括如下步驟S21-S23：

在步驟S21中，在一個整句播放結(jié)束后，重復(fù)播放所述整句；

在步驟S22中，統(tǒng)計播放所述整句的次數(shù)；

在步驟S23中，當(dāng)所述次數(shù)達到預(yù)設(shè)的終止閾值時，終止播放所述整句。

在一個實施例中，為了視頻觀看者可以更好的獲取視頻中的語言信息，尤其是對視頻中語言種類掌握程度不熟練的視頻觀看者，重復(fù)播放同一個整句，可以有效的幫助視頻觀看者掌握該整句的語言信息，進而幫助視頻觀看者更好的掌握該種類的語言。具體的實施步驟為在識別某一個整句是否第一次播放，然后重復(fù)播放該整句，每一次重復(fù)播放都將該整句的播放的次數(shù)加一，實時統(tǒng)計播放該整句的次數(shù)，并實時判斷播放該整句的次數(shù)的數(shù)值與預(yù)設(shè)的終止閾值的數(shù)值的大小關(guān)系。當(dāng)所述次數(shù)達到預(yù)設(shè)的終止閾值時，終止播放所述整句。

在一個實施例中，如圖3所示，步驟S13還包括如下步驟S31-S33：

在步驟S31中，在一個整句播放結(jié)束后，統(tǒng)計出所述整句的播放時長；

在步驟S32中，根據(jù)所述整句的播放時長和預(yù)設(shè)的擴大系數(shù)，設(shè)置出暫停所述整句的暫停時長；

在步驟S33中，在當(dāng)一個整句結(jié)束時，在暫停所述暫停時長之后，繼續(xù)播放所述視頻的下一個整句。

在一個實施例中，統(tǒng)計某一個整句的播放時長，不妨假設(shè)該整句的播放時長為10秒。然后獲取預(yù)設(shè)的擴大系數(shù)，不妨假設(shè)該預(yù)設(shè)的擴大系數(shù)為1.4。則根據(jù)該整句的播放時長10秒和該預(yù)設(shè)的擴大系數(shù)1.4，設(shè)置出在該整句播放結(jié)束之后，暫停該整句的暫停時長。不妨假設(shè)該整句的暫停時長為該整句的播放時長與該預(yù)設(shè)的擴大系數(shù)的乘積，則該整句的暫停時長為14秒。故在該整句播放結(jié)束之后，在經(jīng)過14秒的暫停之后，該14秒的暫停時間是為了留給充足的時間來讓視頻觀看者復(fù)述該整句，繼續(xù)播放該視頻的下一個整句。

在一個實施例中，如圖4所示，步驟S33包括如下步驟S41-S42：

在步驟S41中，在所述暫停時長的時間間隔內(nèi)，獲取用戶輸入的語音信息；

在步驟S42中，當(dāng)用戶輸入的語音信息與所述整句的語音信息的相似度大于或等于預(yù)設(shè)的相似度閾值時，繼續(xù)播放所述視頻的下一個整句。

在一個實施例中，獲取用戶在暫停時長的時間間隔內(nèi)輸入的語音信息，不妨假設(shè)該語音信息為A，該整句的語音信息為B，預(yù)設(shè)的相似度閾值為α。計算出該語音該信息A與該整句的語音信息B的相似度β，當(dāng)相似度β的數(shù)值大于或等于相似度α的數(shù)值時，系統(tǒng)判斷用戶輸入的語音信息B與該整句的語音信息A的相似程度很高，即用戶基本對該整句的掌握程度較高。接著系統(tǒng)繼續(xù)播放該視頻的下一個整句。

在一個實施例中，如圖5所示，步驟S33還包括如下步驟S51-S54：

在步驟S51中，在所述暫停時長的時間間隔內(nèi)，獲取用戶輸入的語音信息；

在步驟S52中，當(dāng)用戶輸入的語音信息與所述整句的語音信息的相似度低于預(yù)設(shè)的相似度閾值時，標記所述整句為用戶需要注意的整句；

在步驟S53中，詢問用戶是否重復(fù)播放所述整句；

在步驟S54中，根據(jù)用戶的輸入信息，判斷是否重復(fù)播放所述整句。

在一個實施例中，獲取用戶在暫停時長的時間間隔內(nèi)輸入的語音信息，不妨假設(shè)該語音信息為A，該整句的語音信息為B，預(yù)設(shè)的相似度閾值為α。計算出該語音該信息A與該整句的語音信息B的相似度β，當(dāng)相似度β的數(shù)值低于相似度α的數(shù)值時，標記該整句為用戶需要注意的整句，以提醒用戶該整句為用戶掌握程度較差的整句。接著系統(tǒng)詢問用戶是否需要重復(fù)播放該整句，用戶可以根據(jù)自己的意愿來進行輸入。系統(tǒng)根據(jù)用戶的輸入信息進行判斷，重復(fù)播放該整句或者是播放下一個整句。

在一個實施例中，圖6是根據(jù)一示例性實施例示出的一種智能播放視頻中語音信息的裝置框圖。如圖6示，該裝置包括分析模塊61、識別模塊62和播放模塊63。

該分析模塊61，用于分析視頻中的語句信息；

該識別模塊62，用于根據(jù)所述語句信息，識別出所述視頻中的所有整句；

該播放模塊63，用于在一個整句播放結(jié)束后，在滿足預(yù)設(shè)的繼續(xù)播放條件的情況下，繼續(xù)播放所述視頻的下一個整句。

如圖7所示，該播放模塊63包第一播放子模塊71、第一統(tǒng)計子模塊72和終止子模塊73。

該第一播放子模塊71，用于在一個整句播放結(jié)束后，重復(fù)播放所述整句；

該第第一統(tǒng)計子模塊72，用于統(tǒng)計播放所述整句的次數(shù)；

該第終止子模塊73，用于當(dāng)所述次數(shù)達到預(yù)設(shè)的終止閾值時，終止播放所述整句。

如圖8所示，該播放模塊63還包括第二統(tǒng)計子模塊81、設(shè)置子模塊82和第二播放子模塊83。

該第二統(tǒng)計子模塊81，用于在一個整句播放結(jié)束后，統(tǒng)計出所述整句的播放時長；

該設(shè)置子模塊82，用于根據(jù)所述整句的播放時長和預(yù)設(shè)的擴大系數(shù)，設(shè)置出暫停所述整句的暫停時長；

該第二播放子模塊83，用于在當(dāng)一個整句結(jié)束時，在暫停所述暫停時長之后，繼續(xù)播放所述視頻的下一個整句。

該第二播放子模塊83，還用于在所述暫停時長的時間間隔內(nèi)，獲取用戶輸入的語音信息；當(dāng)用戶輸入的語音信息與所述整句的語音信息的相似度大于或等于預(yù)設(shè)的相似度閾值時，繼續(xù)播放所述視頻的下一個整句。

該第二播放子模塊83，還用于在所述暫停時長的時間間隔內(nèi)，獲取用戶輸入的語音信息；當(dāng)用戶輸入的語音信息與所述整句的語音信息的相似度低于預(yù)設(shè)的相似度閾值時，標記所述整句為用戶需要注意的整句；詢問用戶是否重復(fù)播放所述整句；根據(jù)用戶的輸入信息，判斷是否重復(fù)播放所述整句。

本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白，本發(fā)明的實施例可提供為方法、系統(tǒng)、或計算機程序產(chǎn)品。因此，本發(fā)明可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且，本發(fā)明可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(zhì)(包括但不限于磁盤存儲器和光學(xué)存儲器等)上實施的計算機程序產(chǎn)品的形式。

本發(fā)明是參照根據(jù)本發(fā)明實施例的方法、設(shè)備(系統(tǒng))、和計算機程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合?？商峁┻@些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機器，使得通過計算機或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。

這些計算機程序指令也可存儲在能引導(dǎo)計算機或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機可讀存儲器中，使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品，該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。

這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理設(shè)備上，使得在計算機或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理，從而在計算機或其他可編程設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。

顯然，本領(lǐng)域的技術(shù)人員可以對本發(fā)明進行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣，倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi)，則本發(fā)明也意圖包含這些改動和變型在內(nèi)。

完整全部詳細技術(shù)資料下載

當(dāng)前第1頁1 2 3

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張新亮;
技術(shù)所有人：天脈聚源（北京）傳媒科技有限公司;
我是此專利的發(fā)明人

上一篇：一種基于延時傳送的直播色情內(nèi)容審核系統(tǒng)及方法與流程
上一篇：一種智能播放視頻的方法及裝置與流程

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機構(gòu)動力學(xué)與控制
5、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

智能語音提示器相關(guān)技術(shù)

智能語音合成軟件相關(guān)技術(shù)

智能語音控制系統(tǒng)相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種智能播放視頻中語音信息的方法及裝置與流程