視頻通話中視頻錄制的方法及裝置的制作方法

文檔序號：7760651閱讀：702來源：國知局

專利名稱：視頻通話中視頻錄制的方法及裝置的制作方法
技術領域：
本發(fā)明涉及通信技術領域，更具體地，涉及一種視頻通話中視頻錄制的方法及裝置。
背景技術：
隨著移動多媒體業(yè)務的迅速發(fā)展，以及第三代移動通信(簡稱3G)技術的逐步商用，可視電話業(yè)務成為3G的標志性業(yè)務，已經(jīng)在個人通信領域迅速發(fā)展應用起來?？梢曤?話業(yè)務是一種點到點的視頻通信業(yè)務，它能利用電話網(wǎng)雙向實時傳輸通話雙方的圖像和語音信號。可視終端能收到面對面交流的效果，實現(xiàn)人們通話時“既聞其聲，又見其人”的夢
術g
；ο在視頻通話過程中，用戶為了記錄關鍵信息，或者分享和娛樂，常常需要對通話過程中的視頻進行錄制?，F(xiàn)有的錄制包括三種方式錄制近端視頻、錄制遠端視頻、錄制雙向視頻。其中，前兩種方式僅能錄制單向視頻。而現(xiàn)有的雙向視頻包括兩種類型一種是錄制兩個獨立的視頻文件，這種方法需要保存兩個獨立的文件；一種是僅錄制一個，但遠端和近端的圖像都需經(jīng)過截取后放在一個屏幕的預設位置，由于在同一個屏幕上放置多個視頻，圖像可能不清晰，對終端的顯示要求也較高。此外，如果聲音來自于外界或通話中使用了替代圖像，在觀看視頻時，則無法區(qū)分出是從哪一端發(fā)出的。綜上所述，現(xiàn)有技術中存在如下問題在現(xiàn)有視頻通話錄制技術中，聲音和圖像不能對應顯示的問題。具體地說，就是在錄制視頻時不能根據(jù)其中一端發(fā)言顯示這一端圖像。

發(fā)明內容
本發(fā)明解決的技術問題是提供一種視頻通話中視頻錄制的方法及裝置，解決視頻通話錄制時聲音和圖像不能對應顯示的問題。為解決上述技術問題，本發(fā)明提供了一種視頻通話中視頻錄制的方法，所述方法包括判斷視頻通話的關鍵音輸入端，并獲取所述關鍵音輸入端的圖像；存儲所述視頻通話的音頻數(shù)據(jù)，將獲取的所述圖像與所述音頻合成后，寫入錄制的視頻文件中。其中，通過語音輸入來源、和/或終端收到的發(fā)言控制指令判斷所述視頻通話的關鍵音輸入端。其中，通過如下方式中的一種或其任意組合判斷所述關鍵音輸入端根據(jù)麥克中有無語音輸入進行判斷，如果麥克中接收到語音輸入，則該麥克對應的終端為關鍵音輸入端；根據(jù)音頻信號的強弱進行判斷，如果同時有多個語音輸入，則以音頻信號較強的一方作為關鍵音輸入端；根據(jù)收到的發(fā)言控制指令進行判斷，收到終端發(fā)起的開始發(fā)言指令后，則將發(fā)起該開始發(fā)言指令的一方作為關鍵音輸入端。其中，所述方法還包括獲知所述視頻通話的關鍵音輸入端發(fā)生變化時，獲取新的關鍵音輸入端的圖像。其中，根據(jù)收到的終端發(fā)起的切換指令，和/或實時判斷關鍵音輸入端，獲知所述視頻通話的關鍵音輸入端發(fā)生變化。其中，所述發(fā)言控制指令及所述切換指令是通過終端的特定按鍵或功能菜單發(fā) 起。本發(fā)明還提供了一種視頻通話中視頻錄制裝置，所述裝置包括判斷模塊，用于判斷關鍵音輸入端；圖像寫入模塊，用于獲取關鍵音輸入端的圖像并存儲；音頻寫入模塊，用于存儲視頻通話的音頻數(shù)據(jù)；合成模塊，用于將圖像寫入模塊獲取的圖像和音頻寫入模塊的音頻合成，寫入錄制的視頻文件中；存儲模塊，用于保存視頻文件。其中，所述判斷模塊進一步用于，通過如下方式中的一種或其任意組合判斷所述關鍵音輸入端根據(jù)麥克中有無語音輸入進行判斷，如果麥克中接收到語音輸入，則該麥克對應的終端為關鍵音輸入端；根據(jù)音頻信號的強弱進行判斷，如果同時有多個語音輸入，則以音頻信號較強的一方作為關鍵音輸入端；根據(jù)收到的發(fā)言控制指令進行判斷，收到終端發(fā)起的開始發(fā)言指令后，則將發(fā)起該開始發(fā)言指令的一方作為關鍵音輸入端。其中，所述裝置還包括監(jiān)測模塊，所述監(jiān)測模塊用于，監(jiān)測關鍵音輸入端是否發(fā)生變化，并在變化時通知圖像寫入模塊；所述圖像寫入模塊還用于，收到所述監(jiān)測模塊的通知后，發(fā)起切換操作，獲取新的關鍵音輸入端的圖像并存儲。其中，所述監(jiān)測模塊進一步用于，根據(jù)所述判斷模塊的判斷結果，監(jiān)測關鍵音輸入端是否發(fā)生變化。本發(fā)明通過判斷關鍵音的來源，獲取關鍵音對應的圖像并與錄制的音頻進行合成，解決了現(xiàn)有視頻通話方法不能靈活錄制的缺陷，在哪端發(fā)言時對哪端進行錄制，最后得到的視頻類似于電視采訪的形式，使得錄制的視頻更有保存和回放價值，提高了用戶體驗度，也使得可視電話能夠更好地推廣和應用。此外，本發(fā)明只需要對移動終端做較小的改動就可以達到預期的效果，不需要做大規(guī)模的軟件和硬件變更。

此處所說明的附圖用來提供對本發(fā)明的進一步理解，構成本申請的一部分，本發(fā) 明的示意性實施例及其說明用于解釋本發(fā)明，并不構成對本發(fā)明的不當限定。在附圖中
圖1是根據(jù)本發(fā)明實施例的視頻通話中視頻錄制裝置的結構示意圖；圖2是根據(jù)本發(fā)明實施例的視頻通話中視頻錄制的流程圖；圖3是本發(fā)明實施例的關鍵音輸入端發(fā)生變化時的切換流程圖。
具體實施例方式本發(fā)明的核心思想是，通過判斷關鍵音頻輸入來源，并將截取的關鍵音輸入端的圖像幀與對應的音頻進行合成，生成錄制視頻。從而使得錄制視頻中的聲音和圖像能夠對應顯示，且由于只顯示通話中關鍵音輸入端的圖像，使得錄制的視頻圖像更為清晰?；谏鲜龊诵乃枷?，根據(jù)本發(fā)明的一個方面，本發(fā)明提供了一種視頻通話中視頻錄制的方法，具體采用如下技術方案判斷視頻通話的關鍵音輸入端，并獲取所述關鍵音輸入端的圖像；存儲所述視頻通話的音頻數(shù)據(jù)，將獲取的所述圖像與所述音頻合成后，寫入錄制的視頻文件中。進一步地，通過語音輸入來源、和/或終端收到的發(fā)言控制指令判斷所述視頻通話的關鍵音輸入端。具體的判斷方法可采用如下方式中的一種或其任意組合根據(jù)MIC (麥克)中有無語音輸入進行判斷，如果MIC中接收到語音輸入，則該MIC 對應的終端為關鍵音輸入端；根據(jù)音頻信號的強弱進行判斷，如果同時有多個語音輸入，則以音頻信號較強的一方作為關鍵音輸入端；根據(jù)收到的發(fā)言控制指令進行判斷，收到終端發(fā)起的開始發(fā)言指令后，則將發(fā)起該開始發(fā)言指令的一方作為關鍵音輸入端。需要說明的是，上述方法既可應用于雙方通話，也可應用于多方通話。優(yōu)選地，對于雙方通話，終端收到視頻錄制指令后，可根據(jù)MIC有無音頻輸入或音頻信號的強弱判斷語音是來自遠端還是近端，如果在近端，則直接獲取本終端的圖像；反之，則獲取遠端圖像。進一步地，所述方法還包括獲知所述視頻通話的關鍵音輸入端發(fā)生變化時，獲取新的關鍵音輸入端的圖像。進一步地，根據(jù)收到的終端發(fā)起的切換指令，和/或實時判斷關鍵音輸入端，獲知所述視頻通話的關鍵音輸入端發(fā)生變化。其中，所述發(fā)言控制指令和切換指令可以通過終端的特定按鍵或功能菜單發(fā)起。進一步地，存儲的所述音頻數(shù)據(jù)至少包括關鍵音輸入端的音頻數(shù)據(jù)，但較為簡單的一種實現(xiàn)是，存儲所述視頻通話中的所有參與終端的語音數(shù)據(jù)，還可以包括環(huán)境中的背景音或者終端之間共享的音頻等。進一步地，所述獲取的圖像包括但不限于前向攝像頭采集的圖像，后向攝像頭采集的圖像，替代圖片或視頻終端LCD上分享的圖片等。根據(jù)本發(fā)明的另一方面，本發(fā)明還提供了一種視頻通話中視頻錄制裝置，主要包括判斷模塊，用于根據(jù)有無音頻信號，信號大小或發(fā)言控制指令，判斷關鍵音來源，即關鍵音輸入端；監(jiān)測模塊，主要用于監(jiān)測關鍵音來源是否有變化，并在變化時通知圖像寫入模塊；圖像寫入模塊，用于截取關鍵音輸入端(遠端或近端)的圖像幀并存儲；音頻寫入模塊，用于存儲通話中的關鍵音；合成模塊，用于將圖像寫入模塊獲取的圖像和音頻寫入模塊的音頻合成；存儲模塊，用于保存合成后的視頻。以下將參考附圖并結合實施例來詳細說明本發(fā)明。需要說明的是，在不沖突的情況下，本申請中的實施例及實施例中的特征可以相互組合。圖1根據(jù)本發(fā)明實施例的視頻通話中視頻錄制裝置的結構示意圖，該裝置可應用于支持視頻通話的移動或固定終端，如圖1所示，其包括判斷模塊102，用于根據(jù)通話中各個終端的情況，判斷關鍵音頻的來源，判斷的方法包括音頻信號大小和指令控制兩種方式；監(jiān)測模塊104，監(jiān)測模塊不斷獲取判斷模塊的結果，并監(jiān)測關鍵音頻來源是否有變化，如果有變化，則記錄對應的號碼或終端，通知圖片寫入模塊；圖像寫入模塊106，用于截取遠端或近端的圖像幀并存儲，截取的對象由判斷模塊和監(jiān)測模塊決定，音頻寫入模塊108，用于存儲通話中的聲音；合成模塊110，用于將判斷模塊選擇的圖像和音頻合成；存儲模塊112，用于將圖像和音頻寫入模塊的圖片和音頻合成后保存。其中圖像和音頻的合成為現(xiàn)有技術，此處不再贅述。其中，圖像寫入模塊106進一步可以分為圖像截取單元和圖像寫入單元，圖像截取單元用于根據(jù)監(jiān)測模塊通知的關鍵音輸入端，截取關鍵音輸入端的圖像幀；圖像寫入單元則用于保存截取的圖像幀。具體地，判斷模塊102通過如下方式中的一種或其任意組合判斷所述關鍵音輸入端根據(jù)麥克中有無語音輸入進行判斷，如果麥克中接收到語音輸入，則該麥克對應的終端為關鍵音輸入端；根據(jù)音頻信號的強弱進行判斷，如果同時有多個語音輸入，則以音頻信號較強的一方作為關鍵音輸入端；根據(jù)收到的發(fā)言控制指令進行判斷，收到終端發(fā)起的開始發(fā)言指令后，則將發(fā)起該開始發(fā)言指令的一方作為關鍵音輸入端。圖2是根據(jù)本發(fā)明實施例的視頻通話中視頻錄制的方法流程圖，本實施例流程主要包括如下步驟步驟S201，用戶發(fā)起視頻錄制操作，終端收到視頻錄制指令后準備錄制；步驟S202，終端向監(jiān)測模塊查詢當前關鍵音的來源；步驟S203，根據(jù)S202的查詢結果，判斷關鍵音來自本終端還是遠端，如果關鍵音來自本端，執(zhí)行步驟S204，反之，執(zhí)行步驟S205 ；步驟S204，圖像截取單元按照預設的頻率截取本終端圖像，并保存至圖像寫入單
7兀；步驟S205，圖像截取單元按照預設的頻率截取遠端圖像，并保存至圖像寫入單元，其中遠端圖像的截取對象為關鍵音輸入端；步驟S206，將音頻寫入模塊的音頻和圖像寫入模塊的圖像合成為視頻；步驟S207，將視頻保存至存儲設備。圖3是本發(fā)明實施例關鍵音輸入端變化時的切換流程圖，本實施例流程主要包括如下步驟步驟S301，監(jiān)測單元監(jiān)測到關鍵音來源有變化，向圖像寫入單元發(fā)起切換指令；步驟S302，圖像寫入模塊發(fā)起切換操作，圖像截取的對象為新的關鍵音來源對應終端；步驟S303，圖像截取單元按照預設的頻率，截取切換后圖像并保存；步驟S304，將音頻寫入模塊的音頻和圖像寫入模塊的圖像合成為視頻；步驟S305，將視頻保存至存儲設備。以上僅為本發(fā)明的優(yōu)選實施案例而已，并不用于限制本發(fā)明，本發(fā)明還可有其他多種實施例，在不背離本發(fā)明精神及其實質的情況下，熟悉本領域的技術人員可根據(jù)本發(fā) 明做出各種相應的改變和變形，但這些相應的改變和變形都應屬于本發(fā)明所附的權利要求的保護范圍。本領域普通技術人員可以理解上述方法中的全部或部分步驟可通過程序來指令相關硬件完成，所述程序可以存儲于計算機可讀存儲介質中，如只讀存儲器、磁盤或光盤等。可選地，上述實施例的全部或部分步驟也可以使用一個或多個集成電路來實現(xiàn)。相應地，上述實施例中的各模塊/單元可以采用硬件的形式實現(xiàn)，也可以采用軟件功能模塊的形式實現(xiàn)。本發(fā)明不限制于任何特定形式的硬件和軟件的結合。
權利要求
一種視頻通話中視頻錄制的方法，其特征在于，所述方法包括判斷視頻通話的關鍵音輸入端，并獲取所述關鍵音輸入端的圖像；存儲所述視頻通話的音頻數(shù)據(jù)，將獲取的所述圖像與所述音頻合成后，寫入錄制的視頻文件中。
2.如權利要求1所述的方法，其特征在于，通過語音輸入來源、和/或終端收到的發(fā)言控制指令判斷所述視頻通話的關鍵音輸入端。
3.如權利要求2所述的方法，其特征在于，通過如下方式中的一種或其任意組合判斷所述關鍵音輸入端根據(jù)麥克中有無語音輸入進行判斷，如果麥克中接收到語音輸入，則該麥克對應的終端為關鍵音輸入端；根據(jù)音頻信號的強弱進行判斷，如果同時有多個語音輸入，則以音頻信號較強的一方作為關鍵音輸入端；根據(jù)收到的發(fā)言控制指令進行判斷，收到終端發(fā)起的開始發(fā)言指令后，則將發(fā)起該開始發(fā)言指令的一方作為關鍵音輸入端。
4.如權利要求3所述的方法，其特征在于，所述方法還包括獲知所述視頻通話的關鍵音輸入端發(fā)生變化時，獲取新的關鍵音輸入端的圖像。
5.如權利要求4所述的方法，其特征在于，根據(jù)收到的終端發(fā)起的切換指令，和/或實時判斷關鍵音輸入端，獲知所述視頻通話的關鍵音輸入端發(fā)生變化。
6.如權利要求3或5所述的方法，其特征在于，所述發(fā)言控制指令及所述切換指令是通過終端的特定按鍵或功能菜單發(fā)起。
7.一種視頻通話中視頻錄制裝置，其特征在于，所述裝置包括判斷模塊，用于判斷關鍵音輸入端；圖像寫入模塊，用于獲取關鍵音輸入端的圖像并存儲；音頻寫入模塊，用于存儲視頻通話的音頻數(shù)據(jù)；合成模塊，用于將圖像寫入模塊獲取的圖像和音頻寫入模塊的音頻合成，寫入錄制的視頻文件中；存儲模塊，用于保存視頻文件。
8.如權利要求7所述的裝置，其特征在于，所述判斷模塊進一步用于，通過如下方式中的一種或其任意組合判斷所述關鍵音輸入端根據(jù)麥克中有無語音輸入進行判斷，如果麥克中接收到語音輸入，則該麥克對應的終端為關鍵音輸入端；根據(jù)音頻信號的強弱進行判斷，如果同時有多個語音輸入，則以音頻信號較強的一方作為關鍵音輸入端；根據(jù)收到的發(fā)言控制指令進行判斷，收到終端發(fā)起的開始發(fā)言指令后，則將發(fā)起該開始發(fā)言指令的一方作為關鍵音輸入端。
9.如權利要求7或8所述的裝置，其特征在于，所述裝置還包括監(jiān)測模塊，所述監(jiān)測模塊用于，監(jiān)測關鍵音輸入端是否發(fā)生變化，并在變化時通知圖像寫入模塊；所述圖像寫入模塊還用于，收到所述監(jiān)測模塊的通知后，發(fā)起切換操作，獲取新的關鍵音輸入端的圖像并存儲。
10.如權利要求9所述的裝置，其特征在于，所述監(jiān)測模塊進一步用于，根據(jù)所述判斷模塊的判斷結果，監(jiān)測關鍵音輸入端是否發(fā)生變化。
全文摘要
本發(fā)明公開了一種視頻通話中視頻錄制的方法及裝置，所述方法包括判斷視頻通話的關鍵音輸入端，并獲取所述關鍵音輸入端的圖像；存儲所述視頻通話的音頻數(shù)據(jù)，將獲取的所述圖像與所述音頻合成后，寫入錄制的視頻文件中。本發(fā)明通過判斷關鍵音的來源，獲取關鍵音對應的圖像并與錄制的音頻進行合成，解決了現(xiàn)有視頻通話方法不能靈活錄制的缺陷，使得錄制視頻中的聲音和圖像能夠對應顯示，且由于只顯示通話中關鍵音輸入端的圖像，使得錄制的視頻圖像更為清晰。
文檔編號H04N5/76GK101951492SQ201010290999
公開日2011年1月19日申請日期2010年9月15日優(yōu)先權日2010年9月15日
發(fā)明者劉揚, 黃連芳申請人:中興通訊股份有限公司

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：黃連芳;劉揚
技術所有人：中興通訊股份有限公司
我是此專利的發(fā)明人

上一篇：Ip接口的測試方法、裝置及系統(tǒng)的制作方法
上一篇：一種非連續(xù)接收的實現(xiàn)方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術及應用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術 5.逆向工程技術研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設計 2.汽車檢測系統(tǒng)設計 3.汽車電子控制系統(tǒng)設計
4、畢老師：機構動力學與控制
5、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

視頻錄制方法相關技術

響一聲就說正在通話中相關技術

撥打的電話正在通話中相關技術

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

視頻通話中視頻錄制的方法及裝置的制作方法