示例性實(shí)施方式涉及用于在無線通信系統(tǒng)中發(fā)射和接收語音數(shù)據(jù)的設(shè)備和方法。
背景技術(shù):
通過發(fā)射終端的語言編解碼器(編碼器)來壓縮語言,將各種類型的報(bào)頭(諸如實(shí)時(shí)發(fā)射協(xié)議(rtp)、用戶數(shù)據(jù)報(bào)協(xié)議(udp)和互聯(lián)網(wǎng)協(xié)議(ip)報(bào)頭)附加到壓縮語言,并且通過通信調(diào)制解調(diào)器(諸如長(zhǎng)期演進(jìn)(lte)調(diào)制解調(diào)器)來發(fā)射附加報(bào)頭的壓縮語言。接收終端順序地移除rtp、udp和ip報(bào)頭,并且檢查是否存在丟失的語言幀。在沒有任何損失下恢復(fù)的語言幀通過語言編解碼器(解碼器)從壓縮狀態(tài)解壓縮,被轉(zhuǎn)換成脈沖編碼調(diào)制(pcm)信號(hào),并且遞送到揚(yáng)聲器。
在恢復(fù)語言幀期間發(fā)現(xiàn)信息丟失時(shí),通過使用有關(guān)先前幀的信息來執(zhí)行用于減少音質(zhì)損壞的誤差掩蔽。如果由于發(fā)射路徑的擁塞而引起在發(fā)射期間丟失了語言幀并因此呼叫不是順利的,則可以通過向?qū)Ψ浇K端發(fā)射編解碼器模式請(qǐng)求(cmr)消息來調(diào)整語言比特率,以使得當(dāng)存在擁塞狀態(tài)時(shí),比特率暫時(shí)降低,并且隨著擁塞狀態(tài)被解決而逐漸增加。
根據(jù)諸如自適應(yīng)多速率(amr)和寬帶自適應(yīng)多速率(amr-wb)技術(shù)的常規(guī)語音壓縮技術(shù),將語音帶寬固定到窄帶或?qū)拵В@表示模擬語音信號(hào)以8,000或16,000個(gè)樣本/秒轉(zhuǎn)換成數(shù)字信號(hào)并被壓縮,并且此轉(zhuǎn)換速度在通話過程中不改變。amr編解碼器可以將以8,000個(gè)樣本/秒數(shù)字化的語音信號(hào)壓縮成4.75kbps至12.2kbps的八種類型的比特率,并且處理300hz到3,400hz的頻帶的語音信號(hào)。amr-wb編解碼器可以將以16,000個(gè)樣本/秒數(shù)字化的語音信號(hào)壓縮為6.6kbps至23.85kbps的九種類型的比特率,并且處理50hz至7,000hz的頻帶的語音信號(hào)。
最近,對(duì)于lte語音(volte)服務(wù)中商業(yè)化的amr-wb語音編解碼器的呼叫質(zhì)量,大多數(shù)收聽者認(rèn)為通話質(zhì)量有所改善,但是一些收聽者不喜歡高頻語音的呼叫質(zhì)量,并且傾向于認(rèn)為常規(guī)amr語音編解碼器的質(zhì)量更好。這表示取決于收聽者或與語音一起壓縮的背景噪聲,高頻語音分量可能是或可能不是優(yōu)選的。
技術(shù)實(shí)現(xiàn)要素:
技術(shù)問題
本發(fā)明提供了一種用于發(fā)射/接收語音信號(hào)的發(fā)射終端和接收終端的操作方法和設(shè)備,考慮到即使以相同的語音比特率也可以根據(jù)情況通過使用另一采樣率來實(shí)現(xiàn)最佳呼叫質(zhì)量的事實(shí),在呼叫期間在終端之間相互調(diào)整所述語音信號(hào)的采樣率和/或比特率。
本發(fā)明提供了一種用于在兩個(gè)終端之間有效地協(xié)商語音編解碼器的比特率和/或采樣率的方法和設(shè)備,所述語音編解碼器支持比現(xiàn)有技術(shù)更寬范圍的比特率以及比現(xiàn)有技術(shù)更寬范圍的采樣率。
技術(shù)解決方案
根據(jù)示例性實(shí)施方式的方面,用于發(fā)射語音信號(hào)的發(fā)射終端的操作方法包括:生成采樣率和比特率請(qǐng)求信息,所述采樣率和比特率請(qǐng)求信息包括用于確定語音信號(hào)的采樣率的采樣信息、以及用于確定語音信號(hào)的比特率的比特率信息,并將所生成的采樣率和比特率請(qǐng)求信息發(fā)射到接收終端;從接收終端接收通過基于采樣信息確定的采樣率以及基于比特率信息確定的比特率的至少一個(gè)組合得到的組合確定信息;以及根據(jù)所接收的組合確定信息壓縮語音信號(hào),并且將所壓縮的語音信號(hào)發(fā)射到接收終端。
根據(jù)另一個(gè)示例性實(shí)施方式的方面,用于發(fā)射語音信號(hào)的發(fā)射終端的操作設(shè)備包括:請(qǐng)求信息生成單元,其被配置成生成采樣率和比特率請(qǐng)求信息,所述采樣率和比特率請(qǐng)求信息包括用于確定語音信號(hào)的采樣率的采樣信息、以及用于確定語音信號(hào)的比特率的比特率信息;控制單元,其被配置成控制待發(fā)射到接收終端的所生成的采樣率和比特率請(qǐng)求信息;接口單元,其被配置成在控制單元的控制下將采樣率和比特率請(qǐng)求信息發(fā)射到接收終端;以及語音壓縮單元,其被配置成:如果接口單元從接收終端接收到通過基于采樣信息確定的采樣率和基于比特率信息確定的比特率的至少一個(gè)組合得到的組合確定信息,則根據(jù)所接收的組合確定信息來壓縮語音信號(hào),其中接口單元在控制單元的控制下將壓縮的語音信號(hào)發(fā)射到接收終端。
根據(jù)另一個(gè)示例性實(shí)施方式的方面,用于接收語音信號(hào)的接收終端的操作方法包括:從發(fā)射終端接收采樣率和比特率請(qǐng)求信息,所述采樣率和比特率請(qǐng)求信息包括用于確定語音信號(hào)的采樣率的采樣信息以及用于確定語音信號(hào)的比特率的比特率信息;根據(jù)采樣率和比特率請(qǐng)求信息,確定基于采樣信息確定的采樣率和基于比特率信息確定的比特率的至少一個(gè)組合;以及將所確定的組合確定信息發(fā)射到發(fā)射終端。
根據(jù)另一個(gè)實(shí)施方式的方面,用于接收語音信號(hào)的接收終端的操作設(shè)備包括:接口單元,其被配置成從發(fā)射終端接收采樣率和比特率請(qǐng)求信息,所述采樣率和比特率請(qǐng)求消息包括用于確定語音信號(hào)的采樣率的采樣信息以及用于確定語音信號(hào)的比特率的比特率信息;組合確定單元,其被配置成根據(jù)采樣率和比特率請(qǐng)求信息,確定基于采樣信息確定的采樣率和基于比特率信息確定的比特率的至少一個(gè)組合;以及控制單元,其被配置成控制待發(fā)射到發(fā)射終端的所確定的組合確定信息,其中接口單元在控制單元的控制下將組合確定信息發(fā)射到發(fā)射終端。
發(fā)明有益效果
根據(jù)示例性實(shí)施方式,在使用語音編解碼器(諸如能夠以多個(gè)采樣率和比特率壓縮語音的增強(qiáng)語音服務(wù)(evs))的網(wǎng)絡(luò)語音協(xié)議(voip)系統(tǒng)中,可以適當(dāng)?shù)貐f(xié)商用于支持多個(gè)采樣率和比特率的語音編解碼器中的服務(wù)的采樣率和比特率,并且可以根據(jù)接收者的品味、語音內(nèi)容和背景噪聲動(dòng)態(tài)地調(diào)整對(duì)方終端的壓縮方案。
附圖說明
圖1是根據(jù)示例性實(shí)施方式的用于發(fā)射語音信號(hào)的發(fā)射終端的操作方法的流程圖。
圖2是示出有效載荷報(bào)頭的示例的參考圖。
圖3是示出包括有效載荷報(bào)頭的voip分組的示例的參考圖。
圖4是示出從發(fā)射終端向接收終端發(fā)射的信息、以及從接收終端向發(fā)射終端發(fā)射的信息的示例的參考圖。
圖5是用于描述接收終端確定組合確定信息的說明性參考圖。
圖6是根據(jù)示例性實(shí)施方式的用于發(fā)射語音信號(hào)的發(fā)射終端的操作設(shè)備的框圖。
圖7是根據(jù)示例性實(shí)施方式的用于接收語音信號(hào)的接收終端的操作方法的流程圖。
圖8是根據(jù)示例性實(shí)施方式的用于接收語音信號(hào)的接收終端的操作設(shè)備的框圖。
圖9是用于描述兩個(gè)終端以范圍單位協(xié)商用于呼叫的比特率的說明性參考圖。
圖10是用于描述兩個(gè)終端以范圍單位協(xié)商用于呼叫的采樣率的說明性參考圖。
圖11是示出以范圍單位協(xié)商比特率的兩個(gè)終端之間的從發(fā)射終端向接收終端發(fā)射的信息、以及從接收終端向發(fā)射終端發(fā)射的信息的示例的參考圖。
圖12是示出以范圍單位協(xié)商采樣率的兩個(gè)終端之間的從發(fā)射終端向接收終端發(fā)射的信息、以及從接收終端向發(fā)射終端發(fā)射的信息的示例的參考圖。
圖13是示出以范圍單位協(xié)商比特率和采樣率的兩個(gè)終端之間的從發(fā)射終端向接收終端發(fā)射的信息、以及從接收終端向發(fā)射終端發(fā)射的信息的示例的參考圖。
圖14是示出以范圍單位協(xié)商比特率和采樣率的兩個(gè)終端之間的從發(fā)射終端向接收終端發(fā)射的信息、以及從接收終端向發(fā)射終端發(fā)射的信息的示例的參考圖。
具體實(shí)施方式
圖1至圖14僅是說明性的,并且因此不應(yīng)被分析作為對(duì)本發(fā)明范圍的限制。本領(lǐng)域普通技術(shù)人員將會(huì)理解,即使在包括與實(shí)施方式相關(guān)的適當(dāng)操作原理的隨機(jī)通信系統(tǒng)中,也可以實(shí)現(xiàn)本公開。
圖1是根據(jù)示例性實(shí)施方式的用于發(fā)射語音信號(hào)的發(fā)射終端的操作方法的流程圖。
參考圖1,在操作s100中,發(fā)射終端可以生成采樣率和比特率請(qǐng)求信息,其包括用于確定采樣率的采樣信息和用于確定語音信號(hào)的比特率的比特率信息,并且將所生成的采樣率和比特率請(qǐng)求信息發(fā)射到接收終端。采樣信息可以包括采樣列表信息,其具有相對(duì)于特定范圍確定的至少一個(gè)采樣類型或采樣率范圍信息;并且比特率信息可以包括比特率列表信息,其具有相對(duì)于特定范圍確定的至少一個(gè)比特率類型或比特率范圍信息。
一般來說,根據(jù)頻帶的語音編解碼器的類型的示例如表1所示。
[表1]
根據(jù)表1,對(duì)應(yīng)于100hz至3,500hz的nb的語音編解碼器具有8000個(gè)樣本/秒的采樣率,并且選擇性地使用7.2、8、9.6、13.2、16.4、24.4、32、48、64、96和128中的一個(gè)作為比特率。此外,對(duì)應(yīng)于50hz至7000hz的wb的語音編解碼器具有16,000個(gè)樣本/秒的采樣率,并且選擇性地使用上述11個(gè)比特率中的一個(gè)。此外,對(duì)應(yīng)于50hz至16,000hz的swb的語音編解碼器具有32,000個(gè)樣本/秒的采樣率,并且選擇性地使用上述11個(gè)比特率中的一個(gè)。此外,對(duì)應(yīng)于50hz至20,000hz的fb的語音編解碼器具有48,000個(gè)樣本/秒的采樣率,并且選擇性地使用上述11個(gè)比特率中的一個(gè)。也就是說,取決于頻帶的語音編解碼器選擇性地使用各種比特率,但相應(yīng)地使用固定的采樣率。與此相比,如下所述,本示例性實(shí)施方式不僅允許根據(jù)語音編解碼器的類型選擇性地使用比特率,而且還允許選擇性地使用采樣率。
根據(jù)語音壓縮技術(shù),在呼叫期間可用的比特率的數(shù)量為8、9或更小,并且最小值與最大值之間的差異不大,如10-20kbps或更小。例如,在amr技術(shù)中可以使用4.75kbps與12.2kbps之間的8個(gè)比特率,并且在amr-wb技術(shù)中可以使用6.6kbps與23.85kbps之間的9個(gè)比特率。
根據(jù)示例性實(shí)施方式,發(fā)射終端可以生成例如對(duì)應(yīng)于采樣率類型的8,000、16,000、32000和48,000個(gè)樣本/秒列表信息,作為對(duì)應(yīng)于采樣率和/或比特率請(qǐng)求信息的采樣列表信息。此外,發(fā)射終端可以生成例如7.2、8、9.6、13.2、16.4、24.4、32、48、64、96和128的列表信息,作為比特率列表信息。
包括在采樣率和比特率請(qǐng)求信息中的采樣列表信息可以包括對(duì)應(yīng)于每個(gè)采樣類型的采樣識(shí)別信息,并且比特率列表信息可以包括對(duì)應(yīng)于每個(gè)比特率類型的比特率識(shí)別信息。
表2示出了根據(jù)采樣率的識(shí)別信息。
[表2]
根據(jù)表2,將識(shí)別信息id分配給每個(gè)采樣率。
表3示出了根據(jù)比特率的識(shí)別信息。
[表3]
根據(jù)表3,將識(shí)別信息id分配給每個(gè)比特率。
發(fā)射終端可以將所生成的采樣率和比特率請(qǐng)求信息插入有效載荷報(bào)頭中。也就是說,對(duì)應(yīng)于采樣率和比特率請(qǐng)求信息的采樣列表信息和比特率列表信息可以被添加到有效載荷報(bào)頭。
有效載荷報(bào)頭包括:當(dāng)前使用的采樣類型的采樣類型確認(rèn)信息、當(dāng)前使用的比特率類型的比特率類型確認(rèn)信息、以及采樣列表信息和比特率列表信息等。
圖2是示出有效載荷報(bào)頭的示例的參考圖。在圖2中,“編解碼器模式請(qǐng)求”表示比特率列表信息,“bw請(qǐng)求”表示采樣列表信息,“所使用的編解碼器模式”指示當(dāng)前使用的比特率類型的比特率類型確認(rèn)信息,并且“所使用的bw”指示當(dāng)前使用的采樣類型的采樣類型確認(rèn)信息。此外,“f”指示了指示是否連續(xù)發(fā)射語音幀的信息,并且“q”指示了指示語音幀中是否存在錯(cuò)誤的信息。
圖2的有效載荷報(bào)頭的每個(gè)字段的功能可以如下表4所示。如在用于多個(gè)比特率/多個(gè)帶寬的增強(qiáng)語音服務(wù)(evs)中,語音編解碼器的有效載荷報(bào)頭包括2個(gè)字節(jié),并且每個(gè)字段的功能和長(zhǎng)度如下。
[表4]
也就是說,包括以下作為比特率列表信息:比特率類型的列表信息(例如,7.2、8、9.6、13.2、16.4、24.4、32、48、64、96和128)、以及對(duì)應(yīng)于列表信息的相應(yīng)識(shí)別信息片段0000至1010。此外,包括以下作為采樣率列表信息:例如,8,000、16,000、32,000和48,000的列表信息、以及對(duì)應(yīng)于列表信息的各個(gè)識(shí)別信息片段00至11。此外,包括以下作為比特率類型確認(rèn)信息:用于當(dāng)前幀的比特率的列表信息、以及對(duì)應(yīng)于列表信息的識(shí)別信息。此外,包括以下作為采樣類型確認(rèn)信息:有關(guān)用于當(dāng)前幀的的采樣率的信息、以及對(duì)應(yīng)于所述信息的識(shí)別信息。
發(fā)射終端可以生成網(wǎng)絡(luò)語音協(xié)議(voip)分組,其中除了具有采樣率和比特率請(qǐng)求信息的有效載荷報(bào)頭之外,按順序添加實(shí)時(shí)傳輸協(xié)議(rtp)報(bào)頭、用戶數(shù)據(jù)報(bào)協(xié)議(udp)報(bào)頭和互聯(lián)網(wǎng)協(xié)議(ip)報(bào)頭),并且將所生成的voip分組發(fā)射到接收終端。
圖3是示出包括有效載荷報(bào)頭的voip分組的示例的參考圖。有效載荷報(bào)頭被添加到語音幀,其中可以填充“0”以便以字節(jié)為單位調(diào)整有效載荷長(zhǎng)度。如上所述,在有效載荷報(bào)頭中包括采樣率列表信息和比特率列表信息,并且可以包括當(dāng)前使用的采樣率信息和比特率信息。在這種情況下,有效載荷報(bào)頭、evs幀和填充比特的總和被命名為rtp有效載荷。除了rtp有效載荷之外,具有rtp報(bào)頭、udp報(bào)頭和ip報(bào)頭的voip分組可以通過調(diào)制解調(diào)器發(fā)射到對(duì)方終端。
返回參考圖1,在操作s100之后,在操作s102中,發(fā)射終端可以從接收終端接收通過基于采樣信息確定的采樣率以及基于比特率信息確定的比特率的至少一個(gè)組合得到的組合確定信息??梢酝ㄟ^從采樣信息選擇的采樣類型和從比特率信息選擇的比特率類型的至少一個(gè)組合,或通過在采樣率范圍信息的范圍內(nèi)確定的采樣率范圍和在比特率范圍信息的范圍內(nèi)確定的比特率范圍的至少一個(gè)組合,確定組合確定信息。可以在發(fā)送方向和接收方向上不同地確定采樣率范圍信息,并且可以在發(fā)送方向和接收方向上不同地確定比特率范圍信息。
圖4是示出從發(fā)射終端向接收終端發(fā)射的信息、以及從接收終端向發(fā)射終端發(fā)射的信息的示例的參考圖。圖4(a)示出了用于向接收終端通知以下的信息:發(fā)射終端可以使用evs、amr-wb和amr的三種類型的語音代碼以用于語音通信。信息指示,evs支持高達(dá)fb(48,000個(gè)樣本/秒),amr-wb支持16,000個(gè)樣本/秒,并且amr支持8,000個(gè)樣本/秒。也就是說,evs/48000、amr-wb/16000和amr/8000指示可以由接收終端組合的采樣率類型的列表信息。此外,b=as:160指示應(yīng)用程序特定的最大比特率,并且具有通過將rtp/udp/ip報(bào)頭加上最大語音比特率而獲得的整數(shù)值。也就是說,b=as:160指示通過將32(rtp/udp/ip報(bào)頭)加上evs的128kbps而獲得的值。因此,應(yīng)用程序特定的最大比特率是比特率的最大值,并且指示可由接收終端組合的比特率類型的列表信息。
當(dāng)從發(fā)射終端接收到包括采樣率列表信息和比特率列表信息的采樣率和比特率列表信息時(shí),接收終端從采樣率列表信息選擇evs,并且確定如圖4(b)所示的任何一個(gè)采樣率(例如,32,000樣本/秒)。此外,接收終端確定使用來自比特率列表信息的最大24.4kbps的比特率。也就是說,配置集指示了組合確定信息,將所述組合確定信息作為{(0,0)、(1,1)、(1,2)、(2,3)、(2,4)、(2,5)}發(fā)射到發(fā)射終端。每個(gè)組合確定信息片段指示(采樣率識(shí)別信息、比特率識(shí)別信息)。也就是說,(0,0)是采樣率識(shí)別信息“0”和比特率識(shí)別信息“0”的組合,其中與識(shí)別信息相對(duì)應(yīng)的采樣率類型對(duì)應(yīng)于8,000(nb),并且與識(shí)別信息相對(duì)應(yīng)的比特率類型對(duì)應(yīng)于7.2。因此,作為組合確定信息的{(0,0)、(1,1)、(1,2)、(2,3)、(2,4)、(2,5)}分別指示7.2(nb)、8(wb)、9.6(wb)、13.2(swb)、16.4(swb)和24.4(swb)的采樣率類型和比特率類型的組合信息。
這個(gè)組合確定信息對(duì)應(yīng)于通過使用包括語音信號(hào)的音頻信號(hào)的背景噪聲、音頻質(zhì)量、音頻音調(diào)中的至少一個(gè)確定的采樣率類型和比特率類型的組合信息。
圖5是用于描述接收終端確定組合確定信息的說明性參考圖。圖5(a)示出了基于低頻帶的語音信號(hào),并且圖5(b)示出了基于高頻帶的語音信號(hào)。例如,用于接收語音信號(hào)的接收終端的用戶可能不希望聽到高頻音頻或尖銳的聲音。在這種情況下,接收終端可以分析所接收的語音幀和確定信息,即組合確定信息,以用于當(dāng)如圖5(b)所示,高于特定頻率或更高頻率的高頻分量的能量比是特定水平或更高的時(shí),使對(duì)方終端將采樣率從超寬帶(swb)降低到寬帶(wb)或窄帶(nb)。這種情況可能在其中生成金屬噪聲的工廠內(nèi)部發(fā)生,或在與具有高音調(diào)的人交談的情況下發(fā)生。相反,在連接到安全攝像機(jī)等的情況下,使得有必要甚至發(fā)射細(xì)聲的改變,可以對(duì)其進(jìn)行調(diào)整以便盡可能地提高采樣率。
因此,考慮到從對(duì)方終端提供的語音信號(hào)的背景噪聲、音頻質(zhì)量、呼叫者的音調(diào)等,接收終端確定用于語音信號(hào)的適當(dāng)組合確定信息,并且將所確定的組合確定信息發(fā)射到對(duì)方終端(發(fā)射終端),以及對(duì)方終端(發(fā)射終端)接收組合確定信息。
在操作s102之后,在操作s104中,發(fā)射終端可以根據(jù)所接收的組合確定信息壓縮語音信號(hào),并且將所壓縮的語音信號(hào)發(fā)射到接收終端。例如,當(dāng)接收?qǐng)D4(b)所示的作為組合確定信息的{(0,0)、(1,1)、(1,2)、(2,3)、(2,4)、(2,5)時(shí),發(fā)射終端可以以對(duì)應(yīng)于組合確定信息的采樣率和比特率壓縮待發(fā)射到接收終端的語音信號(hào)。也就是說,如果確定以對(duì)應(yīng)于組合確定信息的(0,0)來壓縮語音信號(hào),則發(fā)射終端可以根據(jù)對(duì)應(yīng)于識(shí)別信息“0”的采樣率類型8,000(nb)以及對(duì)應(yīng)于識(shí)別信息“0”的比特率類型7.2來壓縮語音信號(hào),并且將壓縮的語音信號(hào)發(fā)射到接收終端。
圖6是根據(jù)示例性實(shí)施方式的用于發(fā)射語音信號(hào)的發(fā)射終端的操作設(shè)備的框圖,并且所述設(shè)備可以包括請(qǐng)求信息生成單元200、控制單元210、接口單元230和語音壓縮單元240。
參考圖6,請(qǐng)求信息生成單元200可以生成采樣率和比特率請(qǐng)求信息,其包括:具有用于確定語音信號(hào)的采樣率的至少一個(gè)采樣類型的采樣列表信息、以及具有用于確定語音信號(hào)的比特率的至少一個(gè)比特率類型的比特率列表信息。包括在采樣率和比特率請(qǐng)求信息中的采樣列表信息可以包括對(duì)應(yīng)于相應(yīng)采樣類型的采樣識(shí)別信息,并且比特率列表信息可以包括對(duì)應(yīng)于相應(yīng)比特率類型的比特率識(shí)別信息。
請(qǐng)求信息生成單元200可以將所生成的采樣率和比特率請(qǐng)求信息插入有效載荷報(bào)頭中。也就是說,對(duì)應(yīng)于采樣率和比特率請(qǐng)求信息的采樣列表信息和比特率列表信息可以被添加到有效載荷報(bào)頭。有效載荷報(bào)頭包括:當(dāng)前使用的采樣類型的采樣類型確認(rèn)信息、當(dāng)前使用的比特率類型的比特率類型確認(rèn)信息、以及采樣列表信息和比特率列表信息等。
請(qǐng)求信息生成單元200可以生成voip分組,其中除了具有采樣率和比特率請(qǐng)求信息的有效載荷報(bào)頭之外,還添加了rtp報(bào)頭、udp報(bào)頭和ip報(bào)頭中的至少一個(gè)。如圖3所示,請(qǐng)求信息生成單元200將采樣率列表信息和比特率列表信息插入有效載荷報(bào)頭中,并且可以將當(dāng)前使用的采樣率信息和比特率信息插入有效載荷報(bào)頭中。請(qǐng)求信息生成單元200可以生成voip分組,其中除了包括有效載荷報(bào)頭、evs幀和填充比特的rtp有效載荷之外,還添加了rtp報(bào)頭、udp報(bào)頭和ip報(bào)頭。
控制單元210可以控制采樣率和比特率請(qǐng)求信息,其包括待發(fā)射到接收終端的采樣率列表信息和比特率列表信息。
接口單元230可在控制單元210的控制下將采樣率和比特率請(qǐng)求信息發(fā)射到接收終端。此后,接口單元230可以從接收終端接收通過從采樣列表信息選擇的采樣類型以及從比特率列表信息選擇的比特率類型的至少一個(gè)組合得到的組合確定信息。
例如,如圖4(b)所示,可以從接收終端接收{(diào)(0,0)、(1,1)、(1,2)、(2,3)、(2,4)、(2,5)}作為組合確定信息。每個(gè)組合確定信息片段可以指示(采樣率識(shí)別信息、比特率識(shí)別信息)。因此,作為組合確定信息的{(0,0)、(1,1)、(1,2)、(2,3)、(2,4)、(2,5)}分別指示7.2(nb)、8(wb)、9.6(wb)、13.2(swb)、16.4(swb)和24.4(swb)的采樣率類型和比特率類型的組合信息。可以通過使用語音信號(hào)的背景噪聲、語音質(zhì)量、語音音調(diào)中的至少一個(gè)來確定此組合確定信息。
語音壓縮單元240可以根據(jù)所接收的組合確定信息來壓縮語音信號(hào)。例如,當(dāng)接收?qǐng)D4(b)所示的作為組合確定信息的{(0,0)、(1,1)、(1,2)、(2,3)、(2,4)、(2,5)時(shí),語音壓縮單元240可以以對(duì)應(yīng)于組合確定信息的采樣率和比特率壓縮待發(fā)射到接收終端的語音信號(hào)。也就是說,如果確定以對(duì)應(yīng)于組合確定信息的(0,0)來壓縮語音信號(hào),則語音壓縮單元240可以根據(jù)對(duì)應(yīng)于識(shí)別信息“0”的采樣率類型8,000(nb)以及對(duì)應(yīng)于識(shí)別信息“0”的比特率類型7.2來壓縮語音信號(hào),并且將壓縮的語音信號(hào)輸出到接口單元230。
語音壓縮單元240可以在控制單元210的控制下將壓縮語音信號(hào)發(fā)射到接收終端。
圖7是根據(jù)示例性實(shí)施方式的用于接收語音信號(hào)的接收終端的操作方法的流程圖。
參考圖7,在操作s300中,接收終端可以從發(fā)射終端接收采樣率和比特率請(qǐng)求信息,其包括用于確定語音信號(hào)的采樣率的采樣信息、以及用于確定語音信號(hào)的比特率的比特率信息。采樣信息可以包括采樣列表信息,其具有對(duì)于特定范圍確定的至少一個(gè)采樣類型或采樣率范圍信息;并且比特率信息可以包括比特率列表信息,其具有對(duì)于特定范圍確定的至少一個(gè)比特率類型或比特率范圍信息。采樣列表信息可以包括對(duì)應(yīng)于相應(yīng)采樣類型的采樣識(shí)別信息,并且比特率列表信息可以包括對(duì)應(yīng)于相應(yīng)比特率類型的比特率識(shí)別信息。
采樣率和比特率請(qǐng)求信息可以通過插入有效載荷報(bào)頭中而被接收。也就是說,對(duì)應(yīng)于采樣率和比特率請(qǐng)求信息的采樣列表信息和比特率列表信息可以被添加到有效載荷報(bào)頭,并且有效載荷報(bào)頭包括:當(dāng)前使用的采樣類型的采樣類型確認(rèn)信息,當(dāng)前使用的比特率類型的比特率類型確認(rèn)信息、以及采樣列表信息和比特率列表信息等。
可能以voip分組的形式接收具有采樣率和比特率請(qǐng)求信息的有效載荷報(bào)頭,在所述voip分組中添加了rtp報(bào)頭、udp報(bào)頭和ip報(bào)頭中的至少一個(gè)。如圖3所示,接收終端可以接收voip分組,其中除了包括有效載荷報(bào)頭、evs幀和填充比特的rtp有效載荷之外,還添加了rtp報(bào)頭、udp報(bào)頭和ip報(bào)頭。
在操作s300之后,在操作s302中,接收終端可以確定基于采樣信息確定的采樣率和基于比特率信息確定的比特率的至少一個(gè)組合。可以通過從采樣信息選擇的采樣類型和從比特率信息選擇的比特率類型的至少一個(gè)組合,或通過在采樣率范圍信息的范圍內(nèi)確定的采樣率范圍和在比特率范圍信息的范圍內(nèi)確定的比特率范圍的至少一個(gè)組合,確定組合確定信息??梢栽诎l(fā)送方向和接收方向上不同地確定采樣率范圍信息,并且可以在發(fā)送方向和接收方向上不同地確定比特率范圍信息。
接收終端可以將有效載荷報(bào)報(bào)頭、rtp報(bào)頭、udp報(bào)頭和ip報(bào)頭從所接收的voip分組中分離,從分離的有效載荷報(bào)頭提取采樣列表信息和比特率列表信息,并且通過使用所提取的采樣列表信息和比特率列表信息來確定所述至少一個(gè)組合。
如圖4(b)所示,接收終端可以從采樣率列表信息選擇evs,并且確定任何一個(gè)采樣率(例如,32,000個(gè)樣本/秒)。此外,接收終端可以確定使用來自比特率列表信息的最大24.4kbps的比特率。也就是說,可以將配置集確定為{(0,0)、(1,1)、(1,2)、(2,3)、(2,4)、(2,5)}作為組合確定信息。每個(gè)組合確定信息片段可以指示(采樣率識(shí)別信息、比特率識(shí)別信息)。也就是說,(0,0)是采樣率識(shí)別信息“0”和比特率識(shí)別信息“0”的組合,其中與識(shí)別信息相對(duì)應(yīng)的采樣率類型對(duì)應(yīng)于8,000(nb),并且與識(shí)別信息相對(duì)應(yīng)的比特率類型對(duì)應(yīng)于7.2。因此,作為組合確定信息的{(0,0)、(1,1)、(1,2)、(2,3)、(2,4)、(2,5)}分別指示7.2(nb)、8(wb)、9.6(wb)、13.2(swb)、16.4(swb)和24.4(swb)的采樣率類型和比特率類型的組合信息。
接收終端可以通過使用包括語音信號(hào)的音頻信號(hào)的背景噪聲、音頻質(zhì)量、音頻音調(diào)中的至少一個(gè)來確定采樣率類型和比特率類型的組合信息。
如圖5所示,接收終端可能不希望聽到高頻音頻或尖銳聲音。在這種情況下,通過在特定頻率或更高頻率的高頻分量的能量比是特定水平或更高(如圖5(b)所示)時(shí)包括從swb的采樣率降低到wb或nb的采樣率;并且通過匹配可與采樣率組合的比特率類型,接收終端分析接收的語音幀并且確定組合確定信息。相反,在連接到安全攝像機(jī)等使得甚至需要發(fā)射細(xì)聲改變的情況下,接收終端可以通過將nb的采樣率調(diào)整到wb、swb等的采樣率以便盡可能地提高采樣率、以及匹配可以與采樣率組合的比特率類型,來確定組合確定信息。
在操作s302之后,在操作s304中,接收終端可以將所確定的組合確定信息發(fā)射到發(fā)射終端。此后,當(dāng)發(fā)射終端發(fā)射根據(jù)組合確定信息壓縮的語音信號(hào)時(shí),接收終端可以接收壓縮的語音信號(hào)并且恢復(fù)和輸出語音號(hào)。
圖8是根據(jù)示例性實(shí)施方式的用于接收語音信號(hào)的接收終端的操作設(shè)備的框圖,并且所述設(shè)備可以包括接口單元400、控制單元410和組合確定單元420。
參考圖8,接口單元400可以從發(fā)射終端接收采樣率和比特率請(qǐng)求信息,其包括:具有用于確定語音信號(hào)的采樣率的至少一個(gè)采樣類型的采樣列表信息、以及具有用于確定語音信號(hào)的比特率的至少一個(gè)比特率類型的比特率列表信息。接口單元400可以接收插入采樣率和比特率請(qǐng)求信息插入其中的有效載荷報(bào)頭。接口單元400可以接收有效載荷報(bào)頭,其包括:當(dāng)前使用的采樣類型的采樣類型確認(rèn)信息、當(dāng)前使用的比特率類型的比特率類型確認(rèn)信息、以及采樣列表信息和比特率列表信息等。
可能以voip分組的形式接收有效載荷報(bào)頭,在所述voip分組中添加了rtp報(bào)頭、udp報(bào)頭和ip報(bào)頭中的至少一個(gè)。如圖3所示,接口單元400可以接收voip分組,其中除了包括有效載荷報(bào)頭、evs幀和填充比特的rtp有效載荷之外,還添加了rtp報(bào)頭、udp報(bào)頭和ip報(bào)頭。
控制單元410可以根據(jù)采樣率和比特率請(qǐng)求信息的接收來控制組合確定單元420,以便確定采樣率類型和比特率類型的組合。
組合確定單元420可以根據(jù)采樣率和比特率請(qǐng)求信息確定從采樣列表信息確定的采樣類型以及從比特率列表信息確定的比特率類型的至少一個(gè)組合。
組合確定單元420可以將有效載荷報(bào)報(bào)頭、rtp報(bào)頭、udp報(bào)頭和ip報(bào)頭從所接收的voip分組中分離,從分離的有效載荷報(bào)頭提取采樣列表信息和比特率列表信息,并且通過使用所提取的采樣列表信息和比特率列表信息來確定所述至少一個(gè)組合。
如圖4(b)所示,組合確定單元420可以從采樣率列表信息選擇evs,并且確定任何一個(gè)采樣率(例如,32,000個(gè)樣本/秒)。此外,組合確定單元420可以確定使用來自比特率列表信息的最大24.4kbps的比特率。每個(gè)組合確定信息片段可以指示(采樣率識(shí)別信息、比特率識(shí)別信息)。作為組合確定信息的{(0,0)、(1,1)、(1,2)、(2,3)、(2,4)、(2,5)}分別指示7.2(nb)、8(wb)、9.6(wb)、13.2(swb)、16.4(swb)和24.4(swb)的采樣率類型和比特率類型的組合信息。
組合確定單元420可以通過使用包括語音信號(hào)的音頻信號(hào)的背景噪聲、音頻質(zhì)量、音頻音調(diào)中的至少一個(gè)來確定采樣率類型和比特率類型的至少一個(gè)組合。
如圖5所示,接收終端的用戶可能不希望聽到高頻音頻或尖銳聲音。在這種情況下,通過在特定頻率或更高頻率的高頻分量的能量比是特定水平或更高(如圖5(b)所示)時(shí)包括從swb的采樣率降低到wb或nb的采樣率;并且通過匹配可與采樣率組合的比特率類型,接收終端可以分析接收的語音幀并且確定組合確定信息,接收終端可以分析接收的語音幀并且確定組合確定信息。相反,在連接到安全攝像機(jī)等使得甚至需要發(fā)射細(xì)聲改變的情況下,接收終端可以通過將nb的采樣率調(diào)整到wb、swb等的采樣率以便盡可能地提高采樣率、以及匹配可以與采樣率組合的比特率類型,來確定組合確定信息。
控制單元410可以控制待發(fā)射到發(fā)射終端的所確定的組合確定信息。據(jù)此,接口單元400可以向發(fā)射終端發(fā)射組合確定信息。
發(fā)射終端與接收終端之間的這種協(xié)商方法在選擇要用于呼叫的比特率和采樣率時(shí)向發(fā)射終端提供最大的靈活性,但具有若干重要的限制。
首先,用于呼叫服務(wù)的比特率受費(fèi)用系統(tǒng)的影響,并且通常被分配給一組鄰近比特率(諸如13.2kbps、16.4kbps和24.4kbps)而不是分成例如7.2kbps、24.4kbps和48kbps。也就是說,可以以特定范圍單位分配比特率,并且可以在此范圍內(nèi)調(diào)整比特率并且根據(jù)發(fā)射條件使用比特率。在這種情況下,并非逐個(gè)協(xié)商單獨(dú)比特率,協(xié)商用于呼叫的最小比特率與最大比特率的范圍可以是有效的。
圖9示出了一個(gè)過程,其中發(fā)射終端通過使用br-send消息和br-recv消息向接收終端提供分別用于發(fā)送方向和接收方向的比特率,并且接收終端從所提供的比特率中選擇部分范圍并且應(yīng)答所選擇的范圍。
這里,br-send消息和br-recv消息指示考慮發(fā)射終端和接收終端的互相相反的方向。為了使呼叫協(xié)商根據(jù)消息交換逐漸聚集,由接收終端發(fā)射的br-send消息的比特率范圍應(yīng)當(dāng)是由發(fā)射終端發(fā)射的br-recv消息中提供的比特率范圍的子集。此外,由接收終端發(fā)射的br-recv消息的比特率范圍應(yīng)當(dāng)是由發(fā)射終端發(fā)射的br-send消息中提供的比特率范圍的子集。
基本協(xié)商方法的另一個(gè)限制是這樣一個(gè)問題,即當(dāng)已經(jīng)協(xié)商了采樣率,但由于輸入信號(hào)或背景噪聲的不可預(yù)測(cè)特性發(fā)射終端需要調(diào)整采樣率時(shí),應(yīng)當(dāng)通過與對(duì)方終端交換信息來重新協(xié)商調(diào)整。如果輸入信號(hào)或背景噪聲的特性以高速度改變,即使發(fā)射終端連續(xù)嘗試重新協(xié)商,發(fā)射終端也可能不滿足當(dāng)前輸入信號(hào)的特性。即使在這種情況下,在呼叫協(xié)商步驟中馬上協(xié)商用于呼叫的最小采樣率與最大采樣率的范圍也可以是有效的。
圖10示出了一個(gè)過程,其中發(fā)射終端通過使用bw-send消息和bw-recv消息向接收終端提供分別用于發(fā)射方向和接收方向的采樣率范圍,并且接收終端從所提供的采樣率中選擇部分范圍并且應(yīng)答所選擇的范圍。這里,bw-send消息和bw-recv消息指示考慮發(fā)射終端和接收終端的相互相反的方向。為了使呼叫協(xié)商收斂,由接收終端發(fā)射的bw-send消息的采樣率范圍應(yīng)當(dāng)是由發(fā)射終端發(fā)射的bw-recv消息中提供的采樣率范圍的子集。此外,由接收終端發(fā)射的bw-recv消息的采樣率范圍應(yīng)當(dāng)是由發(fā)射終端發(fā)射的bw-send消息中提供的采樣率范圍的子集。如上所述,以范圍單位協(xié)商比特率和采樣率的方法可能比協(xié)商單獨(dú)比特率和單獨(dú)采樣率的方法更不靈活,但具有滿足現(xiàn)實(shí)服務(wù)狀況并且簡(jiǎn)化待交換消息的優(yōu)點(diǎn)。此外,由于兩個(gè)方向是獨(dú)立協(xié)商的,即使發(fā)射終端和接收終端的音頻處理能力彼此不同,以范圍單位協(xié)調(diào)比特率和采樣率的方法也可以比協(xié)商單獨(dú)比特率和單獨(dú)采樣率的方法更有效地處理這種情況。當(dāng)相同的比特率或采樣率用于兩個(gè)方向時(shí),用諸如br和bw的縮寫符號(hào)代替br-send/br-recv和bw-send/bw-recv來指示消息。
表5包括這些消息的定義。除了以范圍單位的采樣率之外,bw、bw-send和bw-recv可以用于單個(gè)采樣率的協(xié)商,諸如nb、wb、swb和fb。
[表5]
在圖11中,發(fā)射終端向接收終端提供:evs編解碼器使用5.9kbps至64kbps范圍內(nèi)的比特率,并且接收終端調(diào)整范圍的上限和下限,修改范圍,以使得在13.2kbps至24.4kbps范圍內(nèi)的比特率用于呼叫,并且將修改的范圍應(yīng)答回發(fā)射終端。
在圖12中,發(fā)射終端向接收終端提供:evs編解碼器使用nb至swb范圍內(nèi)的采樣率,并且接收終端調(diào)整范圍的上限和下限,修改范圍,以使得使用nb至wb范圍內(nèi)的采樣率,并且將修改的范圍應(yīng)答回發(fā)射終端。
在圖13中,發(fā)射終端向接收終端提供:evs編解碼器使用5.9kbps至64kbps范圍內(nèi)的比特率以及nb至swb范圍內(nèi)的采樣率,并且接收終端調(diào)整比特率范圍的上限和下限以及采樣率范圍的上限,修改范圍,以使得使用在13.2kbps至24.4kbps范圍內(nèi)的比特率以及nb至wb范圍內(nèi)的采樣率,并且將修改的范圍應(yīng)答回發(fā)射終端。
在圖14中,發(fā)射終端向接收終端提供:evs編解碼器使用5.9kbps至24.4kbps范圍內(nèi)的比特率以及nb至swb范圍內(nèi)的采樣率,并且接收終端修改范圍,以使得在接收方向上使用13.2kbps的比特率以及nb至wb范圍內(nèi)的采樣率,并且在發(fā)送方向上按照請(qǐng)求使用在5.9kbps至24.4kbps的范圍內(nèi)的比特率以及nb至swb范圍內(nèi)的采樣率,并將修改的范圍應(yīng)答回發(fā)射終端。
根據(jù)示例性實(shí)施方式的方法可以被實(shí)現(xiàn)為硬件或軟件、或者作為硬件和軟件的組合。當(dāng)這些方法被實(shí)現(xiàn)為軟件時(shí),可以提供用于存儲(chǔ)一個(gè)或多個(gè)程序(軟件模塊)的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中的一個(gè)或多個(gè)程序被配置成由電子裝置中的一個(gè)或多個(gè)處理器執(zhí)行。一個(gè)或多個(gè)程序包括命令電子裝置執(zhí)行根據(jù)實(shí)施方式的方法的指令。
這些程序(軟件模塊或軟件)可以存儲(chǔ)在非易失性存儲(chǔ)器中,所述非易失性存儲(chǔ)器包括隨機(jī)存取存儲(chǔ)器(ram)和閃存、只讀存儲(chǔ)器(rom)、電可擦除可編程rom(eeprom)、磁盤存儲(chǔ)裝置、光盤rom(cd-rom)、數(shù)字通用盤(dvd)、另一種類型的光學(xué)存儲(chǔ)裝置、或磁帶盒??商娲?,程序可以存儲(chǔ)在包括其中的一些或全部的存儲(chǔ)器中。此外,上述每個(gè)存儲(chǔ)器在數(shù)量上可以是多個(gè)。
可替代地,程序可以存儲(chǔ)在可附接存儲(chǔ)裝置中,其可以通過通信網(wǎng)絡(luò)訪問電子裝置,所述通信網(wǎng)絡(luò)包括單獨(dú)或組合的互聯(lián)網(wǎng)、內(nèi)聯(lián)網(wǎng)、局域網(wǎng)(lan)、寬lan(wlan)和存儲(chǔ)區(qū)域網(wǎng)絡(luò)(san)。該存儲(chǔ)裝置可以通過外部端口訪問電子裝置?;蛘撸ㄐ啪W(wǎng)絡(luò)上的單獨(dú)的存儲(chǔ)裝置可以訪問便攜式電子裝置。