專利名稱:會議電話系統(tǒng)、方法以及計算機程序產(chǎn)品的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種會議電話系統(tǒng)和方法、以及一種計算機程序產(chǎn)品。
背景技術(shù):
在當前的語音會議系統(tǒng)中,會議橋接器中的揚聲器選擇算法檢測活躍的揚聲器并且通過混合該活躍的揚聲器或活躍的參與者的音頻來創(chuàng)建輸出流。活躍的流然后被傳送給會議電話上的參與者。然而,活躍的揚聲器的選擇包括基于從活躍的揚聲器所位于的電話端點接收到的語音通信的能量級別來選擇通常被稱為主揚聲器的預(yù)定數(shù)目的最活躍的揚聲器。當接收到來自主揚聲器的話音時,所有其它揚聲器根據(jù)揚聲器選擇算法被排除在外。例如,美國專利申請公開US2007/263821A1描述了一種在多方會議電話中提供揚聲器選擇的方法和裝置。該方法包括處理用于至少一個新的揚聲器的揚聲器隊列,并且監(jiān)視主揚聲器的數(shù)目何時小于主揚聲器的預(yù)定數(shù)目。當主揚聲器的預(yù)定數(shù)目小于預(yù)定數(shù)目時,在沒有人為干涉的情況下,該方法自動地將來自揚聲器隊列的新的揚聲器添加到主揚聲器。常規(guī)的揚聲器選擇算法故意地不允許新的揚聲器加入直到主揚聲器中的一個已經(jīng)沉寂一段時間為止。盡管這消除了中斷,但是如果主揚聲器繼續(xù)保持講話,則其還阻止了新的揚聲器講話的機會。
發(fā)明內(nèi)容
本發(fā)明提供了一種會議電話系統(tǒng)、一種會議電話方法以及一種計算機程序產(chǎn)品, 如所附權(quán)利要求中所描述的。在從屬權(quán)利要求中闡明了本發(fā)明的特定實施例。本發(fā)明的這些和其它方面將從下文中所描述的實施例中顯而易見,并且將參考下文中所描述的實施例闡述發(fā)明的這些和其它方面。
將參考圖僅通過示例的方式描述本發(fā)明的更多的細節(jié)、方面和實施例。在圖中,相同的附圖標記被用來標識相同的或功能上類似的元素。圖中的元素是為了簡單和清楚而示出的,并且不必按比例繪制。圖I示意性地示出了會議電話系統(tǒng)的實施例的示例的框圖。圖2示意性地示出了適合于圖I的示例的選擇控制單元的實施例的示例的框圖。圖3示意性地示出了新的主揚聲器檢測器的實施例的示例的框圖。圖4示意性地示出了減量估計單元的實施例的示例的框圖。圖5示意性地示出了計算機可讀介質(zhì)的立體圖。圖6示意性地示出了圖示了最近過去的、遙遠的過去的、以及總體過去的時間窗的圖。
圖7示意性地示出了圖示了使用響度作為分類器將輸入流分類在不同種類中的圖。圖8示意性地示出了圖示了使用輸入流之間的響度方面的差別作為分類器將輸入流分類在不同種類中的圖。
具體實施例方式因為對于大部分而言可以使用為本領(lǐng)域的技術(shù)人員已知的電子組件和電路來實現(xiàn)所圖示的本發(fā)明的實施例,所以將不在比對于理解和了解本發(fā)明的基本概念被認為是必要的任何更大程度上對細節(jié)進行解釋,并且以便于不使本發(fā)明的教導模糊或者從本發(fā)明的教導轉(zhuǎn)移。參考圖1,在其中所示的會議電話系統(tǒng)I的示例包括輸入接口 14。在會議電話期間,在接口 14處接收到包含音頻的兩個或兩個以上的輸入流101-103。輸入流中的每一個都起源于另一個信源10-12,例如電話或揚聲器的其它通信單元。將顯而易見的是,除這些輸入流之外,還可以接收其它的輸入流,其可以或可以不起源于相同的信源。此外,將顯而易見的是,多個人可以共享相同的電話或其它的音頻通信單元。在下文中術(shù)語“主揚聲器” 指的是被選擇為可以由一個人或一個以上的人使用的“主揚聲器”的信源。術(shù)語“非主揚聲器”指的是可以或可以不展現(xiàn)滿足主揚聲器的標準的行為但未被選擇為主揚聲器的信源。 術(shù)語“附加主揚聲器”指的是展現(xiàn)了滿足主揚聲器的標準的行為但是仍然未被選擇為主揚聲器的信源。輸入流每個都包括表示來自信源的至少音頻的數(shù)據(jù)或信號,并且除此之外還可以包括視頻和/或數(shù)據(jù)。音頻可以例如由有聲的音頻(例如話音)組成,并且也包括其它類型的音頻,諸如背景噪聲、非有聲的聲音、背景傳聞。音頻可以例如是未過濾的或已經(jīng)被過濾以移除不希望有的分量,諸如噪聲、非有聲的聲音、背景傳聞或其它。圖I中所示的會議電話系統(tǒng)I進一步包括選擇單元15,所述選擇單元15被連接到輸入接口 14。當系統(tǒng)I在操作中時,選擇單元15從輸入流101-103中選擇多個主揚聲器流。所選擇的數(shù)目K小于或等于主揚聲器值的最大數(shù)目Kmax。如示例中所示,主揚聲器值的最大數(shù)目Kmax被設(shè)置為2并且選擇了等于主揚聲器值的最大數(shù)目的多個輸入流102、103。 然而,也可以選擇小于主揚聲器值的最大數(shù)目的數(shù)目。可以使用適合于選擇主揚聲器流的任何標準來執(zhí)行所述選擇。例如,在沒有人為干擾的情況下,可以通過選擇Kmax個最大聲的流來自動地執(zhí)行所述選擇。在這方面中,術(shù)語 “最大聲的”指的是其中觀測到關(guān)注的信號中的最高強度的流。關(guān)注的信號可以例如是作為音頻信號的全部或一部分的音頻信號,諸如其有聲的部分、無背景噪聲和非有聲的部分。關(guān)注的信號可以例如占用一個或多個時間段,例如,在一個或多個時間窗口期間的響度可以被用作為選擇標準。例如,可以針對每個流中的音頻來計算響度數(shù)λ,并且可以選擇具有Kmax個最高的響度數(shù)λρ λ2、…、λκ_的流。在下文中被稱為“ISCC2001論文”并且通過引用合并在本文中的 Prasad, Venkatesha R. ;Kuri, Joy; Jamadagni, H S;Dagale, Haresh; and Ravindranathj Ravi A.,"Automatic Addition and Deletion of Clients in VoIP Conferencing,"ISCC,pp. 0386,Sixth IEEE Symposium on Computers andCommunications (ISCC’ 01),2001中描述了用于計算響度數(shù)的適當?shù)姆椒?。響度?shù)λ可以例如是輸入流的現(xiàn)在和過去的幅度的函數(shù)。例如能夠從在“最近過去的”窗口 Wip期間的當前的活動性L1、“遙遠的過去的”窗口 Wdp內(nèi)的過去的活動性L2以及 “總體過去的”窗口 Wtjp內(nèi)的總體過去的活動性L3來計算流i的響度數(shù)λ it)當前的活動性 L1可以例如是當前過去的窗口 Wip期間的幅度的移動平均值。過去的活動性L2可以例如是遙遠的過去的窗口 Wdp期間的幅度的移動平均值。過去的活動性L2例如可以是遙遠的過去的窗口 Wdp期間的幅度的移動平均值??傮w的活動性L3可以例如是遙遠的過去的窗口 Wap 期間的幅度的移動平均值。如圖6中所圖示,“最近過去的”窗口 Wip可以從時間Ttl處的當前點延伸到在時間 T0處的當前點之前的時間jL1處的過去的點?!斑b遠的過去的”窗口 Wdp可以例如從時間Ttl 處的當前點延伸到在時間jL1處的過去的點之前的時間T_2處的遙遠的點。“總體過去的”窗口 Wtjp可以例如從時間Ttl處的當前點延伸到在時間Τ_2處的遙遠的點之前的時間Τ_3處的更遙遠的點。可以例如通過執(zhí)行如能夠由數(shù)學公式描述的運算來計算活動性U、L2, L3。L1k,f ;厶2 = TTr~'Σ,k-j j L3 k = L3 k + &*IXk ; L3 k = L3 k -■——(1)
Wrp WrpWdp WdpH.aP,其中,Xk,i是第i個輸入流的第k個采樣的幅度。O是相對于在輸入流中找到的最大幅度max(X(k))運算的二進制運算,并且可以例如通過執(zhí)行如能夠由數(shù)學公式描述的運算來計算,在這個等式(2)中,值O.I是閾值,其可以被設(shè)置為適合于具體實施方式
的任何值并且可以例如選自O(shè). I和O. 2的組以及O. I與O. 2之間的所有中間的點。響度數(shù)λ例如可以例如是活動性LpLyL3的加權(quán)和,并且例如通過執(zhí)行如能夠由數(shù)學公式描述的運算來計算λ = a ^L1+a 2*L2+a 3*L3 (3)其中,α p α 2、a 3是具有合適的值的常數(shù)。已經(jīng)找到合適的值為例如α i = O. 6、 α2=0. 3、α3=0. 3,但是也可以使用其它的值。主揚聲器流可以以另一方式來選擇,并且例如基于輸入流的話音的內(nèi)容來選擇, 例如以US 2007/263821中所描述的方式或任何其它適當?shù)姆绞?。在圖I中所示的示例中,混合器16被連接到選擇單元15。在操作中,混合器16將所選擇的流混合為輸出流110。如所示,輸出接口 17被連接到混合器16以便于接收輸出流110。經(jīng)由輸出接口 17輸出流110被輸出到連接到會議電話系統(tǒng)I的一個或多個通信裝置,在這個示例中連接到構(gòu)成信源10-12的通信裝置。因此,經(jīng)由所示的通信裝置,參與會議電話的人既能夠說也能夠聽其它的參與者。將顯而易見的是,輸出流110也可以被輸出到僅允許參與者聽的其它通信單元,例如具有在“靜音”上或從其中輸入流未被選擇為主揚聲器流的揚聲器裝置的通信裝置。例如在具有大量的參與者與有限數(shù)目的揚聲器的會議電話中,輸出流可以被廣播到網(wǎng)絡(luò)中給所有的參與者。
如果 Xkj >0.1* max(X(k))
其它
在所示的示例中,輸出接口 117將輸出流110分成多個流111-113。然而,替代地, 輸出接口 117可以輸出輸出流110,然后通過電信網(wǎng)絡(luò)中的另一節(jié)點將輸出流110進一步地分配給相關(guān)通信單元。在圖I的示例中,示出了連接到選擇單元14和輸入接口 15的選擇控制單元18。選擇控制單元18在會議電話期間基于會議的動態(tài)來動態(tài)地設(shè)置主揚聲器值的最大數(shù)目Kmax。 因此,能夠添加新的主揚聲器,從而避免了在那個時間點為主揚聲器的一個或多個參與者阻塞來自正嘗試在電話中講話的會議電話中的其它參與者的輸入流。選擇控制單元18可以被實現(xiàn)成以適合于具體實施方式
的任何方式基于會議的動態(tài)來設(shè)置主揚聲器值的最大數(shù)目Kmax。例如,選擇控制單元18可以將主揚聲器值的最大數(shù)目Kmax設(shè)置成等于其響度超過預(yù)定閾值的輸入流的數(shù)目或者任何其它適當?shù)姆绞?。參考圖2,選擇控制單元18可以包括比較器181。如所示,存儲器單元303被連接到比較器181并且比較器進一步被連接到輸入接口 14。在存儲器303中,存儲了主揚聲器值的最大數(shù)目Kmax。比較器181能夠比較輸入流101-103并且從輸入流101-103中選擇主揚聲器流。在下文中被稱為“ITRE2003論文”、通過引用合并在本文中的Prasad, Venkatesha R. ;Jamadagni, HS;and Shankar, HN: “On the Problem of Specifying the Number of Floors for a Voice-Only Conference on Packet Networks”,International Conference on Information Technology: Research and Education, 2003. ITRE2003, ll-13August, New Jersey, USA, 22-26中描述了用于選擇主揚聲器流的適當?shù)募夹g(shù)。比較器181可以例如選擇響度數(shù)λ超過表示主揚聲器流的預(yù)定閾值直到最大值Kmax的輸入流。如果在閾值之上的輸入流的數(shù)目超過如上文解釋的Kmax,則比較器181可以例如比較輸入流以選擇具有最高的響度數(shù)的Kmax個數(shù)目的輸入流。比較器181可以定期地重復所述比較,并且從而可以避免即使當對應(yīng)的輸入流不再包含語音時,主流保持被選擇。在所示的示例中,比較器181經(jīng)由相應(yīng)的計算器188-190被連接到輸入接口 14, 所述相應(yīng)的計算器188-190被布置成根據(jù)表示音頻的響度的相應(yīng)的輸入流的參數(shù)針對輸入流101-103中的每一個計算響度數(shù)λ,例如如上文所解釋的。在所示的示例中,單獨的計算器為每個輸入流101-103而存在并且計算器188-190被連接到輸入接口 14。對于計算器188-190中的每一個而言,語音檢測器185-187與到輸入接口 14的輸入端連接。語音檢測器185-187能夠檢測輸入流101-103中的語音。當檢測到語音時,語音檢測器185-187啟用相應(yīng)的計算器188-190,并且當未檢測到語音時,禁用相應(yīng)的計算器 188-190或以其他方式確保其輸出最低的響度數(shù)。從而,能夠通過比較器181僅僅潛在地選擇從其中接收到有聲信號的那些輸入流??梢砸灾T如本領(lǐng)域內(nèi)已知的適合于檢測語音的任何方式來實現(xiàn)語音檢測器185-187,并且為了簡潔起見不進行更詳細的描述。在下文中被稱為“ISCC 2002論文”并且通過引用合并在本文中的例如Prasad, Venkatesha R.; Sangwan, Abhijeet;Jamadagni, HS;Chiranth, MC and Sah, Rahul “Comparison of Voice Activity Detection Algorithms for VoIP”,Seventh International Symposium on Computers and Communications, 2002. ISCC 2002,l-4July, Taormina-Giardini Naxos, Italy, pp. 530-535中描述了適當?shù)膶嵤┓绞?。選擇控制單元18可以例如包括第一邏輯單元301和第二邏輯單元302。在所示的示例中,邏輯單元301、302與到接口 14的它們的相應(yīng)的輸入端連接。邏輯單元301、302與其中存儲了主揚聲器值的最大數(shù)目Kmax的存儲單元303的它們的輸出端連接。如參考圖3和4在下文中更詳細地解釋的,當滿足主揚聲器增加標準時,第一邏輯單元301可以增加主揚聲器值的最大數(shù)目Kmax,反之當滿足主揚聲器降低標準時,第二邏輯單元302可以降低主揚聲器值的最大數(shù)目。第一邏輯單元301可以例如被連接到新的揚聲器檢測器180。在所示的示例中,新的揚聲器檢測器將第一邏輯單元301連接到輸入接口 14。然而,將顯而易見的是在第一邏輯單元301與輸入接口 14之間可以存在其它的單元。新的主揚聲器檢測器180能夠從輸入流中檢測附加的主揚聲器流,即附加到被選擇為主揚聲器流的輸入流。如果檢測器180檢測到附加的主揚聲器流,則檢測器180將附加的主揚聲器通知輸出到第一邏輯單元301。第一邏輯單元301然后例如響應(yīng)于該通知而確定是否增加主揚聲器值的最大數(shù)目。例如,當主揚聲器的當前數(shù)目低于主揚聲器值的最大數(shù)目Kmax時,第一邏輯單元301可以照原來的樣子維持主揚聲器值的最大數(shù)目,并且當主揚聲器的當前數(shù)目等于主揚聲器值的最大數(shù)目時,第一邏輯單元301可以將值Kmax遞增I。新的主揚聲器檢測器180能夠以適合于具體實施方式
的任何方式來檢測附加的主揚聲器流。為此,新的主揚聲器檢測器180能夠?qū)⑤斎肓鞯囊粋€或多個參數(shù)與適合于檢測附加的主揚聲器流的一個或多個標準相比較。參數(shù)可以例如是響度。參考圖3中所示的示例,新的主揚聲器檢測器180可以例如包括連接到輸入接口 14的一個或多個計算器188-190。計算器根據(jù)表示音頻的響度的相應(yīng)的輸入流的參數(shù)針對輸入流101-103中的每一個來計算響度值λ P λ2、λ 3ο在所示的示例中,存在與到新的主揚聲器檢測器180的相應(yīng)的檢測器輸入端182-183的計算器輸入端連接的相應(yīng)計算器188-190。在檢測器輸入端182-183處可以接收輸入流101-103。在所示的示例中,新的主揚聲器檢測器180進一步包括語音檢測器185-187,所述語音檢測器185-187與到檢測器輸入端182-183的它們的輸入端連接并且與到計算器 188-190的相應(yīng)的控制輸入端的它們的輸出端連接。語音檢測器185-187將輸入流的一個或多個參數(shù)與適合于檢測輸入流中的語音的標準相比較。當在之前不包括語音的輸入流檢測到語音時,新的主揚聲器檢測器180啟用對應(yīng)的計算器。從而,可以確保僅包括語音的輸入流能夠被指派為主揚聲器,并且例如具有由于噪聲或非有聲的音頻(例如,音樂)而導致高的音頻幅度的輸入流保持非主的,并且因此能夠提高會議電話的總體質(zhì)量。盡管在圖3 的示例中語音檢測器185-187被示出用于輸入流101-103中的每一個,但是將顯而易見的是語音檢測器185-187可以替代地僅僅適用于輸入流中的一些,諸如其非主的揚聲器流。所示的新的主揚聲器檢測器180進一步包括連接到計算器的分類器191。分類器 191至少基于與一個或多個類別M1-M6J1-N7內(nèi)相應(yīng)的非主流i相對應(yīng)的響度值λ i來對輸入流101-103的非主流進行分類。在所示的示例中,分類器191對兩個集合M1-Mf^P N1-N7 的相應(yīng)的類別內(nèi)的輸入流進行分類。第一集合M1-M6R的分類是基于響度值λ的,然而第二集合N1-N7內(nèi)的分類是基于差動響度值Λ λ i的,所述差動響度值Λ λ i是響度值λ i與在最后一個主揚聲器被選擇的點上選擇的最后一個主揚聲器的響度值Xa之間的差。圖7 示出了作為響度值λ j的函數(shù)的類別M1-M6的圖。圖7示出了作為差動響度值Δ λ j的函數(shù)的類別N1-N7的圖。垂直軸指示權(quán)重因子WM、WN,其分別是響度值λ i和差動響度值Λ λ i的函數(shù)。如所示,上下限T1-T5確定輸入流與相關(guān)類別M1-M6的從屬關(guān)系。上下限P1-P6確定輸入流與相關(guān)類別N1-N7的從屬關(guān)系。例如,對于T2的響度值λ i而言,輸入流i將被分類在具有Wm=I的類別M2內(nèi)。對于T3的響度值λ i而言,輸入流將被分類在具有Wm=I的類別M3內(nèi)。對于T2與T3之間的響度值Xi而言,例如Xi=A,輸入流將被分類在具有如由連續(xù)線限定的用于M2的權(quán)重因子 Wm2 (A)和如由虛線限定的用于M3的權(quán)重因子Wm3(A)的類別M2與M3內(nèi)。所示的新的主揚聲器檢測器180進一步包括連接到分類器191的檢測器邏輯單元 192。當在操作中時,檢測器邏輯單元192基于分類來估計一個或一個以上的規(guī)則,并且針對規(guī)則中的每一個來確定估計值。例如,檢測器邏輯單元192可以估計以下的規(guī)則R0-R19, 其中i指的是輸入流i :R0:如果ieΜ2& eNI)則D=I或者
Rl:如果ieΜ2& eN2)則D=I或者
R2:如果ieΜ2& eN3)則D=I或者
R3:如果ieΜ3& eNI)則D=I或者
R4:如果ieΜ3& eN2)則D=I或者
R5:如果ieΜ3& eN3)則D=I或者
R6:如果ieΜ3& eN4)則D=I或者
R7:如果ieΜ3& eN5)則D=I或者
R8:如果ieΜ4& eNI)則D=I或者
R9:如果ieΜ4& eN2)則D=I或者
R10:如果(i e M4&i e N3)則 D=I 或者R11如果(i e M4&i e N4)則 D=I 或者R12:如果(i e M4&1 e N5)則 D=I 或者R13:如果(i e M5&1 e NI)則 D=I 或者R14:如果(i e M5&1 e N2)則 D=I 或者R15:如果(i e M5&1 e N3)則 D=I 或者R16:如果(i e M5&1 e N4)則 D=I 或者R17:如果(i e M5&1 e N5)則 D=I 或者R18:如果(i e M5&1 e N6)則 D=I 或者R19:如果 i e M6 則 D=I。檢測器邏輯單元192可以例如通過執(zhí)行如能夠通過Eq=DJ(Wm^Wnw)描述的計算來為這些規(guī)則中的每一個計算估計值E,在Eq=Dq*(WM((1)+WN((1))中Wmw和Wnw表示用于在規(guī)則 q中使用的類別Mq與Nq的權(quán)重因子。例如對于R18而言,假設(shè)如圖7和8中所圖示λ i=A, Δ λ i=B,則 i e M2 并且 i e N3,結(jié)果將是 E18=D18* (Wm2 (A) +Wn3 (B))。所示的新的主揚聲器檢測器180進一步包括連接到檢測器邏輯單元192的加法器 193和連接到加法器193的比較器194。加法器193從檢測器邏輯單元192接收估計值并且將估計值Ep E2,…、Ej相加以獲得和值Σ。比較器194然后將該和值Σ與閾值Tr相比較,并且當和值Σ超過閾值Tr時在檢測器輸出端195處輸出主揚聲器值的最大數(shù)目增加通知。
往回參考圖2,第二邏輯單元302可以被連接到減量估計單元200。該減量估計單元200可以被布置成將主揚聲器流中的一個或一個以上的一個或一個以上的參數(shù)與主揚聲器值的預(yù)定最大數(shù)目降低標準相比較,并且當參數(shù)滿足主揚聲器值的預(yù)定最大數(shù)目降低標準時,將主揚聲器的最大數(shù)目降低通知輸出到第二邏輯單元302。響應(yīng)于該通知,第二邏輯單元302能夠降低存儲在存儲器303中的主揚聲器的最大數(shù)目。在圖4的示例中,減量估計單元200包括連接到輸入接口 14的語音檢測器 204-206。當在操作中時,語音檢測器204-206檢測主揚聲器流中的語音。第二邏輯單元302進一步包括連接到輸入接口 14的響度比較器211。該響度比較器211將主揚聲器流中的一個或一個以上的中的至少語音的強度與響度閾值相比較。圖 4的示例包括相應(yīng)的計算器207-209,所述相應(yīng)的計算器207-209被布置成根據(jù)表示音頻的響度的相應(yīng)的輸入流的參數(shù)為輸入流中的每一個來計算響度值λ,例如如上文所解釋的那樣。在所示的示例中,單獨的計算器為每個輸入流而存在,并且計算器被連接到輸入接口
14。對于計算器207-209中的每一個而言,語音檢測器204-206與到輸入接口 14的輸入端連接。語音檢測器204-206能夠檢測輸入流中的語音,并且當檢測到語音時啟用相應(yīng)的計算器207-209,以及當未檢測到語音時禁用相應(yīng)的計算器207-209,或者以其他方式確保其輸出在閾值Tr以下的響度數(shù)。當在主揚聲器流中的一個或一個以上中未檢測到語音時,和/或當針對主揚聲器流中的一個或一個以上通過響度比較器211確定強度在響度閾值Tr以下時,減量估計單元 200將通知輸出到第二邏輯單元302。響應(yīng)于該通知,第二邏輯單元302然后降低主揚聲器值的最大數(shù)目Kmax。為了生成該通知,所示的示例包括或門213,其與到比較器211的第一輸入端口連接并且與到語音檢測器的第二輸入端口連接。當通過響度比較器211確定主揚聲器流中的一個或一個以上的強度在響度閾值Tr以下時,第一輸入端口通過響度比較器211 被斷言。當語音檢測器204-206中的一個或多個未檢測到語音時,第二輸入端口被斷言。當斷言輸入端口中的至少一個時,或門213以二進制I的形式輸出通知,并且當沒有輸入端口被斷言時,什么也不輸出(以二進制O的形式)。圖4中所示的減量估計單元200進一步包括選擇器210、212,選擇器210、212分別連接到計算器207-209和被選擇為到比較器213的輸入端的最后一個主揚聲器流的語音檢測器204-206。因此,在這個示例中僅最后一個主揚聲器流的參數(shù)經(jīng)歷估計。然而,減量估計單元200也可以替代地估計其它的主揚聲器流,并且例如包括用于主揚聲器流中的每一個的專用比較器和語音檢測器。本發(fā)明也可以以用于在計算機系統(tǒng)上運行、當在諸如計算機系統(tǒng)的可編程裝置上運行時至少包括用于執(zhí)行根據(jù)本發(fā)明的方法的步驟的代碼部分或使可編程裝置能夠執(zhí)行根據(jù)本發(fā)明的設(shè)備或系統(tǒng)的功能的計算機程序來加以實現(xiàn)。計算機程序是諸如專用程序和/或操作系統(tǒng)的一系列指令。計算機程序可以例如包括以下中的一個或多個子例程、函數(shù)、過程、對象方法、對象實施方式、可執(zhí)行的應(yīng)用、小程序、小服務(wù)程序、源代碼、目標代碼、共享庫/動態(tài)裝載庫和/或針對在計算機系統(tǒng)上執(zhí)行所設(shè)計的其它序列的指令。計算機程序可以被內(nèi)部地存儲在計算機可讀存儲介質(zhì)上,例如如圖5中所示,或經(jīng)由計算機可讀傳輸介質(zhì)傳送到計算機系統(tǒng)。計算機系統(tǒng)中的全部或一些可以被設(shè)置在臨時地、可移除地或遠程地耦合到信息處理系統(tǒng)的計算機可讀介質(zhì)上。計算機可讀介質(zhì)可以例如是放置在用于被讀取的容器中的計算機可讀介質(zhì),并且包括例如但是沒有限制以下各項中的任何數(shù)目包括磁盤和磁帶存儲介質(zhì)的磁存儲介質(zhì);諸如緊致盤介質(zhì)(例如, CD-ROM、CD-R等)和數(shù)字視頻盤存儲介質(zhì)的光學存儲介質(zhì);諸如FLASH存儲器、EEPR0M、 EPROM、ROM的包括基于半導體的存儲器單元的非易失性存儲器存儲介質(zhì);鐵磁體數(shù)字存儲器;MRAM ;包括寄存器、緩沖器或高速緩存、主存儲器、RAM等的易失性存儲介質(zhì)。計算機可讀介質(zhì)還可以是包括計算機網(wǎng)絡(luò)、點對點電信裝置以及載波傳輸介質(zhì)等等的數(shù)據(jù)傳輸介質(zhì)。計算機處理通常包括執(zhí)行(運行)程序或程序的一部分、當前程序值和狀態(tài)信息以及被操作系統(tǒng)使用以管理處理的執(zhí)行的資源。操作系統(tǒng)(OS)是管理計算機的資源的共享并且向程序員提供用來訪問那些資源的接口的軟件。操作系統(tǒng)處理系統(tǒng)數(shù)據(jù)和用戶輸入, 并且通過分配和管理任務(wù)和內(nèi)部的系統(tǒng)資源作為服務(wù)給系統(tǒng)的用戶和程序來作出響應(yīng)。計算機系統(tǒng)可以例如包括至少一個處理單元、關(guān)聯(lián)存儲器以及多個輸入/輸出 (I/O)設(shè)備。當執(zhí)行計算機程序時,計算機系統(tǒng)根據(jù)計算機程序來處理信息并且經(jīng)由I/O設(shè)備來產(chǎn)生合成的輸出信息。在前述說明書中,已經(jīng)參考本發(fā)明的實施例的特定示例對本發(fā)明進行了描述。然而,將明顯的是,在不背離如所附權(quán)利要求中陳述的本發(fā)明的更寬廣的精神和范圍的情況下,可以在其中做出各種修改和改變。例如,代替圖7和8中所圖示的線性函數(shù),可以使用諸如拋物線或雙曲線的其它函數(shù)。同樣地,可以使用不同數(shù)目的類別M、N和/或輸入流。同樣地,如本文中所討論的連接可以是適合于例如經(jīng)由中間設(shè)備從相應(yīng)的節(jié)點、 單元或設(shè)備傳輸信號或者將信息傳輸?shù)较鄳?yīng)的節(jié)點、單元或設(shè)備的任何類型的連接。因此, 除非另外暗示或規(guī)定,否則連接可以例如是直接連接或間接連接??梢愿鶕?jù)為單個連接、多個連接、單向連接或雙向連接來圖示或描述連接。然而,不同的實施例可以隨連接的實施方式變化。例如,可以使用單獨的單向連接而不是雙向連接并且反之亦然。同樣地,可以用串行地或以時分復用的方式傳輸多個信號的單個連接來代替多個連接。同樣地,攜帶多個信號的單個連接可以被分開為攜帶這些信號的子集的各種不同的連接。因此,存在用于傳輸信號的許多選項。另外,本文中所描述的每個信號都可以被設(shè)計為正或負邏輯。在負邏輯信號的情況下,信號是低態(tài)有效,其中邏輯上真狀態(tài)對應(yīng)于邏輯電平零。在正邏輯信號的情況下,信號是高態(tài)有效,其中邏輯上真狀態(tài)對應(yīng)于邏輯電平一。注意的是,本文中所描述的信號中的任何一個都能夠被設(shè)計為負或正邏輯信號。因此,在替代實施例中,被描述為正邏輯信號的那些信號可以被實現(xiàn)為負邏輯信號,并且被描述為負邏輯信號的那些信號可以被實現(xiàn)為正邏輯信號。另外,當涉及分別將信號、狀態(tài)位或類似裝置翻譯為其邏輯上真或邏輯上假狀態(tài)時,在本文中使用了術(shù)語“斷言”或“設(shè)置”和“否定”(或“解除斷言”或“清除”)。如果邏輯上真狀態(tài)是邏輯電平一,則邏輯上假狀態(tài)是邏輯電平零。并且如果邏輯上真狀態(tài)是邏輯電平零,則邏輯上假狀態(tài)是邏輯電平一。本領(lǐng)域的技術(shù)人員將進一步認識到邏輯塊之間的邊界僅僅是說明性的,并且替代實施例可以合并邏輯塊或電路元件,或者將功能的替代分解強加在各種邏輯塊或電路元件上。因此,將要理解的是,本文中所描繪的架構(gòu)僅僅是示例性的,并且實際上能夠?qū)嵤崿F(xiàn)相同的功能的許多其它架構(gòu)。例如,圖2-4中所示的語音檢測器和計算器可以被不同的單
元共享。同樣地例如,在一個實施例中,所圖示的示例可以被實現(xiàn)為位于在單個集成電路上或相同的設(shè)備內(nèi)的電路。例如,會議電話系統(tǒng)可以被實現(xiàn)為適當?shù)某炭靥幚砥?,諸如通用微處理器或數(shù)字信號處理器。替代地,示例可以以適當?shù)姆绞奖粚崿F(xiàn)為任何數(shù)目的單獨的集成電路或彼此互連的單獨的設(shè)備。同樣地例如,示例或其部分可以被諸如以任何適當類型的硬件描述語言實現(xiàn)為物理電路的或可轉(zhuǎn)換為物理電路的邏輯表達式的表示。然而,其它修改、變化以及替代也是可以的。因此,說明書和圖應(yīng)當在說明性的而不是在限制的意義上考慮。在權(quán)利要求中,放在括弧之間的任何參考符號將不被解釋為限制權(quán)利要求。詞語 ‘包括’不排除其它元素或步驟以及在權(quán)利要求中列舉的那些的存在。另外,如本文中所使用的術(shù)語“一”或“一個”被定義為一個或一個以上。同樣地,即使當相同的權(quán)利要求包括介紹性短語“一個或多個”或“至少一個”和諸如“一”或“一個”的不定冠詞時,權(quán)利要求中的諸如“至少一個”和“一個或多個”的介紹性短語的使用不應(yīng)該被解釋成暗示通過不定冠詞“一”或“一個”的另一權(quán)利要求元素的引入將包含這樣引入的權(quán)利要求元素的任何特定的權(quán)利要求限制到包含僅一個這樣的元素的發(fā)明。相同的情況適用于定冠詞的使用。除非另外規(guī)定,否則諸如“第一”和“第二”的術(shù)語被用來任意地區(qū)分這樣的術(shù)語描述的元素。因此,這些術(shù)語未必旨在指示這樣的元素的短暫的或其它的優(yōu)先化。在相互不同的權(quán)利要求中列舉了特定措施的簡單事實不指示這些措施的組合不能夠被用來使處于優(yōu)勢。
權(quán)利要求
1.一種會議電話系統(tǒng),包括輸入接口,所述輸入接口用于在會議電話期間接收音頻信號的至少兩個輸入流,所述輸入流中的每一個來自另一個信源;連接至所述輸入接口的選擇單元,所述選擇單元用于從所述輸入流中選擇多個主揚聲器流,所述主揚聲器流的數(shù)目小于或等于主揚聲器值的最大數(shù)目,并且所述主揚聲器中的每一個表不來自相應(yīng)的主揚聲器的話音;連接到所述選擇單元的混合器,所述混合器用于將所選擇的流混合為輸出流;輸出接口,所述輸出接口用于輸出所述輸出流;以及連接到所述選擇單元和所述輸入接口的選擇控制單元,所述選擇控制單元用于在所述會議電話期間基于所述會議電話的動態(tài)來動態(tài)地設(shè)置主揚聲器值的所述最大數(shù)目。
2.根據(jù)權(quán)利要求I所述的會議電話系統(tǒng),其中,所述選擇控制單元包括第一邏輯單元,所述第一邏輯單元用于當滿足主揚聲器增加標準時,增加主揚聲器值的所述最大數(shù)目;以及第二邏輯單元,所述第二邏輯單元用于當滿足主揚聲器降低標準時,降低主揚聲器值的所述最大數(shù)目。
3.根據(jù)權(quán)利要求2所述的會議電話系統(tǒng),包括連接到所述輸入接口的新的主揚聲器檢測器,用于從所述輸入流中檢測附加的主揚聲器流;并且其中,所述第一邏輯單元連接到所述新的主揚聲器檢測器,并且被布置成當所述第一邏輯單元在操作中時,當所述數(shù)目等于主揚聲器值的所述最大數(shù)目并且所述主揚聲器檢測器檢測到附加的主揚聲器流時,增加主揚聲器值的所述最大數(shù)目。
4.根據(jù)權(quán)利要求3所述的會議電話系統(tǒng),其中,所述主揚聲器檢測器包括連接到所述輸入接口的計算器,所述計算器用于根據(jù)表示所述音頻的響度的相應(yīng)的輸入流的參數(shù)對所述輸入流中的每一個計算響度值;連接到所述計算器的分類器,所述分類器用于至少基于與非主流相對應(yīng)的響度值對所述輸入流的所述非主流進行分類;以及連接到所述分類器的邏輯單元,所述邏輯單元用于基于所述分類來估計至少一個規(guī)則并且針對所述規(guī)則中的每一個來確定估計值;加法器,所述加法器用于將所述估計值相加以獲得和值;以及連接到所述加法器的比較器,所述比較器用于將所述和值與閾值相比較,并且當所述和值超過所述閾值時,輸出主揚聲器值的最大數(shù)目增加信號。
5.根據(jù)權(quán)利要求2、3或4所述的會議電話系統(tǒng),包括連接到所述輸入接口的減量估計單元,所述減量估計單元用于將所述主揚聲器流中的至少一個的至少一個參數(shù)與主揚聲器值的預(yù)定最大數(shù)目降低標準相比較;并且其中,所述第二邏輯單元連接到所述減量估計單元,并且被布置成當在操作中時,當所述參數(shù)滿足主揚聲器值的預(yù)定最大數(shù)目降低標準時,降低主揚聲器值的所述最大數(shù)目。
6.根據(jù)權(quán)利要求5所述的會議電話系統(tǒng),其中,所述減量估計單元包括連接到所述輸入接口的語音檢測器,所述語音檢測器用于檢測所述主揚聲器流中的語音;以及連接到所述輸入接口的響度比較器,所述響度比較器用于將所述主揚聲器流中的至少一個中的語音的強度與響度閾值相比較;并且其中所述第二邏輯單元被布置成當在所述主揚聲器流中的至少一個中未檢測到語音時,和/或當所述主揚聲器流中的至少一個被所述響度比較器確定所述強度在所述響度閾值之下時,降低主揚聲器值的所述最大數(shù)目。
7.一種會議呼叫方法,包括在會議電話期間接收音頻信號的至少兩個輸入流,所述輸入流中的每一個來自另一個信源;從所述輸入流中選擇多個主揚聲器流,所述主揚聲器流的數(shù)目小于或等于主揚聲器值的最大數(shù)目,并且所述主揚聲器流中的每一個表示來自相應(yīng)的主揚聲器的話音;將所選擇的流混合到輸出流中;輸出所述輸出流;以及在所述會議電話期間,基于所述會議電話的動態(tài)來動態(tài)地設(shè)置主揚聲器值的所述最大數(shù)目。
8.一種計算機程序產(chǎn)品,所述計算機程序產(chǎn)品包含可由可編程的裝置執(zhí)行的計算機程序,所述計算機程序具有當由所述可編程的裝置執(zhí)行時用于執(zhí)行前述權(quán)利要求的所述方法的代碼部分。
全文摘要
一種會議電話系統(tǒng),該會議電話系統(tǒng)包括用于在會議電話期間接收音頻信號的至少兩個輸入流的輸入接口,每個輸入流都來自另一信源。選擇單元被連接到該輸入接口,用于從輸入流中選擇多個主揚聲器流,該數(shù)目小于或等于主揚聲器值的最大數(shù)目,并且主揚聲器流中的每一個都表示來自相應(yīng)的主揚聲器的話音?;旌掀鞅贿B接到該選擇單元,用于將所選擇的流混合到輸出流中。該會議電話系統(tǒng)包括用于輸出該輸出流的輸出接口和連接到該選擇單元和輸入接口的選擇控制單元,用于在會議電話期間基于會議電話的動態(tài)來動態(tài)地設(shè)置主揚聲器值的最大數(shù)目。
文檔編號H04M3/51GK102598644SQ200980162321
公開日2012年7月18日 申請日期2009年11月6日 優(yōu)先權(quán)日2009年11月6日
發(fā)明者拉杜·D·普拉萊亞, 羅伯特·克魯奇 申請人:飛思卡爾半導體公司