一種語音文件查詢方法和裝置制造方法

文檔序號：6536198閱讀：229來源：國知局

一種語音文件查詢方法和裝置制造方法
【專利摘要】本發(fā)明提出一種語音文件查詢方法和裝置，其中方法包括：將每個目標語音文件分別轉(zhuǎn)換成對應的目標音節(jié)混淆網(wǎng)絡；將待查詢語音文件或待查詢文本轉(zhuǎn)換成對應的待查詢音節(jié)混淆網(wǎng)絡；計算所述待查詢音節(jié)混淆網(wǎng)絡與各個目標音節(jié)混淆網(wǎng)絡的相似度，獲取相似度最高的一個以上目標音節(jié)混淆網(wǎng)絡所對應的目標語音文件。本發(fā)明能夠提高語音查詢的精確度。
【專利說明】一種語音文件查詢方法和裝置

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及語音檢索【技術(shù)領(lǐng)域】，尤其涉及一種語音文件查詢方法和裝置。

【背景技術(shù)】
[0002] 現(xiàn)有技術(shù)中，通常的語音文件查詢方法有如下兩種：
[0003] 第一種：首先，使用自動語音轉(zhuǎn)寫技術(shù)將每一條目標語音文件分別轉(zhuǎn)換成對應的文字形式的目標文本文件，然后通過文本檢索技術(shù)建立目標文本文件的索引。
[0004] 在查詢過程中，輸入文字查詢詞，比較查詢詞與每個目標文本文件的相似度，并根據(jù)相似度對目標文本文件進行排序，從而查詢到與查詢詞最接近的目標文本文件，并最終得到與查詢詞最接近的目標語音文件?；蛘?，在查詢過程中，直接輸入待查詢語音文件，將待查詢語音文件轉(zhuǎn)換成對應的待查詢文本文件，然后比較相似度，得到與待查詢語音文件最接近的目標語音文件。
[0005] 第二種：首先，將每一條目標語音文件分別轉(zhuǎn)寫成音節(jié)/音素序列。
[0006] 在查詢過程中，將輸入的文字查詢詞或待查詢語音文件轉(zhuǎn)寫成音節(jié)/音素序列，通過比較音節(jié)/音素序列的相似度，得到與文字查詢詞或待查詢語音文件最接近的目標語音文件。
[0007] 上述兩種方法共同的缺點是：需要將目標語音文件、以及文字查詢詞或待查詢語音文件轉(zhuǎn)寫成文字或音節(jié)/音素形式，由于自然語音存在著口音多變、噪聲環(huán)境復雜等問題，語音轉(zhuǎn)寫的錯誤率很高，因此造成語音查詢的精確度不高。
【發(fā)明內(nèi)容】

[0008] 本發(fā)明提供了一種語音文件查詢方法，能夠提高語音查詢的精確度。
[0009] 本發(fā)明還提供了一種語音文件查詢裝置，能夠提高語音查詢的精確度。
[0010] 本發(fā)明的技術(shù)方案是這樣實現(xiàn)的：
[0011] 一種語音文件查詢方法，包括：
[0012] 將每個目標語音文件分別轉(zhuǎn)換成對應的目標音節(jié)混淆網(wǎng)絡；
[0013] 將待查詢語音文件或待查詢文本轉(zhuǎn)換成對應的待查詢音節(jié)混淆網(wǎng)絡；
[0014] 計算所述待查詢音節(jié)混淆網(wǎng)絡與各個目標音節(jié)混淆網(wǎng)絡的相似度，獲取相似度最高的一個以上目標音節(jié)混淆網(wǎng)絡所對應的目標語音文件。
[0015] 一種語音文件查詢裝置，包括：
[0016] 轉(zhuǎn)換模塊，用于將每個目標語音文件分別轉(zhuǎn)換成對應的目標音節(jié)混淆網(wǎng)絡；將待查詢語音文件或待查詢文本轉(zhuǎn)換成對應的待查詢音節(jié)混淆網(wǎng)絡；
[0017] 相似度計算模塊，用于計算所述待查詢音節(jié)混淆網(wǎng)絡與各個目標音節(jié)混淆網(wǎng)絡的相似度；
[0018] 獲取模塊，用于獲取相似度最高的一個以上目標音節(jié)混淆網(wǎng)絡所對應的目標語音文件。
[0019] 可見，本發(fā)明提出的語音文件查詢方法和裝置，通過將目標語音文件和待查詢語音文件/待查詢文本轉(zhuǎn)換成音節(jié)混淆網(wǎng)絡，并比較音節(jié)混淆網(wǎng)絡的相似度以實現(xiàn)語音文件查詢，避免了將語音轉(zhuǎn)寫成文字或音節(jié)/音素形式過程中出現(xiàn)的錯誤，能夠提高語音查詢的精確度。

【專利附圖】

【附圖說明】
[0020] 圖1為本發(fā)明提出的語音文件查詢方法實現(xiàn)流程圖；
[0021 ] 圖2為首節(jié)混渚網(wǎng)絡不意圖；
[0022] 圖3為實施例二的實現(xiàn)流程圖；
[0023] 圖4為實施例三中所應用的其中一個音節(jié)混淆網(wǎng)絡示意圖；
[0024] 圖5為實施例三中構(gòu)造成功的倒排索引示意圖；
[0025] 圖6為實施例五中所應用的查詢音節(jié)混淆網(wǎng)絡S的示意圖；
[0026] 圖7為本發(fā)明提出的語音文件查詢裝置結(jié)構(gòu)示意圖。

【具體實施方式】
[0027] 本發(fā)明提出一種語音文件查詢方法，如圖1為該方法實現(xiàn)流程圖，包括以下步驟：
[0028] 步驟101 :將每個目標語音文件分別轉(zhuǎn)換成對應的目標音節(jié)混淆網(wǎng)絡；
[0029] 步驟102 :將待查詢語音文件或待查詢文本轉(zhuǎn)換成對應的待查詢音節(jié)混淆網(wǎng)絡；
[0030] 步驟103 :計算所述待查詢音節(jié)混淆網(wǎng)絡與各個目標音節(jié)混淆網(wǎng)絡的相似度，獲取相似度最高的一個以上目標音節(jié)混淆網(wǎng)絡所對應的目標語音文件。
[0031] 上述方法中，將目標語音文件和待查詢語音文件/待查詢文本轉(zhuǎn)換成音節(jié)混淆網(wǎng) 絡，通過比較兩個音節(jié)混淆網(wǎng)絡的相似度，能夠查詢到包含待查詢語音文件/待查詢文本的目標語音文件。上述方法避免了將語音文件轉(zhuǎn)寫成文字或音節(jié)/音素形式，因此能夠避免因該轉(zhuǎn)換過程中出現(xiàn)錯誤而對語音查詢造成的不利影響。
[0032] 以下舉具體的實施例，分別介紹上述各個步驟的實現(xiàn)方式。
[0033] 實施例一：
[0034] 本實施例介紹將目標語音文件或待查詢語音文件轉(zhuǎn)換成音節(jié)混淆網(wǎng)絡的具體方式。
[0035] 首先介紹音節(jié)混淆網(wǎng)絡。音節(jié)混淆網(wǎng)絡是一種特殊的加權(quán)有向圖結(jié)構(gòu)，滿足如下條件：任意一條從初始節(jié)點到結(jié)束節(jié)點的路徑必須經(jīng)過所有的其他節(jié)點，圖2給出了一個音節(jié)混淆網(wǎng)絡的示例。把音節(jié)混淆網(wǎng)絡的節(jié)點按順序排成一個序列，邊僅存在于相鄰的兩個節(jié)點之間，邊上有音節(jié)標簽和權(quán)重。兩個相鄰節(jié)點之間可以存在若干條邊，所有邊上的權(quán) 重之和為1。
[0036] 從目標語音文件或待查詢語音文件轉(zhuǎn)換成到音節(jié)混淆網(wǎng)絡的方式可以包括兩個步驟：首先使用音節(jié)解碼器對目標語音文件或待查詢語音文件進行解碼，產(chǎn)生中間結(jié)果 Lattice ;然后用框架（Lattice)轉(zhuǎn)換工具生成音節(jié)混淆網(wǎng)絡。這兩個步驟可以使用現(xiàn)有的工具，在此不再贅述。
[0037] 實施例二：
[0038] 本實施例介紹將待查詢文本轉(zhuǎn)換成音節(jié)混淆網(wǎng)絡的具體方式。
[0039] 轉(zhuǎn)換過程大體分為兩個部分，首先將待查詢文本轉(zhuǎn)換成音節(jié)序列，然后根據(jù)音節(jié) 序列生成音節(jié)混淆網(wǎng)絡。
[0040] 參照圖3,具體轉(zhuǎn)換過程步驟舉例如下：
[0041] 步驟1 :輸入待查詢文本，例如"語音查詢"；
[0042] 步驟2:使用前向最大匹配分詞算法將待查詢文本劃分為η個詞語，記為A、 W2>……、Wn。在本例中，可以劃分為2個詞語，分別為"語音"和"查詢"。
[0043] 步驟3:針對Wi、W2、……、Wn中的每個詞，分別在標音詞表中查找對應的音節(jié)。
[0044] 步驟4 :將查找到的音節(jié)串聯(lián)起來，構(gòu)成音節(jié)序列，記為y2、......、ym。其中，m 為音節(jié)的個數(shù)，yi (i=l、2、......、m)為音節(jié)。在如圖3中顯示了生成的音節(jié)序列。
[0045] 步驟5 :構(gòu)造初始節(jié)點V。和結(jié)束節(jié)點Vm+2 ;并構(gòu)造（m+1)個中間節(jié)點，包括Vp 乂2、......、Vm+l。
[0046] 構(gòu)造 V。與％的之間的一條邊，將該邊的音節(jié)標簽設置為空標簽（！NULL)，將該邊的權(quán)重設置為1 ;構(gòu)造 vm+1與Vm+2的之間的一條邊，將該邊的音節(jié)標簽設置為！NULL，將該邊的權(quán)重設置為1 ;依次針對兩個相鄰的中間節(jié)點Vi與Vi+1 (i=l，2,……，m)構(gòu)造一條邊，將各條邊的音節(jié)標簽分別設置為yi、y2、……、y m，將每條邊的權(quán)重均設置為1。如圖3中顯示了轉(zhuǎn)換得到的音節(jié)混淆網(wǎng)絡。
[0047] 實施例三：
[0048] 在上述步驟101中，還可以進一步建立所有目標音節(jié)混淆網(wǎng)絡的索引；在上述步驟103中，可以查詢通過查詢該索引，確定包含待查詢音節(jié)混淆網(wǎng)絡中所有音節(jié)的目標音節(jié)混淆網(wǎng)絡，之后計算待查詢音節(jié)混淆網(wǎng)絡與確定出的各個目標音節(jié)混淆網(wǎng)絡的相似度。
[0049] 本實施例介紹建立索引的具體方式。
[0050] 目標音節(jié)混淆網(wǎng)絡的索引包括正排索引和倒排索引。
[0051] 其中，正排索引中存儲目標語音文件所對應的目標音節(jié)混淆網(wǎng)絡與音節(jié)混淆網(wǎng)絡標識的對應關(guān)系；
[0052] 倒排索引包括：目標音節(jié)混淆網(wǎng)絡中的各個音節(jié)所屬的目標音節(jié)混淆網(wǎng)絡的音節(jié) 混淆網(wǎng)絡標識、以及該音節(jié)所對應的邊的權(quán)重。倒排索引中的索引單元為音節(jié)，索引項中記錄音節(jié)所在的目標音節(jié)混淆網(wǎng)絡的標識、該音節(jié)所對應的邊的權(quán)重等信息。
[0053] 以下參照附圖4和附圖5介紹構(gòu)造索引的具體實現(xiàn)方式。如圖4為本實施例中所應用的其中一個音節(jié)混淆網(wǎng)絡，該音節(jié)混淆網(wǎng)絡的標識為source 1927。圖5為本實施例中構(gòu)造成功的倒排索引，圖5中針對每個音節(jié)有一條索引項列表，音節(jié)之后所連接的每一個框為該音節(jié)的一個索引項。
[0054] 構(gòu)造索引的具體步驟包括：
[0055] 步驟1 :輸入音節(jié)混淆網(wǎng)絡，每個音節(jié)混淆網(wǎng)絡對應一個標識sid。
[0056] 步驟2 :將音節(jié)混淆網(wǎng)絡及其對應的sid保存入正排索引。
[0057] 步驟3 :針對所有音節(jié)混淆網(wǎng)絡中的各個音節(jié)，分別建立對應的索引項列表，該索引向列表中包括該首節(jié)。
[0058] 步驟4:針對所有音節(jié)混淆網(wǎng)絡中的每一條邊，依次執(zhí)行以下步驟，直至所有邊被處理完畢。
[0059] 設邊上的音節(jié)標簽為lbl，權(quán)重為w，在倒排索引文件中查找lbl對應的索引項列表；構(gòu)造索引項，記錄該邊所在音節(jié)混淆網(wǎng)絡的標識sid、該邊的權(quán)重w和其他信息；將構(gòu)造好的索引項插入lbl對應的索引項列表中。
[0060] 實施例四：
[0061] 本實施例介紹使用音節(jié)混淆網(wǎng)絡進行檢索的具體方式。
[0062] 檢索目的：設待查詢語音文件或待查詢文本對應的待查詢音節(jié)混淆網(wǎng)絡為S，目標語音文件對應的目標音節(jié)混淆網(wǎng)絡為D。如果S中至少一條從初始節(jié)點到結(jié)束節(jié)點的路徑能夠在D中找到，則認為檢索成功。
[0063] 為了完成檢索，可以將待查詢音節(jié)混淆網(wǎng)絡為轉(zhuǎn)換為一張狀態(tài)轉(zhuǎn)移查詢表。例如，待查詢文本為"騰訊"時，其音節(jié)混淆網(wǎng)絡對應的狀態(tài)轉(zhuǎn)移查詢表如表1 :
[0064]

【權(quán)利要求】
1. 一種語音文件查詢方法，其特征在于，所述方法包括：將每個目標語音文件分別轉(zhuǎn)換成對應的目標音節(jié)混淆網(wǎng)絡；將待查詢語音文件或待查詢文本轉(zhuǎn)換成對應的待查詢音節(jié)混淆網(wǎng)絡；計算所述待查詢音節(jié)混淆網(wǎng)絡與各個目標音節(jié)混淆網(wǎng)絡的相似度，獲取相似度最高的一個以上目標音節(jié)混淆網(wǎng)絡所對應的目標語音文件。
2. 根據(jù)權(quán)利要求1所述的方法，其特征在于，所述將目標語音文件轉(zhuǎn)換成對應的目標音節(jié)混淆網(wǎng)絡、或者將待查詢語音文件轉(zhuǎn)換成對應的待查詢音節(jié)混淆網(wǎng)絡的方式為：利用音節(jié)解碼器對所述目標語音文件或待查詢語音文件進行解碼，得到中間結(jié)果；利用框架Lattice轉(zhuǎn)換工具對所述中間結(jié)果進行轉(zhuǎn)換，得到對應的音節(jié)混淆網(wǎng)絡。
3. 根據(jù)權(quán)利要求1所述的方法，其特征在于，所述將待查詢文本轉(zhuǎn)換成對應的待查詢音節(jié)混淆網(wǎng)絡的方式為：將所述待查詢文本劃分為多個詞；查找所述各個詞對應的音節(jié)；將查找到的音節(jié)串聯(lián)，得到音節(jié)序列yi、y2、……、ym，其中，m為音節(jié)的個數(shù)， yi (i=l、 2、……、m)為音節(jié)；構(gòu)造初始節(jié)點％和結(jié)束節(jié)點Vm+2 ;并構(gòu)造（m+1)個中間節(jié)點，包括Vp V2、……、Vm+1 ; 構(gòu)造 V。與Vi的之間的一條邊，將該邊的音節(jié)標簽設置為空標簽！NULL，將該邊的權(quán)重設置為1 ;構(gòu)造 Vm+1與Vm+2的之間的一條邊，將該邊的音節(jié)標簽設置為！NULL，將該邊的權(quán)重設置為1 ;依次針對兩個相鄰的中間節(jié)點\與Vi+1 (i=l，2,……，m)構(gòu)造一條邊，將各條邊的音節(jié)標簽分別設置為yi、y2、……、y m，將每條邊的權(quán)重均設置為1。
4. 根據(jù)權(quán)利要求1所述的方法，其特征在于，所述將每個目標語音文件分別轉(zhuǎn)換成對應的目標音節(jié)混淆網(wǎng)絡之后進一步包括，建立所有目標音節(jié)混淆網(wǎng)絡的索引，包括正排索引和倒排索引；所述正排索引包括各個目標音節(jié)混淆網(wǎng)絡與音節(jié)混淆網(wǎng)絡標識的對應關(guān)系；所述倒排索引包括：目標音節(jié)混淆網(wǎng)絡中的各個音節(jié)所屬的目標音節(jié)混淆網(wǎng)絡的音節(jié) 混淆網(wǎng)絡標識、以及該音節(jié)所對應的邊的權(quán)重。
5. 根據(jù)權(quán)利要求4所述的方法，其特征在于，所述計算待查詢音節(jié)混淆網(wǎng)絡與各個目標音節(jié)混淆網(wǎng)絡的相似度的方式為：查詢所述所有目標音節(jié)混淆網(wǎng)絡的索引，確定包含所述待查詢音節(jié)混淆網(wǎng)絡中所有音節(jié)的目標音節(jié)混淆網(wǎng)絡；根據(jù)待查詢音節(jié)混淆網(wǎng)絡生成對應的狀態(tài)轉(zhuǎn)移查詢表，采用所述狀態(tài)轉(zhuǎn)移查詢表計算待查詢音節(jié)混淆網(wǎng)絡與所述確定出的各個目標音節(jié)混淆網(wǎng)絡的相似度。
6. 根據(jù)權(quán)利要求5所述的方法，其特征在于，所述采用狀態(tài)轉(zhuǎn)移查詢表計算相似度的具體方式為：針對該目標音節(jié)混淆網(wǎng)絡的每個節(jié)點構(gòu)造一個令牌，將該令牌的狀態(tài)Status設置為所述狀態(tài)轉(zhuǎn)移查詢表的初始狀態(tài)，將該令牌的觀測設置為！NULL，將該令牌的權(quán)重設置為 1，將該令牌的得分Score設置為0 ;針對各個令牌分別執(zhí)行以下步驟A，得到最終存活令牌列表，并對最終存活令牌列表中所有令牌的得分求和，將求和結(jié)果作為待查詢音節(jié)混淆網(wǎng) 絡與該目標音節(jié)混淆網(wǎng)絡的相似度； A、判斷所述當前令牌的觀測是否為！ NULL，如果是，則執(zhí)行步驟B ;否則執(zhí)行步驟C ; B、在所述狀態(tài)轉(zhuǎn)移查詢表中查詢行取Status、并且列取！NULL時對應的表格，設表格中的狀態(tài)為Status'，如果Status'為狀態(tài)轉(zhuǎn)移表的終止狀態(tài)，將當前令牌加入最終存活令牌列表，結(jié)束當前步驟；否則，刪除當前令牌，在所述狀態(tài)轉(zhuǎn)移表中查詢行取Status'的非空表格.. Ck，在當前位置構(gòu)造 k個新的令牌，每個新的令牌的狀態(tài)為Status'，觀測為表格對應的列上的音節(jié)標簽，權(quán)重為表格中的權(quán)重，得分為當前令牌的得分，針對所述新的令牌繼續(xù)執(zhí)行步驟A ; C、設所述令牌的觀測為obsr，遍歷所述目標音節(jié)混淆網(wǎng)絡中以該令牌所在節(jié)點為出發(fā) 點的各條邊，如果所述各條邊的音節(jié)標簽均不為obsr，則刪除該令牌；如果有一條邊上的音節(jié)標簽為obsr，則執(zhí)行如下步驟：在所述狀態(tài)轉(zhuǎn)移查詢表中，查詢行取Status、并且列取 obsr時對應的表格，設該表格對應的狀態(tài)為Status'，如果Status'為狀態(tài)轉(zhuǎn)移表的終止狀態(tài)，將當前令牌加入最終存活令牌列表，結(jié)束當前步驟；否則，刪除當前令牌，在所述狀態(tài) 轉(zhuǎn)移查詢表中查詢行取Status'的非空表格.. Ck，在該邊的結(jié)束節(jié)點上構(gòu)造 k個新的令牌，每個令牌的狀態(tài)為Status'，觀測為表格對應的列上的音節(jié)標簽，權(quán)重為表格中的權(quán)重，得分Score更新為原Score與當前令牌權(quán)重與該邊的權(quán)重的乘積之和，針對所述新的令牌繼續(xù)執(zhí)行步驟A。
7. -種語音文件查詢裝置，其特征在于，所述裝置包括：轉(zhuǎn)換模塊，用于將每個目標語音文件分別轉(zhuǎn)換成對應的目標音節(jié)混淆網(wǎng)絡；將待查詢語音文件或待查詢文本轉(zhuǎn)換成對應的待查詢音節(jié)混淆網(wǎng)絡；相似度計算模塊，用于計算所述待查詢音節(jié)混淆網(wǎng)絡與各個目標音節(jié)混淆網(wǎng)絡的相似度；獲取模塊，用于獲取相似度最高的一個以上目標音節(jié)混淆網(wǎng)絡所對應的目標語音文件。
8. 根據(jù)權(quán)利要求7所述的裝置，其特征在于，所述轉(zhuǎn)換模塊將目標語音文件轉(zhuǎn)換成對應的目標音節(jié)混淆網(wǎng)絡、或者將待查詢語音文件轉(zhuǎn)換成對應的待查詢音節(jié)混淆網(wǎng)絡的方式為：利用音節(jié)解碼器對所述目標語音文件或待查詢語音文件進行解碼，得到中間結(jié)果；利用框架Lattice轉(zhuǎn)換工具對所述中間結(jié)果進行轉(zhuǎn)換，得到對應的音節(jié)混淆網(wǎng)絡。
9. 根據(jù)權(quán)利要求7所述的裝置，其特征在于，所述轉(zhuǎn)換模塊將待查詢文本轉(zhuǎn)換成對應的待查詢音節(jié)混淆網(wǎng)絡的方式為：將所述待查詢文本劃分為多個詞；查找所述各個詞對應的音節(jié)；將查找到的音節(jié)串聯(lián)，得到音節(jié)序列yi、y2、……、ym，其中，m為音節(jié)的個數(shù)， yi (i=l、 2、……、m)為音節(jié)；構(gòu)造初始節(jié)點％和結(jié)束節(jié)點Vm+2 ;并構(gòu)造（m+1)個中間節(jié)點，包括Vp V2、……、Vm+1 ; 構(gòu)造 V。與Vi的之間的一條邊，將該邊的音節(jié)標簽設置為空標簽！NULL，將該邊的權(quán)重設置為1 ;構(gòu)造 Vm+1與Vm+2的之間的一條邊，將該邊的音節(jié)標簽設置為！NULL，將該邊的權(quán)重設置為1 ;依次針對兩個相鄰的中間節(jié)點\與Vi+1 (i=l，2,……，m)構(gòu)造一條邊，將各條邊的音節(jié)標簽分別設置為yi、y2、……、y m，將每條邊的權(quán)重均設置為1。
10. 根據(jù)權(quán)利要求7所述的裝置，其特征在于，所述轉(zhuǎn)換模塊還用于，建立所有目標音節(jié)混淆網(wǎng)絡的索引，包括正排索引和倒排索引；所述正排索引包括各個目標音節(jié)混淆網(wǎng)絡與音節(jié)混淆網(wǎng)絡標識的對應關(guān)系；所述倒排索引包括：目標音節(jié)混淆網(wǎng)絡中的各個音節(jié)所屬的目標音節(jié)混淆網(wǎng)絡的音節(jié) 混淆網(wǎng)絡標識、以及該音節(jié)所對應的邊的權(quán)重。
11. 根據(jù)權(quán)利要求10所述的裝置，其特征在于，所述相似度計算模塊計算待查詢音節(jié) 混淆網(wǎng)絡與各個目標音節(jié)混淆網(wǎng)絡的相似度的方式為：查詢所述所有目標音節(jié)混淆網(wǎng)絡的索引，確定包含所述待查詢音節(jié)混淆網(wǎng)絡中所有音節(jié)的目標音節(jié)混淆網(wǎng)絡；根據(jù)待查詢音節(jié)混淆網(wǎng)絡生成對應的狀態(tài)轉(zhuǎn)移查詢表，采用所述狀態(tài)轉(zhuǎn)移查詢表計算待查詢音節(jié)混淆網(wǎng)絡與所述確定出的各個目標音節(jié)混淆網(wǎng)絡的相似度。
12. 根據(jù)權(quán)利要求11所述的裝置，其特征在于，所述相似度計算模塊采用狀態(tài)轉(zhuǎn)移查詢表計算相似度的具體方式為：針對該目標音節(jié)混淆網(wǎng)絡的每個節(jié)點構(gòu)造一個令牌，將該令牌的狀態(tài)Status設置為所述狀態(tài)轉(zhuǎn)移查詢表的初始狀態(tài)，將該令牌的觀測設置為！NULL，將該令牌的權(quán)重設置為 1，將該令牌的得分Score設置為0 ;針對各個令牌分別執(zhí)行以下步驟A，得到最終存活令牌列表，并對最終存活令牌列表中所有令牌的得分求和，將求和結(jié)果作為待查詢音節(jié)混淆網(wǎng) 絡與該目標音節(jié)混淆網(wǎng)絡的相似度； A、判斷所述當前令牌的觀測是否為！ NULL，如果是，則執(zhí)行步驟B ;否則執(zhí)行步驟C ; B、在所述狀態(tài)轉(zhuǎn)移查詢表中查詢行取Status、并且列??！NULL時對應的表格，設表格中的狀態(tài)為Status'，如果Status'為狀態(tài)轉(zhuǎn)移表的終止狀態(tài)，將當前令牌加入最終存活令牌列表，結(jié)束當前步驟；否則，刪除當前令牌，在所述狀態(tài)轉(zhuǎn)移表中查詢行取Status'的非空表格.. Ck，在當前位置構(gòu)造 k個新的令牌，每個新的令牌的狀態(tài)為Status'，觀測為表格對應的列上的音節(jié)標簽，權(quán)重為表格中的權(quán)重，得分為當前令牌的得分，針對所述新的令牌繼續(xù)執(zhí)行步驟A ; C、設所述令牌的觀測為obsr，遍歷所述目標音節(jié)混淆網(wǎng)絡中以該令牌所在節(jié)點為出發(fā) 點的各條邊，如果所述各條邊的音節(jié)標簽均不為obsr，則刪除該令牌；如果有一條邊上的音節(jié)標簽為obsr，則執(zhí)行如下步驟：在所述狀態(tài)轉(zhuǎn)移查詢表中，查詢行取Status、并且列取 obsr時對應的表格，設該表格對應的狀態(tài)為Status'，如果Status'為狀態(tài)轉(zhuǎn)移表的終止狀態(tài)，將當前令牌加入最終存活令牌列表，結(jié)束當前步驟；否則，刪除當前令牌，在所述狀態(tài) 轉(zhuǎn)移查詢表中查詢行取Status'的非空表格.. Ck，在該邊的結(jié)束節(jié)點上構(gòu)造 k個新的令牌，每個令牌的狀態(tài)為Status'，觀測為表格對應的列上的音節(jié)標簽，權(quán)重為表格中的權(quán)重，得分Score更新為原Score與當前令牌權(quán)重與該邊的權(quán)重的乘積之和，針對所述新的令牌繼續(xù)執(zhí)行步驟A。
【文檔編號】G06F17/30GK104142974SQ201410024095
【公開日】2014年11月12日申請日期:2014年1月20日優(yōu)先權(quán)日:2014年1月20日
【發(fā)明者】李露, 馬建雄, 盧鯉申請人:騰訊科技（深圳）有限公司

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：李露;馬建雄;盧鯉
技術(shù)所有人：騰訊科技（深圳）有限公司
我是此專利的發(fā)明人

上一篇：一種基于tv范數(shù)的pet圖像重建方法
上一篇：電子價簽主機、電子價簽從機及超市用電子價簽系統(tǒng)的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構(gòu)動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

語音報警裝置相關(guān)技術(shù)

電梯語音報站裝置相關(guān)技術(shù)

防雷裝置檢測招標文件相關(guān)技術(shù)

防雷裝置檢測程序文件相關(guān)技術(shù)

微信語音文件相關(guān)技術(shù)

語音文件轉(zhuǎn)換成文字相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種語音文件查詢方法和裝置制造方法