欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種語音文件查詢方法和裝置制造方法

文檔序號:6536198閱讀:229來源:國知局
一種語音文件查詢方法和裝置制造方法
【專利摘要】本發(fā)明提出一種語音文件查詢方法和裝置,其中方法包括:將每個目標語音文件分別轉(zhuǎn)換成對應的目標音節(jié)混淆網(wǎng)絡;將待查詢語音文件或待查詢文本轉(zhuǎn)換成對應的待查詢音節(jié)混淆網(wǎng)絡;計算所述待查詢音節(jié)混淆網(wǎng)絡與各個目標音節(jié)混淆網(wǎng)絡的相似度,獲取相似度最高的一個以上目標音節(jié)混淆網(wǎng)絡所對應的目標語音文件。本發(fā)明能夠提高語音查詢的精確度。
【專利說明】一種語音文件查詢方法和裝置

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及語音檢索【技術(shù)領(lǐng)域】,尤其涉及一種語音文件查詢方法和裝置。

【背景技術(shù)】
[0002] 現(xiàn)有技術(shù)中,通常的語音文件查詢方法有如下兩種:
[0003] 第一種:首先,使用自動語音轉(zhuǎn)寫技術(shù)將每一條目標語音文件分別轉(zhuǎn)換成對應的 文字形式的目標文本文件,然后通過文本檢索技術(shù)建立目標文本文件的索引。
[0004] 在查詢過程中,輸入文字查詢詞,比較查詢詞與每個目標文本文件的相似度,并根 據(jù)相似度對目標文本文件進行排序,從而查詢到與查詢詞最接近的目標文本文件,并最終 得到與查詢詞最接近的目標語音文件?;蛘?,在查詢過程中,直接輸入待查詢語音文件,將 待查詢語音文件轉(zhuǎn)換成對應的待查詢文本文件,然后比較相似度,得到與待查詢語音文件 最接近的目標語音文件。
[0005] 第二種:首先,將每一條目標語音文件分別轉(zhuǎn)寫成音節(jié)/音素序列。
[0006] 在查詢過程中,將輸入的文字查詢詞或待查詢語音文件轉(zhuǎn)寫成音節(jié)/音素序列, 通過比較音節(jié)/音素序列的相似度,得到與文字查詢詞或待查詢語音文件最接近的目標語 音文件。
[0007] 上述兩種方法共同的缺點是:需要將目標語音文件、以及文字查詢詞或待查詢語 音文件轉(zhuǎn)寫成文字或音節(jié)/音素形式,由于自然語音存在著口音多變、噪聲環(huán)境復雜等問 題,語音轉(zhuǎn)寫的錯誤率很高,因此造成語音查詢的精確度不高。
【發(fā)明內(nèi)容】

[0008] 本發(fā)明提供了一種語音文件查詢方法,能夠提高語音查詢的精確度。
[0009] 本發(fā)明還提供了一種語音文件查詢裝置,能夠提高語音查詢的精確度。
[0010] 本發(fā)明的技術(shù)方案是這樣實現(xiàn)的:
[0011] 一種語音文件查詢方法,包括:
[0012] 將每個目標語音文件分別轉(zhuǎn)換成對應的目標音節(jié)混淆網(wǎng)絡;
[0013] 將待查詢語音文件或待查詢文本轉(zhuǎn)換成對應的待查詢音節(jié)混淆網(wǎng)絡;
[0014] 計算所述待查詢音節(jié)混淆網(wǎng)絡與各個目標音節(jié)混淆網(wǎng)絡的相似度,獲取相似度最 高的一個以上目標音節(jié)混淆網(wǎng)絡所對應的目標語音文件。
[0015] 一種語音文件查詢裝置,包括:
[0016] 轉(zhuǎn)換模塊,用于將每個目標語音文件分別轉(zhuǎn)換成對應的目標音節(jié)混淆網(wǎng)絡;將待 查詢語音文件或待查詢文本轉(zhuǎn)換成對應的待查詢音節(jié)混淆網(wǎng)絡;
[0017] 相似度計算模塊,用于計算所述待查詢音節(jié)混淆網(wǎng)絡與各個目標音節(jié)混淆網(wǎng)絡的 相似度;
[0018] 獲取模塊,用于獲取相似度最高的一個以上目標音節(jié)混淆網(wǎng)絡所對應的目標語音 文件。
[0019] 可見,本發(fā)明提出的語音文件查詢方法和裝置,通過將目標語音文件和待查詢語 音文件/待查詢文本轉(zhuǎn)換成音節(jié)混淆網(wǎng)絡,并比較音節(jié)混淆網(wǎng)絡的相似度以實現(xiàn)語音文件 查詢,避免了將語音轉(zhuǎn)寫成文字或音節(jié)/音素形式過程中出現(xiàn)的錯誤,能夠提高語音查詢 的精確度。

【專利附圖】

【附圖說明】
[0020] 圖1為本發(fā)明提出的語音文件查詢方法實現(xiàn)流程圖;
[0021 ] 圖2為首節(jié)混渚網(wǎng)絡不意圖;
[0022] 圖3為實施例二的實現(xiàn)流程圖;
[0023] 圖4為實施例三中所應用的其中一個音節(jié)混淆網(wǎng)絡示意圖;
[0024] 圖5為實施例三中構(gòu)造成功的倒排索引示意圖;
[0025] 圖6為實施例五中所應用的查詢音節(jié)混淆網(wǎng)絡S的示意圖;
[0026] 圖7為本發(fā)明提出的語音文件查詢裝置結(jié)構(gòu)示意圖。

【具體實施方式】
[0027] 本發(fā)明提出一種語音文件查詢方法,如圖1為該方法實現(xiàn)流程圖,包括以下步驟:
[0028] 步驟101 :將每個目標語音文件分別轉(zhuǎn)換成對應的目標音節(jié)混淆網(wǎng)絡;
[0029] 步驟102 :將待查詢語音文件或待查詢文本轉(zhuǎn)換成對應的待查詢音節(jié)混淆網(wǎng)絡;
[0030] 步驟103 :計算所述待查詢音節(jié)混淆網(wǎng)絡與各個目標音節(jié)混淆網(wǎng)絡的相似度,獲 取相似度最高的一個以上目標音節(jié)混淆網(wǎng)絡所對應的目標語音文件。
[0031] 上述方法中,將目標語音文件和待查詢語音文件/待查詢文本轉(zhuǎn)換成音節(jié)混淆網(wǎng) 絡,通過比較兩個音節(jié)混淆網(wǎng)絡的相似度,能夠查詢到包含待查詢語音文件/待查詢文本 的目標語音文件。上述方法避免了將語音文件轉(zhuǎn)寫成文字或音節(jié)/音素形式,因此能夠避 免因該轉(zhuǎn)換過程中出現(xiàn)錯誤而對語音查詢造成的不利影響。
[0032] 以下舉具體的實施例,分別介紹上述各個步驟的實現(xiàn)方式。
[0033] 實施例一:
[0034] 本實施例介紹將目標語音文件或待查詢語音文件轉(zhuǎn)換成音節(jié)混淆網(wǎng)絡的具體方 式。
[0035] 首先介紹音節(jié)混淆網(wǎng)絡。音節(jié)混淆網(wǎng)絡是一種特殊的加權(quán)有向圖結(jié)構(gòu),滿足如下 條件:任意一條從初始節(jié)點到結(jié)束節(jié)點的路徑必須經(jīng)過所有的其他節(jié)點,圖2給出了一個 音節(jié)混淆網(wǎng)絡的示例。把音節(jié)混淆網(wǎng)絡的節(jié)點按順序排成一個序列,邊僅存在于相鄰的兩 個節(jié)點之間,邊上有音節(jié)標簽和權(quán)重。兩個相鄰節(jié)點之間可以存在若干條邊,所有邊上的權(quán) 重之和為1。
[0036] 從目標語音文件或待查詢語音文件轉(zhuǎn)換成到音節(jié)混淆網(wǎng)絡的方式可以包括兩個 步驟:首先使用音節(jié)解碼器對目標語音文件或待查詢語音文件進行解碼,產(chǎn)生中間結(jié)果 Lattice ;然后用框架(Lattice)轉(zhuǎn)換工具生成音節(jié)混淆網(wǎng)絡。這兩個步驟可以使用現(xiàn)有的 工具,在此不再贅述。
[0037] 實施例二:
[0038] 本實施例介紹將待查詢文本轉(zhuǎn)換成音節(jié)混淆網(wǎng)絡的具體方式。
[0039] 轉(zhuǎn)換過程大體分為兩個部分,首先將待查詢文本轉(zhuǎn)換成音節(jié)序列,然后根據(jù)音節(jié) 序列生成音節(jié)混淆網(wǎng)絡。
[0040] 參照圖3,具體轉(zhuǎn)換過程步驟舉例如下:
[0041] 步驟1 :輸入待查詢文本,例如"語音查詢";
[0042] 步驟2:使用前向最大匹配分詞算法將待查詢文本劃分為η個詞語,記為A、 W2>……、Wn。在本例中,可以劃分為2個詞語,分別為"語音"和"查詢"。
[0043] 步驟3:針對Wi、W2、……、Wn中的每個詞,分別在標音詞表中查找對應的音節(jié)。
[0044] 步驟4 :將查找到的音節(jié)串聯(lián)起來,構(gòu)成音節(jié)序列,記為y2、......、ym。其中,m 為音節(jié)的個數(shù),yi (i=l、2、......、m)為音節(jié)。在如圖3中顯示了生成的音節(jié)序列。
[0045] 步驟5 :構(gòu)造初始節(jié)點V。和結(jié)束節(jié)點Vm+2 ;并構(gòu)造(m+1)個中間節(jié)點,包括Vp 乂2、......、Vm+l。
[0046] 構(gòu)造 V。與%的之間的一條邊,將該邊的音節(jié)標簽設置為空標簽(!NULL),將該邊的 權(quán)重設置為1 ;構(gòu)造 vm+1與Vm+2的之間的一條邊,將該邊的音節(jié)標簽設置為!NULL,將該邊的 權(quán)重設置為1 ;依次針對兩個相鄰的中間節(jié)點Vi與Vi+1 (i=l,2,……,m)構(gòu)造一條邊,將各 條邊的音節(jié)標簽分別設置為yi、y2、……、y m,將每條邊的權(quán)重均設置為1。如圖3中顯示了 轉(zhuǎn)換得到的音節(jié)混淆網(wǎng)絡。
[0047] 實施例三:
[0048] 在上述步驟101中,還可以進一步建立所有目標音節(jié)混淆網(wǎng)絡的索引;在上述步 驟103中,可以查詢通過查詢該索引,確定包含待查詢音節(jié)混淆網(wǎng)絡中所有音節(jié)的目標音 節(jié)混淆網(wǎng)絡,之后計算待查詢音節(jié)混淆網(wǎng)絡與確定出的各個目標音節(jié)混淆網(wǎng)絡的相似度。
[0049] 本實施例介紹建立索引的具體方式。
[0050] 目標音節(jié)混淆網(wǎng)絡的索引包括正排索引和倒排索引。
[0051] 其中,正排索引中存儲目標語音文件所對應的目標音節(jié)混淆網(wǎng)絡與音節(jié)混淆網(wǎng)絡 標識的對應關(guān)系;
[0052] 倒排索引包括:目標音節(jié)混淆網(wǎng)絡中的各個音節(jié)所屬的目標音節(jié)混淆網(wǎng)絡的音節(jié) 混淆網(wǎng)絡標識、以及該音節(jié)所對應的邊的權(quán)重。倒排索引中的索引單元為音節(jié),索引項中記 錄音節(jié)所在的目標音節(jié)混淆網(wǎng)絡的標識、該音節(jié)所對應的邊的權(quán)重等信息。
[0053] 以下參照附圖4和附圖5介紹構(gòu)造索引的具體實現(xiàn)方式。如圖4為本實施例中所 應用的其中一個音節(jié)混淆網(wǎng)絡,該音節(jié)混淆網(wǎng)絡的標識為source 1927。圖5為本實施例中 構(gòu)造成功的倒排索引,圖5中針對每個音節(jié)有一條索引項列表,音節(jié)之后所連接的每一個 框為該音節(jié)的一個索引項。
[0054] 構(gòu)造索引的具體步驟包括:
[0055] 步驟1 :輸入音節(jié)混淆網(wǎng)絡,每個音節(jié)混淆網(wǎng)絡對應一個標識sid。
[0056] 步驟2 :將音節(jié)混淆網(wǎng)絡及其對應的sid保存入正排索引。
[0057] 步驟3 :針對所有音節(jié)混淆網(wǎng)絡中的各個音節(jié),分別建立對應的索引項列表,該索 引向列表中包括該首節(jié)。
[0058] 步驟4:針對所有音節(jié)混淆網(wǎng)絡中的每一條邊,依次執(zhí)行以下步驟,直至所有邊被 處理完畢。
[0059] 設邊上的音節(jié)標簽為lbl,權(quán)重為w,在倒排索引文件中查找lbl對應的索引項列 表;構(gòu)造索引項,記錄該邊所在音節(jié)混淆網(wǎng)絡的標識sid、該邊的權(quán)重w和其他信息;將構(gòu)造 好的索引項插入lbl對應的索引項列表中。
[0060] 實施例四:
[0061] 本實施例介紹使用音節(jié)混淆網(wǎng)絡進行檢索的具體方式。
[0062] 檢索目的:設待查詢語音文件或待查詢文本對應的待查詢音節(jié)混淆網(wǎng)絡為S,目 標語音文件對應的目標音節(jié)混淆網(wǎng)絡為D。如果S中至少一條從初始節(jié)點到結(jié)束節(jié)點的路 徑能夠在D中找到,則認為檢索成功。
[0063] 為了完成檢索,可以將待查詢音節(jié)混淆網(wǎng)絡為轉(zhuǎn)換為一張狀態(tài)轉(zhuǎn)移查詢表。例如, 待查詢文本為"騰訊"時,其音節(jié)混淆網(wǎng)絡對應的狀態(tài)轉(zhuǎn)移查詢表如表1 :
[0064]

【權(quán)利要求】
1. 一種語音文件查詢方法,其特征在于,所述方法包括: 將每個目標語音文件分別轉(zhuǎn)換成對應的目標音節(jié)混淆網(wǎng)絡; 將待查詢語音文件或待查詢文本轉(zhuǎn)換成對應的待查詢音節(jié)混淆網(wǎng)絡; 計算所述待查詢音節(jié)混淆網(wǎng)絡與各個目標音節(jié)混淆網(wǎng)絡的相似度,獲取相似度最高的 一個以上目標音節(jié)混淆網(wǎng)絡所對應的目標語音文件。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將目標語音文件轉(zhuǎn)換成對應的目標 音節(jié)混淆網(wǎng)絡、或者將待查詢語音文件轉(zhuǎn)換成對應的待查詢音節(jié)混淆網(wǎng)絡的方式為 : 利用音節(jié)解碼器對所述目標語音文件或待查詢語音文件進行解碼,得到中間結(jié)果;利 用框架Lattice轉(zhuǎn)換工具對所述中間結(jié)果進行轉(zhuǎn)換,得到對應的音節(jié)混淆網(wǎng)絡。
3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將待查詢文本轉(zhuǎn)換成對應的待查詢 音節(jié)混淆網(wǎng)絡的方式為: 將所述待查詢文本劃分為多個詞; 查找所述各個詞對應的音節(jié); 將查找到的音節(jié)串聯(lián),得到音節(jié)序列yi、y2、……、ym,其中,m為音節(jié)的個數(shù), yi (i=l、 2、……、m)為音節(jié); 構(gòu)造初始節(jié)點%和結(jié)束節(jié)點Vm+2 ;并構(gòu)造(m+1)個中間節(jié)點,包括Vp V2、……、Vm+1 ; 構(gòu)造 V。與Vi的之間的一條邊,將該邊的音節(jié)標簽設置為空標簽!NULL,將該邊的權(quán)重 設置為1 ;構(gòu)造 Vm+1與Vm+2的之間的一條邊,將該邊的音節(jié)標簽設置為!NULL,將該邊的權(quán)重 設置為1 ;依次針對兩個相鄰的中間節(jié)點\與Vi+1 (i=l,2,……,m)構(gòu)造一條邊,將各條邊 的音節(jié)標簽分別設置為yi、y2、……、y m,將每條邊的權(quán)重均設置為1。
4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將每個目標語音文件分別轉(zhuǎn)換成對 應的目標音節(jié)混淆網(wǎng)絡之后進一步包括,建立所有目標音節(jié)混淆網(wǎng)絡的索引,包括正排索 引和倒排索引; 所述正排索引包括各個目標音節(jié)混淆網(wǎng)絡與音節(jié)混淆網(wǎng)絡標識的對應關(guān)系; 所述倒排索引包括:目標音節(jié)混淆網(wǎng)絡中的各個音節(jié)所屬的目標音節(jié)混淆網(wǎng)絡的音節(jié) 混淆網(wǎng)絡標識、以及該音節(jié)所對應的邊的權(quán)重。
5. 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述計算待查詢音節(jié)混淆網(wǎng)絡與各個目 標音節(jié)混淆網(wǎng)絡的相似度的方式為: 查詢所述所有目標音節(jié)混淆網(wǎng)絡的索引,確定包含所述待查詢音節(jié)混淆網(wǎng)絡中所有音 節(jié)的目標音節(jié)混淆網(wǎng)絡;根據(jù)待查詢音節(jié)混淆網(wǎng)絡生成對應的狀態(tài)轉(zhuǎn)移查詢表,采用所述 狀態(tài)轉(zhuǎn)移查詢表計算待查詢音節(jié)混淆網(wǎng)絡與所述確定出的各個目標音節(jié)混淆網(wǎng)絡的相似 度。
6. 根據(jù)權(quán)利要求5所述的方法,其特征在于,所述采用狀態(tài)轉(zhuǎn)移查詢表計算相似度的 具體方式為: 針對該目標音節(jié)混淆網(wǎng)絡的每個節(jié)點構(gòu)造一個令牌,將該令牌的狀態(tài)Status設置為 所述狀態(tài)轉(zhuǎn)移查詢表的初始狀態(tài),將該令牌的觀測設置為!NULL,將該令牌的權(quán)重設置為 1,將該令牌的得分Score設置為0 ;針對各個令牌分別執(zhí)行以下步驟A,得到最終存活令牌 列表,并對最終存活令牌列表中所有令牌的得分求和,將求和結(jié)果作為待查詢音節(jié)混淆網(wǎng) 絡與該目標音節(jié)混淆網(wǎng)絡的相似度; A、 判斷所述當前令牌的觀測是否為! NULL,如果是,則執(zhí)行步驟B ;否則執(zhí)行步驟C ; B、 在所述狀態(tài)轉(zhuǎn)移查詢表中查詢行取Status、并且列取!NULL時對應的表格,設表格 中的狀態(tài)為Status',如果Status'為狀態(tài)轉(zhuǎn)移表的終止狀態(tài),將當前令牌加入最終存活令 牌列表,結(jié)束當前步驟;否則,刪除當前令牌,在所述狀態(tài)轉(zhuǎn)移表中查詢行取Status'的非 空表格.. Ck,在當前位置構(gòu)造 k個新的令牌,每個新的令牌的狀態(tài)為Status',觀測為表 格對應的列上的音節(jié)標簽,權(quán)重為表格中的權(quán)重,得分為當前令牌的得分,針對所述新的令 牌繼續(xù)執(zhí)行步驟A ; C、 設所述令牌的觀測為obsr,遍歷所述目標音節(jié)混淆網(wǎng)絡中以該令牌所在節(jié)點為出發(fā) 點的各條邊,如果所述各條邊的音節(jié)標簽均不為obsr,則刪除該令牌;如果有一條邊上的 音節(jié)標簽為obsr,則執(zhí)行如下步驟:在所述狀態(tài)轉(zhuǎn)移查詢表中,查詢行取Status、并且列取 obsr時對應的表格,設該表格對應的狀態(tài)為Status',如果Status'為狀態(tài)轉(zhuǎn)移表的終止 狀態(tài),將當前令牌加入最終存活令牌列表,結(jié)束當前步驟;否則,刪除當前令牌,在所述狀態(tài) 轉(zhuǎn)移查詢表中查詢行取Status'的非空表格.. Ck,在該邊的結(jié)束節(jié)點上構(gòu)造 k個新的令 牌,每個令牌的狀態(tài)為Status',觀測為表格對應的列上的音節(jié)標簽,權(quán)重為表格中的權(quán)重, 得分Score更新為原Score與當前令牌權(quán)重與該邊的權(quán)重的乘積之和,針對所述新的令牌 繼續(xù)執(zhí)行步驟A。
7. -種語音文件查詢裝置,其特征在于,所述裝置包括: 轉(zhuǎn)換模塊,用于將每個目標語音文件分別轉(zhuǎn)換成對應的目標音節(jié)混淆網(wǎng)絡;將待查詢 語音文件或待查詢文本轉(zhuǎn)換成對應的待查詢音節(jié)混淆網(wǎng)絡; 相似度計算模塊,用于計算所述待查詢音節(jié)混淆網(wǎng)絡與各個目標音節(jié)混淆網(wǎng)絡的相似 度; 獲取模塊,用于獲取相似度最高的一個以上目標音節(jié)混淆網(wǎng)絡所對應的目標語音文 件。
8. 根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述轉(zhuǎn)換模塊將目標語音文件轉(zhuǎn)換成對 應的目標音節(jié)混淆網(wǎng)絡、或者將待查詢語音文件轉(zhuǎn)換成對應的待查詢音節(jié)混淆網(wǎng)絡的方式 為: 利用音節(jié)解碼器對所述目標語音文件或待查詢語音文件進行解碼,得到中間結(jié)果;利 用框架Lattice轉(zhuǎn)換工具對所述中間結(jié)果進行轉(zhuǎn)換,得到對應的音節(jié)混淆網(wǎng)絡。
9. 根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述轉(zhuǎn)換模塊將待查詢文本轉(zhuǎn)換成對應 的待查詢音節(jié)混淆網(wǎng)絡的方式為: 將所述待查詢文本劃分為多個詞; 查找所述各個詞對應的音節(jié); 將查找到的音節(jié)串聯(lián),得到音節(jié)序列yi、y2、……、ym,其中,m為音節(jié)的個數(shù), yi (i=l、 2、……、m)為音節(jié); 構(gòu)造初始節(jié)點%和結(jié)束節(jié)點Vm+2 ;并構(gòu)造(m+1)個中間節(jié)點,包括Vp V2、……、Vm+1 ; 構(gòu)造 V。與Vi的之間的一條邊,將該邊的音節(jié)標簽設置為空標簽!NULL,將該邊的權(quán)重 設置為1 ;構(gòu)造 Vm+1與Vm+2的之間的一條邊,將該邊的音節(jié)標簽設置為!NULL,將該邊的權(quán)重 設置為1 ;依次針對兩個相鄰的中間節(jié)點\與Vi+1 (i=l,2,……,m)構(gòu)造一條邊,將各條邊 的音節(jié)標簽分別設置為yi、y2、……、y m,將每條邊的權(quán)重均設置為1。
10. 根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述轉(zhuǎn)換模塊還用于,建立所有目標音 節(jié)混淆網(wǎng)絡的索引,包括正排索引和倒排索引; 所述正排索引包括各個目標音節(jié)混淆網(wǎng)絡與音節(jié)混淆網(wǎng)絡標識的對應關(guān)系; 所述倒排索引包括:目標音節(jié)混淆網(wǎng)絡中的各個音節(jié)所屬的目標音節(jié)混淆網(wǎng)絡的音節(jié) 混淆網(wǎng)絡標識、以及該音節(jié)所對應的邊的權(quán)重。
11. 根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述相似度計算模塊計算待查詢音節(jié) 混淆網(wǎng)絡與各個目標音節(jié)混淆網(wǎng)絡的相似度的方式為: 查詢所述所有目標音節(jié)混淆網(wǎng)絡的索引,確定包含所述待查詢音節(jié)混淆網(wǎng)絡中所有音 節(jié)的目標音節(jié)混淆網(wǎng)絡;根據(jù)待查詢音節(jié)混淆網(wǎng)絡生成對應的狀態(tài)轉(zhuǎn)移查詢表,采用所述 狀態(tài)轉(zhuǎn)移查詢表計算待查詢音節(jié)混淆網(wǎng)絡與所述確定出的各個目標音節(jié)混淆網(wǎng)絡的相似 度。
12. 根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述相似度計算模塊采用狀態(tài)轉(zhuǎn)移查 詢表計算相似度的具體方式為: 針對該目標音節(jié)混淆網(wǎng)絡的每個節(jié)點構(gòu)造一個令牌,將該令牌的狀態(tài)Status設置為 所述狀態(tài)轉(zhuǎn)移查詢表的初始狀態(tài),將該令牌的觀測設置為!NULL,將該令牌的權(quán)重設置為 1,將該令牌的得分Score設置為0 ;針對各個令牌分別執(zhí)行以下步驟A,得到最終存活令牌 列表,并對最終存活令牌列表中所有令牌的得分求和,將求和結(jié)果作為待查詢音節(jié)混淆網(wǎng) 絡與該目標音節(jié)混淆網(wǎng)絡的相似度; A、 判斷所述當前令牌的觀測是否為! NULL,如果是,則執(zhí)行步驟B ;否則執(zhí)行步驟C ; B、 在所述狀態(tài)轉(zhuǎn)移查詢表中查詢行取Status、并且列??!NULL時對應的表格,設表格 中的狀態(tài)為Status',如果Status'為狀態(tài)轉(zhuǎn)移表的終止狀態(tài),將當前令牌加入最終存活令 牌列表,結(jié)束當前步驟;否則,刪除當前令牌,在所述狀態(tài)轉(zhuǎn)移表中查詢行取Status'的非 空表格.. Ck,在當前位置構(gòu)造 k個新的令牌,每個新的令牌的狀態(tài)為Status',觀測為表 格對應的列上的音節(jié)標簽,權(quán)重為表格中的權(quán)重,得分為當前令牌的得分,針對所述新的令 牌繼續(xù)執(zhí)行步驟A ; C、 設所述令牌的觀測為obsr,遍歷所述目標音節(jié)混淆網(wǎng)絡中以該令牌所在節(jié)點為出發(fā) 點的各條邊,如果所述各條邊的音節(jié)標簽均不為obsr,則刪除該令牌;如果有一條邊上的 音節(jié)標簽為obsr,則執(zhí)行如下步驟:在所述狀態(tài)轉(zhuǎn)移查詢表中,查詢行取Status、并且列取 obsr時對應的表格,設該表格對應的狀態(tài)為Status',如果Status'為狀態(tài)轉(zhuǎn)移表的終止 狀態(tài),將當前令牌加入最終存活令牌列表,結(jié)束當前步驟;否則,刪除當前令牌,在所述狀態(tài) 轉(zhuǎn)移查詢表中查詢行取Status'的非空表格.. Ck,在該邊的結(jié)束節(jié)點上構(gòu)造 k個新的令 牌,每個令牌的狀態(tài)為Status',觀測為表格對應的列上的音節(jié)標簽,權(quán)重為表格中的權(quán)重, 得分Score更新為原Score與當前令牌權(quán)重與該邊的權(quán)重的乘積之和,針對所述新的令牌 繼續(xù)執(zhí)行步驟A。
【文檔編號】G06F17/30GK104142974SQ201410024095
【公開日】2014年11月12日 申請日期:2014年1月20日 優(yōu)先權(quán)日:2014年1月20日
【發(fā)明者】李露, 馬建雄, 盧鯉 申請人:騰訊科技(深圳)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
苍南县| 阿克陶县| 板桥市| 莆田市| 靖州| 江都市| 延安市| 泰安市| 长兴县| 扎赉特旗| 沁阳市| 沙洋县| 卢氏县| 靖西县| 马尔康县| 增城市| 太和县| 龙井市| 利辛县| 岑巩县| 榆社县| 淅川县| 惠东县| 华坪县| 临沂市| 玉山县| 枣阳市| 望奎县| 朝阳市| 扬州市| 巴南区| 钟山县| 孙吴县| 岳池县| 鹤岗市| 将乐县| 永春县| 合山市| 巨野县| 东丰县| 香港|