欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種語音錄入方法及系統(tǒng)的制作方法

文檔序號:2827557閱讀:519來源:國知局
一種語音錄入方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種語音錄入方法及系統(tǒng),屬于語音錄入【技術(shù)領(lǐng)域】。該語音錄入方法包括:實(shí)時(shí)接收用戶語音錄入時(shí)的音頻信號;對所述音頻信號進(jìn)行端點(diǎn)檢測,并根據(jù)檢測結(jié)果確定所述音頻信號中的語音是否處于停頓狀態(tài);如果是,則按照預(yù)設(shè)周期計(jì)算端點(diǎn)時(shí)間,并根據(jù)計(jì)算結(jié)果向用戶展示端點(diǎn)提示信息,直到本次停頓結(jié)束;所述端點(diǎn)時(shí)間包括:當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間。該語音錄入方法及系統(tǒng),能夠有效提高語音錄入質(zhì)量,進(jìn)而提高語音識別的準(zhǔn)確性。
【專利說明】—種語音錄入方法及系統(tǒng)

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及語音錄入【技術(shù)領(lǐng)域】,特別涉及一種語音錄入方法及系統(tǒng)。

【背景技術(shù)】
[0002]經(jīng)過多年的技術(shù)發(fā)展,語音錄入作為一種重要的非鍵盤輸入方法在PC、智能手機(jī)等便攜設(shè)備上得到了廣泛的應(yīng)用。通常情況下,語音識別系統(tǒng)在獲取用戶錄入的語音后,對語音信號進(jìn)行解碼得到文本字串,然后反饋給用戶。而語音識別的準(zhǔn)確率和語音錄入的質(zhì)量有很大關(guān)系。通常情況下,錄入語音的口音越標(biāo)準(zhǔn),速率越平穩(wěn),停頓越精確,音量越適中,則語音質(zhì)量越高,相應(yīng)地語音識別的準(zhǔn)確率也越高。
[0003]如圖1所示,為現(xiàn)有技術(shù)中的語音錄入方法的流程圖。
[0004]現(xiàn)有技術(shù)中的語音錄入方法,通常包括以下步驟:
[0005]步驟101:接收到用戶的錄音啟動指令后,開始實(shí)時(shí)接收用戶語音錄入時(shí)的音頻信號。
[0006]其中,錄音啟動指令通常為用戶對錄音啟動按鈕的觸發(fā)信號,可以通過手動按下啟動按鈕,開始進(jìn)行錄音。
[0007]步驟102:對音頻信號進(jìn)行語音分析,并向用戶展示分析結(jié)果。
[0008]其中,對音頻信號進(jìn)行語音分析,主要包括對語音音量或信號幅度(能夠指示聲音的高低)進(jìn)行分析,采用指示器上的能量條數(shù)目的多少來表示語音音量的高低,從而使用戶能夠在錄入語音時(shí)控制音量的高低。
[0009]步驟103:如果接收到用戶的錄音結(jié)束指示,則停止語音錄入,否則繼續(xù)進(jìn)行語音錄入。
[0010]其中,錄音結(jié)束指令通常為用戶對錄音結(jié)束按鈕的觸發(fā)信號,可以通過手動按下結(jié)束按鈕,停止語音錄入。當(dāng)然也可以通過預(yù)置的端點(diǎn)檢測模塊對錄音是否結(jié)束進(jìn)行自動判斷。
[0011]現(xiàn)有技術(shù)中的語音錄入方法,由于語音分析結(jié)果中通常只包含音量相關(guān)信息,根據(jù)分析結(jié)果只能對語音錄入音量的高低進(jìn)行調(diào)整,而無法控制語音錄入速度,也不知道應(yīng)該在何時(shí)進(jìn)行停頓,很容易因?yàn)檎Z音錄入速度不合適而導(dǎo)致語音錄入質(zhì)量低下,從而無法進(jìn)行語音識別或者識別準(zhǔn)確率較低。


【發(fā)明內(nèi)容】

[0012]本發(fā)明實(shí)施例的目的在于提供一種語音錄入方法及系統(tǒng),能夠有效提高語音錄入質(zhì)量,進(jìn)而提高語音識別的準(zhǔn)確性。
[0013]本發(fā)明實(shí)施例提供的技術(shù)方案如下:
[0014]一方面,提供了一種語音錄入方法,包括:
[0015]實(shí)時(shí)接收用戶語音錄入時(shí)的音頻信號;
[0016]對所述音頻信號進(jìn)行端點(diǎn)檢測,并根據(jù)檢測結(jié)果確定所述音頻信號中的語音是否處于停頓狀態(tài);
[0017]如果是,則按照預(yù)設(shè)周期計(jì)算端點(diǎn)時(shí)間,并根據(jù)計(jì)算結(jié)果向用戶展示端點(diǎn)提示信息,直到本次停頓結(jié)束;所述端點(diǎn)時(shí)間包括:當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間。
[0018]優(yōu)選地,所述端點(diǎn)時(shí)間還包括:當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間。
[0019]優(yōu)選地,所述按照預(yù)設(shè)周期計(jì)算端點(diǎn)時(shí)間包括:計(jì)算當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間和當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間;
[0020]所述計(jì)算當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間,包括:獲取第一預(yù)設(shè)時(shí)長和本次語音信號停頓所持續(xù)的時(shí)長,將所述第一預(yù)設(shè)時(shí)長減去所述本次語音信號停頓所持續(xù)的時(shí)長得到所述當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間;
[0021]所述計(jì)算當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間,包括:獲取第二預(yù)設(shè)時(shí)長和本次語音信號停頓所持續(xù)的時(shí)長,將所述第二預(yù)設(shè)時(shí)長減去所述本次語音信號停頓所持續(xù)的時(shí)長得到所述當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間;
[0022]所述第一預(yù)設(shè)時(shí)長為語音子句間的最小時(shí)間間隔;所述第二預(yù)設(shè)時(shí)長為檢測到語音的結(jié)束端點(diǎn)到本次語音錄入自動結(jié)束的時(shí)間。
[0023]優(yōu)選地,所述根據(jù)計(jì)算結(jié)果向用戶展示端點(diǎn)提示信息,直到本次停頓結(jié)束包括:
[0024]如果所述當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間和當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間都大于零,則向用戶展示所述當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間和當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間;
[0025]如果所述當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間小于或等于零,且所述當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間大于零,則向用戶展示語音子句結(jié)束提示信息,并向用戶展示所述當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間;
[0026]如果所述當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間小于或等于零,則向用戶展示本次語音錄入自動結(jié)束提示信息。
[0027]優(yōu)選地,所述向用戶展示端點(diǎn)提示信息包括:
[0028]采用數(shù)字圖示、進(jìn)度條、提示音這三者中的任一種或多種方式向用戶展示端點(diǎn)提不?目息。
[0029]另一方面,提供了一種語音錄入系統(tǒng),包括:
[0030]接收模塊,用于實(shí)時(shí)接收用戶語音錄入時(shí)的音頻信號;
[0031]端點(diǎn)檢測模塊,用于對所述音頻信號進(jìn)行端點(diǎn)檢測;
[0032]確定模塊,用于根據(jù)所述端點(diǎn)檢測模塊的檢測結(jié)果確定所述音頻信號中的語音是否處于停頓狀態(tài);
[0033]計(jì)算模塊,用于在所述確定模塊確定所述音頻信號中的語音處于停頓狀態(tài)后,按照預(yù)設(shè)周期計(jì)算端點(diǎn)時(shí)間;所述端點(diǎn)時(shí)間包括:當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間;
[0034]展示模塊,用于根據(jù)所述計(jì)算模塊的計(jì)算結(jié)果向用戶展示端點(diǎn)提示信息,直到本次停頓結(jié)束。
[0035]優(yōu)選地,所述端點(diǎn)時(shí)間還包括:當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間。
[0036] 優(yōu)選地,所述計(jì)算模塊包括:
[0037]第一計(jì)算單元,用于在所述確定模塊確定所述音頻信號中的語音處于停頓狀態(tài)后,按照預(yù)設(shè)周期計(jì)算當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間,包括:獲取第一預(yù)設(shè)時(shí)長和本次語音信號停頓所持續(xù)的時(shí)長,將所述第一預(yù)設(shè)時(shí)長減去所述本次語音信號停頓所持續(xù)的時(shí)長得到所述當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間,所述第一預(yù)設(shè)時(shí)長為語音子句間的最小時(shí)間間隔;
[0038]第二計(jì)算單元,用于在所述確定模塊確定所述音頻信號中的語音處于停頓狀態(tài)后,按照預(yù)設(shè)周期計(jì)算當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間,包括:獲取第二預(yù)設(shè)時(shí)長和本次語音信號停頓所持續(xù)的時(shí)長,將所述第二預(yù)設(shè)時(shí)長減去所述本次語音信號停頓所持續(xù)的時(shí)長得到所述當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間,所述第二預(yù)設(shè)時(shí)長為檢測到語音的結(jié)束端點(diǎn)到本次語音錄入自動結(jié)束的時(shí)間。
[0039]優(yōu)選地,所述展示模塊,具體用于在所述當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間和當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間都大于零時(shí),向用戶展示所述當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間和當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間;在所述當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間小于或等于零,且所述當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間大于零時(shí),向用戶展示語音子句結(jié)束提示信息,并向用戶展示所述當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間;在所述當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間小于或等于零時(shí),向用戶展示本次語音錄入自動結(jié)束提示信息。
[0040]優(yōu)選地,所述展示模塊,具體用于采用數(shù)字圖示、進(jìn)度條、提示音這三者中的任一種或多種方式向用戶展示端點(diǎn)提示信息。
[0041]本發(fā)明實(shí)施例提供的語音錄入方法及系統(tǒng),通過端點(diǎn)檢測確定語音信號是否處于停頓狀態(tài),當(dāng)語音信號處于停頓狀態(tài)時(shí),通過向用戶展示端點(diǎn)提示信息,使用戶能夠知曉當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間,從而對語音錄入速度進(jìn)行調(diào)整,并選擇在合適的時(shí)刻才進(jìn)行停頓,能夠有效提升語音錄入質(zhì)量,進(jìn)而提高語音識別的準(zhǔn)確率。

【專利附圖】

【附圖說明】
[0042]為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明中記載的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,還可以根據(jù)這些附圖獲得其他的附圖。
[0043]圖1為現(xiàn)有技術(shù)中的語音錄入方法的流程圖;
[0044]圖2為本發(fā)明實(shí)施例提供的語音錄入方法的流程圖;
[0045]圖3為本發(fā)明實(shí)施例提供的語音錄入系統(tǒng)的一種結(jié)構(gòu)示意圖;
[0046]圖4為本發(fā)明實(shí)施例提供的語音錄入系統(tǒng)的另一種結(jié)構(gòu)示意圖。

【具體實(shí)施方式】
[0047]為了更清楚地說明本申請實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明中記載的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,還可以根據(jù)這些附圖獲得其他的附圖。
[0048]本發(fā)明實(shí)施例提供一種語音錄入方法及系統(tǒng),通過向用戶展示端點(diǎn)提示信息,使用戶能夠?qū)φZ音錄入速度進(jìn)行調(diào)整,并合理控制語音停頓時(shí)刻以及停頓持續(xù)時(shí)間,從而有效提高語音錄入質(zhì)量,進(jìn)而使語音識別的準(zhǔn)確性得到提高。
[0049]如圖2所示,為本發(fā)明實(shí)施例提供的一種語音錄入方法的流程圖,包括以下步驟:
[0050]步驟201:實(shí)時(shí)接收用戶語音錄入時(shí)的音頻信號。
[0051]步驟202:對音頻信號進(jìn)行端點(diǎn)檢測,并根據(jù)檢測結(jié)果確定音頻信號中的語音是否處于停頓狀態(tài)。
[0052]由于音頻信號中的語音信號呈現(xiàn)出短時(shí)平穩(wěn)性特點(diǎn),可以通過對音頻信號做分幀處理,將整音頻分割成特定長度的子段,從而保證子段音頻的頻譜連續(xù)性?;诿看嗡芴幚淼囊纛l信號的長度有限,還需要對音頻信號做加窗處理,從而使每次所處理的音頻信號限于窗內(nèi)的信號。具體可以采用加漢明窗或漢寧窗等加窗處理。優(yōu)選地,子段音頻的每幀長度為25ms,幀移為10ms。對于一段特定長度的音頻,經(jīng)過分幀和加窗處理后,可以得到多個(gè)語音幀。其中,語音幀是音頻信號中語音和非語音判決的最小單元。
[0053]端點(diǎn)檢測實(shí)質(zhì)上通過對所得到的每個(gè)語音幀中的特征信息,例如,時(shí)域能量、頻域能量或過零率等進(jìn)行計(jì)算,從而對語音和非語音進(jìn)行區(qū)分,其中,非語音既可以是靜音,還可以是噪音。由于對安靜環(huán)境下的音頻信號,語音段能量通常比非語音段能量高,語音信號的過零率通常比非語音信號的過零率要低,其中,過零率指在單位時(shí)間內(nèi)音頻信號采樣值通過零點(diǎn)(從正變?yōu)樨?fù)或從負(fù)變?yōu)檎?的次數(shù)。通過對以上特征信息的計(jì)算,能夠有效對語音和非語音進(jìn)行區(qū)分,從而可以判斷當(dāng)前的音頻信號是語音信號還是非語音信號。當(dāng)判定當(dāng)前的音頻信號為非語音信號時(shí),可以認(rèn)為音頻信號中的語音處于停頓狀態(tài),因此,通過端點(diǎn)檢測能夠有效識別音頻信號中語音的開始端點(diǎn)和結(jié)束端點(diǎn)。
[0054]步驟203:如果是,則按照預(yù)設(shè)周期計(jì)算端點(diǎn)時(shí)間,并根據(jù)計(jì)算結(jié)果向用戶展示端點(diǎn)提示信息,直到本次停頓結(jié)束。
[0055]如果根據(jù)端點(diǎn)檢測結(jié)果,確定音頻信號中的語音沒有發(fā)生停頓,也可以按照預(yù)設(shè)周期向用戶反饋語音信號未停頓提示信息,從而使用戶在看到該信息后知道語音信號未發(fā)生停頓。
[0056]當(dāng)檢測到語音信號停頓一定時(shí)間,結(jié)束停頓狀態(tài)繼續(xù)進(jìn)行語音錄入時(shí),可以使端點(diǎn)時(shí)間恢復(fù)默認(rèn)值(例如清零),當(dāng)再次檢測到語音信號發(fā)生停頓時(shí),再按照預(yù)設(shè)周期計(jì)算更新的端點(diǎn)時(shí)間。其中,可以通過上述端點(diǎn)檢測確定用戶是否繼續(xù)進(jìn)行語音錄入,如果檢測結(jié)果顯示語音信號停頓一段時(shí)間后結(jié)束停頓狀態(tài),可以認(rèn)為用戶繼續(xù)進(jìn)行語音錄入,否則,可以認(rèn)為語音信號持續(xù)處于停頓狀態(tài)。
[0057]上述端點(diǎn)時(shí)間可以包括:當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間,以Mms (毫秒)表示。由于數(shù)據(jù)處理速度固定,可以將每次所能處理的音頻信號的數(shù)據(jù)量折算為時(shí)間長度,以Kms表示,則從語音信號發(fā)生停頓時(shí)刻開始到停頓結(jié)束,每間隔K ms計(jì)算并反饋一次新的端點(diǎn)時(shí)間,同時(shí)向用戶展示端點(diǎn)提示信息。在本發(fā)明實(shí)施例中,為便于描述,可以將K稱為反饋間隔時(shí)間或預(yù)設(shè)周期。通過計(jì)算端點(diǎn)時(shí)間M可以知道,從當(dāng)前時(shí)刻開始,語音信號再發(fā)生多長時(shí)間的停頓,當(dāng)前語音子句將自動結(jié)束。
[0058]上述端點(diǎn)時(shí)間還可以包括:當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間,以Nms表示。通過計(jì)算端點(diǎn)時(shí)間N可以知道,從當(dāng)前時(shí)刻開始,語音信號再發(fā)生多長時(shí)間的停頓,本次語音錄入將自動結(jié)束。優(yōu)選地,N^M0
[0059]在本發(fā)明實(shí)施例中,可以預(yù)先設(shè)置兩個(gè)時(shí)間長度:第一預(yù)設(shè)時(shí)長T1和第二預(yù)設(shè)時(shí)長1~2。其中,第一預(yù)設(shè)時(shí)長T1指語音子句間的最小時(shí)間間隔,第二預(yù)設(shè)時(shí)長T2指檢測到語音的結(jié)束端點(diǎn)到本次語音錄入自動結(jié)束的時(shí)間,則有O≤M≤?\,0≤N≤T2。當(dāng)語音信號發(fā)生停頓后,將停頓所持續(xù)的時(shí)間長度以Ts表示,則如果停頓所持續(xù)的時(shí)間長度Ts大于或等于T1,則判決停頓前后的語音信號處于不同的語音子句中;如果停頓所持續(xù)的時(shí)間長度Ts小于T1,則判決停頓前后的語音信號處于同一個(gè)語音子句中;如果停頓所持續(xù)的時(shí)間長度Ts大于或等于T2,則判決本次語音錄入自動結(jié)束。優(yōu)選地,可以將T1設(shè)置300~400ms,T2設(shè)置為1000~2000ms,K設(shè)置為50ms。
[0060]由于語音信號發(fā)生停頓后,第一次反饋的停頓所持續(xù)的時(shí)間長度Ts不會超過反饋間隔時(shí)間K,則顯然有Ts ( K。由于第一次反饋端點(diǎn)時(shí)間時(shí),停頓所持續(xù)的時(shí)間長度為Ts,那么M的初始反饋值為M0 = T1-Ts, N的初始反饋值為Ntl = T2-Ts,此后,如果語音信號仍然處于停頓狀態(tài),則每間隔KmsJi M和N作如下處理=Mi = Mi^1-K, Ni = N^-K。
[0061]上述按照預(yù)設(shè)周期計(jì)算端點(diǎn)時(shí)間包括:計(jì)算當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間M和當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間N ;其中,當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間M,可以通過第一預(yù)設(shè)時(shí)長T1減去本次語音信號停頓所持續(xù)的時(shí)長Ts計(jì)算得到;當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間N,可以通過第二預(yù)設(shè)時(shí)長丁2減去本次語音信號停頓所持續(xù)的時(shí)長Ts計(jì)算得到。
[0062]其中,根據(jù)端點(diǎn)時(shí)間的計(jì)算結(jié)果向用戶展示端點(diǎn)提示信息,直到本次停頓結(jié)束主要包括以下幾種情況:
[0063](I)Mi > O, Ni > 0,則向用戶展示的端點(diǎn)提示信息包括Mi和Ni的值。
[0064]當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間Mi > 0,可以認(rèn)為語音信號仍然處于停頓狀態(tài),并且沒有發(fā)生當(dāng)前語音子句自動結(jié)束的判決;當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間Ni > 0,可以認(rèn)為語音信號仍然處于停頓狀態(tài),并且沒有發(fā)生本次語音錄入自動結(jié)束的判決。此時(shí),通過向用戶展示Mi和Ni的值,可以使用戶直觀地看到還剩多少時(shí)間當(dāng)前語音子句將自動結(jié)束,以及還剩多少時(shí)間本次語音錄入將自動結(jié)束,從而使用戶對語音錄入速度、語音停頓時(shí)刻和停頓持續(xù)時(shí)間進(jìn)行控制。
[0065](2)Mi ( O, Ni > O,則向用戶展示的端點(diǎn)提示信息包括語音子句結(jié)束提示信息和Ni的值。
[0066]當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間Mi ( 0,可以認(rèn)為語音信號仍然處于停頓狀態(tài),但停頓持續(xù)時(shí)間大于或等于語音子句間的最小時(shí)間間隔T1,已經(jīng)發(fā)生語音子句結(jié)束判決;當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間Ni > 0,可以認(rèn)為語音信號仍然處于停頓狀態(tài),并且沒有發(fā)生本次語音錄入自動結(jié)束的判決。此時(shí),可以向用戶展示語音子句結(jié)束提示信息,并向用戶展示當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間,可以使用戶直觀地看到還剩多少時(shí)間本次語音錄入將自動結(jié)束,從而使用戶對語音錄入速度、語音停頓時(shí)刻和停頓持續(xù)時(shí)間進(jìn)行控制。
[0067](3)Ni ( O,向用戶展示的端點(diǎn)提示信息包括本次語音錄入自動結(jié)束提示信息。
[0068]如果當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間Ni ( 0,可以認(rèn)為語音信號仍然處于停頓狀態(tài),并且已經(jīng)發(fā)生本次語音錄入自動結(jié)束的判決。此時(shí),可以向用戶展示本次語音錄入自動結(jié)束提示信息,從而使用戶對語音錄入速度、語音停頓時(shí)刻和停頓持續(xù)時(shí)間進(jìn)行控制。需要說明的是,本次語音錄入自動結(jié)束后,可以不再按照預(yù)設(shè)周期計(jì)算端點(diǎn)時(shí)間,可以在重新開始語音錄入后,直到再次檢測到語音信號處于停頓狀態(tài)時(shí),再按照預(yù)設(shè)周期計(jì)算端點(diǎn)時(shí)間。
[0069]向用戶展示端點(diǎn)提示信息的方式多種多樣,可以根據(jù)需要進(jìn)行設(shè)置,例如,可以采用數(shù)字圖示、進(jìn)度條、提示音這三者中的任一種或多種方式向用戶展示端點(diǎn)提示信息,從而使用戶能夠?qū)︿浺魻顟B(tài)進(jìn)行直觀了解,及時(shí)對語音錄入速度、語音停頓時(shí)刻和停頓持續(xù)時(shí)間進(jìn)行調(diào)整,從而得到高質(zhì)量的錄音,進(jìn)而提高語音識別準(zhǔn)確率。
[0070]以下通過一個(gè)具體的例子,對本發(fā)明實(shí)施例的技術(shù)方案進(jìn)行詳細(xì)說明。
[0071]例如,用戶所錄入的音頻信號為:今天//天氣很好//我準(zhǔn)備去郊游//。其中,“//”位置代表語音信號發(fā)生停頓。假設(shè)“今天”和“天氣”中間停頓所持續(xù)的時(shí)間為200ms,“很好”和“我”中間停頓所持續(xù)的時(shí)間為500ms,“郊游”后面用戶保持停頓1500ms。那么,在用戶剛說完“今天”后,開始發(fā)生停頓,此時(shí),M = T1 = 400ms, N = T2 = 1200ms。然后經(jīng)過200ms的停頓,M減少到200ms,表示還需停頓200ms才會判決“今天”這個(gè)語音子句結(jié)束,N減少到1000ms,表示還需停頓IOOOms才會判決本次語音錄入自動結(jié)束。但是,由于用戶結(jié)束停頓,開始說“天氣”,即M和N都沒有減少到0,M和N將恢復(fù)到原來的默認(rèn)值(可以將默認(rèn)值設(shè)置為O)直到“很好”說完再次發(fā)生停頓,此時(shí),M = T1 = 400ms, N = T2 = 1200ms,然后中間停頓500ms,在停頓到400ms時(shí),M減少為O,發(fā)生“今天天氣很好”這個(gè)語音子句結(jié)束判決,但是在500ms停頓結(jié)束時(shí)N = 700ms,仍然未減少到0,所以,未發(fā)生本次語音錄入自動結(jié)束判決?!拔覝?zhǔn)備去郊游”說完發(fā)生停頓1500ms,在停頓到400ms時(shí),M減少為0,發(fā)生“我準(zhǔn)備去郊游”這個(gè)語音子句結(jié)束判決,在停頓到1200ms時(shí),N減少為0,發(fā)生本次語音錄入自動結(jié)束判決,即使用戶繼續(xù)說話也無法錄入語音。
[0072]本發(fā)明實(shí)施例提供的語音錄入方法,通過端點(diǎn)檢測確定語音信號是否處于停頓狀態(tài),當(dāng)語音信號處于停頓狀態(tài)時(shí),通過向用戶展示端點(diǎn)提示信息,使用戶能夠知曉當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間,從而對語音錄入速度進(jìn)行調(diào)整,并選擇在合適的時(shí)刻才進(jìn)行停頓,能夠有效提升語音錄入質(zhì)量,進(jìn)而提高語音識別的準(zhǔn)確率。
[0073]相應(yīng)地,本發(fā)明實(shí)施例還提供了一種語音錄入系統(tǒng),其結(jié)構(gòu)示意圖如圖3所示,該語音錄入系統(tǒng)包括:
[0074]接收模塊301,用于實(shí)時(shí)接收用戶語音錄入時(shí)的音頻信號;
[0075]端點(diǎn)檢測模塊302,用于對音頻信號進(jìn)行端點(diǎn)檢測;
[0076]確定模塊303,用于根據(jù)端點(diǎn)檢測模塊的檢測結(jié)果確定音頻信號中的語音是否處于停頓狀態(tài);
[0077]計(jì)算模塊304,用于在確定模塊確定音頻信號中的語音處于停頓狀態(tài)后,按照預(yù)設(shè)周期計(jì)算端點(diǎn)時(shí)間;其中,端點(diǎn)時(shí)間包括:當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間;
[0078]展示模塊305,用于根據(jù)計(jì)算模塊的計(jì)算結(jié)果向用戶展示端點(diǎn)提示信息,直到本次停頓結(jié)束。
[0079]進(jìn)一步地,上述端點(diǎn)時(shí)間還可以包括:當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間。
[0080]如圖4所示,上述計(jì)算模塊304可以包括:
[0081]第一計(jì)算單元401,用于在確定模塊確定音頻信號中的語音處于停頓狀態(tài)后,按照預(yù)設(shè)周期計(jì)算當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間,包括:獲取第一預(yù)設(shè)時(shí)長和本次語音信號停頓所持續(xù)的時(shí)長,將第一預(yù)設(shè)時(shí)長減去本次語音信號停頓所持續(xù)的時(shí)長得到當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間,第一預(yù)設(shè)時(shí)長為語音子句間的最小時(shí)間間隔;
[0082]第二計(jì)算單元402,用于在確定模塊確定音頻信號中的語音處于停頓狀態(tài)后,按照預(yù)設(shè)周期計(jì)算當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間,包括:獲取第二預(yù)設(shè)時(shí)長和本次語音信號停頓所持續(xù)的時(shí)長,將第二預(yù)設(shè)時(shí)長減去本次語音信號停頓所持續(xù)的時(shí)長得到當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間,第二預(yù)設(shè)時(shí)長為檢測到語音的結(jié)束端點(diǎn)到本次語音錄入自動結(jié)束的時(shí)間。
[0083]其中,展示模塊305,具體用于在當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間和當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間都大于零時(shí),向用戶展示當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間和當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間;在當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間小于或等于零,且當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間大于零時(shí),向用戶展示語音子句結(jié)束提示信息,并向用戶展示當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間;在當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間小于或等于零時(shí),向用戶展示本次語音錄入自動結(jié)束提示信息。
[0084]上述展示模塊305,具體用于采用數(shù)字圖示、進(jìn)度條、提示音這三者中的任一種或多種方式向用戶展示端點(diǎn)提示信息。
[0085]本發(fā)明實(shí)施例提供的語音錄入系統(tǒng),通過端點(diǎn)檢測確定語音信號是否處于停頓狀態(tài),當(dāng)語音信號處于停頓狀態(tài)時(shí),通過向用戶展示端點(diǎn)提示信息,使用戶能夠知曉當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間,從而對語音錄入速度進(jìn)行調(diào)整,并選擇在合適的時(shí)刻才進(jìn)行停頓,能夠有效提升語音錄入質(zhì)量,進(jìn)而提高語音識別的準(zhǔn)確率。
[0086]本說明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,各個(gè)實(shí)施例之間相同相似的部分互相參見即可,每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處。尤其,對于系統(tǒng)實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述得比較簡單,相關(guān)之處參見方法實(shí)施例的部分說明即可。以上所描述的系統(tǒng)實(shí)施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部模塊來實(shí)現(xiàn)本實(shí)施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動的情況下,即可以理解并實(shí)施。
[0087]以上所述僅為本發(fā)明的較佳實(shí)施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種語音錄入方法,其特征在于,包括: 實(shí)時(shí)接收用戶語音錄入時(shí)的音頻信號; 對所述音頻信號進(jìn)行端點(diǎn)檢測,并根據(jù)檢測結(jié)果確定所述音頻信號中的語音是否處于停頓狀態(tài); 如果是,則按照預(yù)設(shè)周期計(jì)算端點(diǎn)時(shí)間,并根據(jù)計(jì)算結(jié)果向用戶展示端點(diǎn)提示信息,直到本次停頓結(jié)束;所述端點(diǎn)時(shí)間包括:當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述端點(diǎn)時(shí)間還包括:當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述按照預(yù)設(shè)周期計(jì)算端點(diǎn)時(shí)間包括:計(jì)算當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間和當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間; 所述計(jì)算當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間,包括:獲取第一預(yù)設(shè)時(shí)長和本次語音信號停頓所持續(xù)的時(shí)長,將所述第一預(yù)設(shè)時(shí)長減去所述本次語音信號停頓所持續(xù)的時(shí)長得到所述當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間; 所述計(jì)算當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間,包括:獲取第二預(yù)設(shè)時(shí)長和本次語音信號停頓所持續(xù)的時(shí)長,將所述第二預(yù)設(shè)時(shí)長減去所述本次語音信號停頓所持續(xù)的時(shí)長得到所述當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間; 所述第一預(yù)設(shè)時(shí)長為語音子句間的最小時(shí)間間隔;所述第二預(yù)設(shè)時(shí)長為檢測到語音的結(jié)束端點(diǎn)到本次語音錄入自動結(jié)束的時(shí)間。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)計(jì)算結(jié)果向用戶展示端點(diǎn)提示信息,直到本次停頓結(jié)束包括: 如果所述當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間和當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間都大于零,則向用戶展示所述當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間和當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間; 如果所述當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間小于或等于零,且所述當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間大于零,則向用戶展示語音子句結(jié)束提示信息,并向用戶展示所述當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間; 如果所述當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間小于或等于零,則向用戶展示本次語音錄入自動結(jié)束提示信息。
5.根據(jù)權(quán)利要求1至4任一項(xiàng)所述的方法,其特征在于,所述向用戶展示端點(diǎn)提示信息包括: 采用數(shù)字圖示、進(jìn)度條、提示音這三者中的任一種或多種方式向用戶展示端點(diǎn)提示信肩、O
6.一種語音錄入系統(tǒng),其特征在于,包括: 接收模塊,用于實(shí)時(shí)接收用戶語音錄入時(shí)的音頻信號; 端點(diǎn)檢測模塊,用于對所述音頻信號進(jìn)行端點(diǎn)檢測; 確定模塊,用于根據(jù)所述端點(diǎn)檢測模塊的檢測結(jié)果確定所述音頻信號中的語音是否處于停頓狀態(tài); 計(jì)算模塊,用于在所述確定模塊確定所述音頻信號中的語音處于停頓狀態(tài)后,按照預(yù)設(shè)周期計(jì)算端點(diǎn)時(shí)間;所述端點(diǎn)時(shí)間包括:當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間; 展示模塊,用于根據(jù)所述計(jì)算模塊的計(jì)算結(jié)果向用戶展示端點(diǎn)提示信息,直到本次停頓結(jié)束。
7.根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述端點(diǎn)時(shí)間還包括:當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間。
8.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述計(jì)算模塊包括: 第一計(jì)算單元,用于在所述確定模塊確定所述音頻信號中的語音處于停頓狀態(tài)后,按照預(yù)設(shè)周期計(jì)算當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間,包括:獲取第一預(yù)設(shè)時(shí)長和本次語音信號停頓所持續(xù)的時(shí)長,將所述第一預(yù)設(shè)時(shí)長減去所述本次語音信號停頓所持續(xù)的時(shí)長得到所述當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間,所述第一預(yù)設(shè)時(shí)長為語音子句間的最小時(shí)間間隔; 第二計(jì)算單元,用于在所述確定模塊確定所述音頻信號中的語音處于停頓狀態(tài)后,按照預(yù)設(shè)周期計(jì)算當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間,包括:獲取第二預(yù)設(shè)時(shí)長和本次語音信號停頓所持續(xù)的時(shí)長,將所述第二預(yù)設(shè)時(shí)長減去所述本次語音信號停頓所持續(xù)的時(shí)長得到所述當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間,所述第二預(yù)設(shè)時(shí)長為檢測到語音的結(jié)束端點(diǎn)到本次語音錄入自動結(jié)束的時(shí)間。
9.根據(jù)權(quán)利要求 8所述的系統(tǒng),其特征在于: 所述展示模塊,具體用于在所述當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間和當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間都大于零時(shí),向用戶展示所述當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間和當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間;在所述當(dāng)前時(shí)刻到當(dāng)前語音子句自動結(jié)束的剩余時(shí)間小于或等于零,且所述當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間大于零時(shí),向用戶展示語音子句結(jié)束提示信息,并向用戶展示所述當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間;在所述當(dāng)前時(shí)刻到本次語音錄入自動結(jié)束的剩余時(shí)間小于或等于零時(shí),向用戶展示本次語音錄入自動結(jié)束提示信息。
10.根據(jù)權(quán)利要求6至9任一項(xiàng)所述的系統(tǒng),其特征在于: 所述展示模塊,具體用于采用數(shù)字圖示、進(jìn)度條、提示音這三者中的任一種或多種方式向用戶展示端點(diǎn)提示信息。
【文檔編號】G10L25/87GK104078076SQ201410265393
【公開日】2014年10月1日 申請日期:2014年6月13日 優(yōu)先權(quán)日:2014年6月13日
【發(fā)明者】潘青華, 錢柄樺, 何婷婷, 王智國, 胡郁, 劉慶峰 申請人:科大訊飛股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
寿宁县| 砀山县| 山丹县| 北宁市| 剑川县| 正宁县| 周口市| 深水埗区| 滨海县| 兴国县| 沈丘县| 都江堰市| 巴马| 北流市| 荣成市| 鄂州市| 肥城市| 高雄县| 彝良县| 辽宁省| 察隅县| 渑池县| 苏尼特左旗| 琼海市| 宜州市| 临漳县| 洪洞县| 上杭县| 巫溪县| 仙游县| 汝州市| 大姚县| 洛隆县| 昌都县| 潍坊市| 基隆市| 通道| 绥芬河市| 甘孜县| 馆陶县| 赣榆县|