專(zhuān)利名稱(chēng):一種實(shí)現(xiàn)阿拉伯文tts發(fā)音的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種阿拉伯文文本智能發(fā)音方法,尤其涉及一種實(shí)現(xiàn)阿拉伯文TTS發(fā)音的方法
背景技術(shù):
阿拉伯文字起源于亞拉姆語(yǔ)文字,從公元四世紀(jì)開(kāi)始被使用,它屬阿非羅---亞西亞語(yǔ)系(亦稱(chēng)閃含語(yǔ)系)閃含語(yǔ),是埃及、沙特阿拉伯等十幾個(gè)國(guó)家的官方語(yǔ)言,聯(lián)合國(guó)的工作語(yǔ)言之一,使用人口近兩億。阿拉伯文字在伊斯蘭教的影響下流傳很廣,波斯文、烏爾都文及新疆的維吾爾文等多種文字采用阿拉伯字母。阿拉伯文由于其語(yǔ)言有著特殊性, 其發(fā)音方式也和其他語(yǔ)言有比較大的區(qū)別,因此,一種適應(yīng)于阿拉伯文的發(fā)音方法的可攜式設(shè)備是非常現(xiàn)在的語(yǔ)言學(xué)習(xí)中所需要的。
發(fā)明內(nèi)容
為了解決背景技術(shù)中所存在的技術(shù)問(wèn)題,本發(fā)明提出了一種實(shí)現(xiàn)阿拉伯文TTS發(fā)音的方法,利用語(yǔ)言發(fā)音規(guī)則和語(yǔ)音合成,將音素序列按照各自音素發(fā)音和成發(fā)音,方便語(yǔ)言學(xué)習(xí)者學(xué)習(xí)。本發(fā)明的技術(shù)解決方案是一種實(shí)現(xiàn)阿拉伯文TTS發(fā)音的方法,其特殊之處在于 所述方法包括以下步驟1)建立阿拉伯文音素音檔數(shù)據(jù)庫(kù);2)獲取需要進(jìn)行發(fā)音操作的文本字串;3)將獲取的文本字串按照音素規(guī)則,將關(guān)鍵詞分析出所組成的音素單位,拆分成音素序列;4)從音素音檔數(shù)據(jù)庫(kù)中獲取步驟3)中音素音檔;5)確定關(guān)鍵詞重音;6)確定關(guān)鍵詞語(yǔ)調(diào);7)將步驟5)中確定的重音以及步驟6)中確定的語(yǔ)調(diào)合成語(yǔ)音數(shù)據(jù)。上述步驟5)的具體步驟是5. 1)若是單音節(jié)的關(guān)鍵詞,則這個(gè)關(guān)鍵詞確定為重音;5. 2)雙音節(jié)的關(guān)鍵詞,第一個(gè)音節(jié)確定為重音;5. 3)多音節(jié)的關(guān)鍵詞,如果倒數(shù)第二個(gè)音節(jié)是短音節(jié),倒數(shù)第三個(gè)音節(jié)確定為重音;如果有兩個(gè)以上的長(zhǎng)音節(jié),最后一個(gè)長(zhǎng)音節(jié)確定為重音;如果有一個(gè)長(zhǎng)音節(jié),長(zhǎng)音節(jié)確
定為重音。上述步驟6)的具體步驟是確定關(guān)鍵詞在句子中的讀法,確定語(yǔ)調(diào)是平調(diào)、升調(diào)或降調(diào)。本發(fā)明的實(shí)現(xiàn)阿拉伯文TTS發(fā)音的方法,可以利用語(yǔ)言發(fā)音規(guī)則將關(guān)鍵詞拆分成由唯一發(fā)音的音素組成的音素序列,然后利用語(yǔ)言發(fā)音規(guī)則和語(yǔ)音和成技術(shù),將音素序列按照各自音素發(fā)音和成發(fā)音。本發(fā)明提出一種利用阿拉伯語(yǔ)言特點(diǎn),以及發(fā)音規(guī)則來(lái)實(shí)現(xiàn) TTS發(fā)音的方法,為使用者提供了一種阿拉伯文文本智能發(fā)音方法。大大方便了使用者語(yǔ)言輸入以及語(yǔ)言學(xué)習(xí)。
圖1是本發(fā)明的方法流程圖;
具體實(shí)施例方式參見(jiàn)圖1,本發(fā)明的實(shí)現(xiàn)阿拉伯文TTS發(fā)音的方法,包括以下步驟1)建立阿拉伯文音素音檔數(shù)據(jù)庫(kù);2)獲取需要進(jìn)行發(fā)音操作的文本字串;3)將獲取的文本字串按照音素規(guī)則,將關(guān)鍵詞分析出所組成的音素單位,拆分成音素序列;4)從音素音檔數(shù)據(jù)庫(kù)中獲取步驟3)中音素音檔;5)確定關(guān)鍵詞重音;確定重音的具體步驟和依據(jù)是從音節(jié)上分,阿拉伯語(yǔ)的組成分為單音節(jié)詞,雙音節(jié)詞和多音節(jié)詞三種。在雙音節(jié)詞和多音節(jié)詞里,有一個(gè)音節(jié)應(yīng)讀的重些,這個(gè)音節(jié)叫做單
詞重音。單音節(jié)詞單獨(dú)念時(shí),一律重讀。如
權(quán)利要求
1.一種實(shí)現(xiàn)阿拉伯文TTS發(fā)音的方法,其特征在于所述方法包括以下步驟1)建立阿拉伯文音素音檔數(shù)據(jù)庫(kù);2)獲取需要進(jìn)行發(fā)音操作的文本字串;3)將獲取的文本字串按照音素規(guī)則,將關(guān)鍵詞分析出所組成的音素單位,拆分成音素序列;4)從音素音檔數(shù)據(jù)庫(kù)中獲取步驟3)中音素音檔;5)確定關(guān)鍵詞重音;6)確定關(guān)鍵詞語(yǔ)調(diào);7)將步驟5)中確定的重音以及步驟6)中確定的語(yǔ)調(diào)合成語(yǔ)音數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的實(shí)現(xiàn)阿拉伯文TTS發(fā)音的方法,其特征在于所述步驟5)的具體步驟是5. 1)若是單音節(jié)的關(guān)鍵詞,則這個(gè)關(guān)鍵詞確定為重音; 5. 2)雙音節(jié)的關(guān)鍵詞,第一個(gè)音節(jié)確定為重音;5. 3)多音節(jié)的關(guān)鍵詞,如果倒數(shù)第二個(gè)音節(jié)是短音節(jié),倒數(shù)第三個(gè)音節(jié)確定為重音; 如果有兩個(gè)以上的長(zhǎng)音節(jié),最后一個(gè)長(zhǎng)音節(jié)確定為重音;如果有一個(gè)長(zhǎng)音節(jié),長(zhǎng)音節(jié)確定為重音。
3.根據(jù)權(quán)利要求2所述的實(shí)現(xiàn)阿拉伯文TTS發(fā)音的方法,其特征在于所述步驟6)的具體步驟是確定關(guān)鍵詞在句子中的讀法,確定語(yǔ)調(diào)是平調(diào)、升調(diào)或降調(diào)。
全文摘要
本發(fā)明提出了一種實(shí)現(xiàn)阿拉伯文TTS發(fā)音的方法,包括以下步驟1)建立阿拉伯文音素音檔數(shù)據(jù)庫(kù);2)獲取需要進(jìn)行發(fā)音操作的文本字串;3)將獲取的文本字串按照音素規(guī)則,將關(guān)鍵詞分析出所組成的音素單位,拆分成音素序列;4)從音素音檔數(shù)據(jù)庫(kù)中獲取步驟3)中音素音檔;5)確定關(guān)鍵詞重音;6)確定關(guān)鍵詞語(yǔ)調(diào);7)將步驟5)中確定的重音以及步驟6)中確定的語(yǔ)調(diào)合成語(yǔ)音數(shù)據(jù)。本發(fā)明的實(shí)現(xiàn)阿拉伯文TTS發(fā)音的方法,利用語(yǔ)言發(fā)音規(guī)則和語(yǔ)音合成,將音素序列按照各自音素發(fā)音和成發(fā)音,方便語(yǔ)言學(xué)習(xí)者學(xué)習(xí)。
文檔編號(hào)G10L13/08GK102354494SQ20111023539
公開(kāi)日2012年2月15日 申請(qǐng)日期2011年8月17日 優(yōu)先權(quán)日2011年8月17日
發(fā)明者趙黨建, 陳淮琰 申請(qǐng)人:無(wú)敵科技(西安)有限公司