本申請屬于信號處理,特別是涉及一種語音合成方法、裝置、計(jì)算機(jī)設(shè)備及介質(zhì)。
背景技術(shù):
1、語音合成是通過機(jī)械的、電子的方法產(chǎn)生人造語音的技術(shù)。例如,基于語音合成技術(shù)可以將文本轉(zhuǎn)換為語音。
2、傳統(tǒng)的語音合成技術(shù)得到的語音較為機(jī)械。目前,可以通過神經(jīng)網(wǎng)絡(luò)進(jìn)行語音合成,從而得到較為自然的語音。但是,通過神經(jīng)網(wǎng)絡(luò)進(jìn)行語音合成,需要消耗更多的內(nèi)存和算力等資源。當(dāng)將基于神經(jīng)網(wǎng)絡(luò)的語音合成方法應(yīng)用到資源受限的嵌入式設(shè)備上時,資源問題就更為凸顯。
3、因此,在盡可能減少資源占用時保持語音合成的實(shí)時性就尤為重要,特別是多路語音合成的資源控制。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本申請實(shí)施例提供了一種語音合成方法、裝置、計(jì)算機(jī)設(shè)備及介質(zhì),能夠在語音合成的過程中調(diào)節(jié)系統(tǒng)的資源占有率,從而保障系統(tǒng)的平穩(wěn)運(yùn)行。
2、本申請實(shí)施例的第一方面提供了一種語音合成方法,包括:
3、將待合成語音的文本分割為多個短語;
4、在基于多個所述短語對所述文本進(jìn)行語音合成的過程中,確定當(dāng)前系統(tǒng)的資源占有率;
5、若所述資源占有率不在預(yù)設(shè)范圍內(nèi),則對多個所述短語的停頓間隔進(jìn)行調(diào)節(jié);
6、基于調(diào)節(jié)后的停頓間隔對所述文本進(jìn)行語音合成。
7、本申請實(shí)施例的第二方面提供了一種語音合成裝置,包括:
8、分割模塊,用于將待合成語音的文本分割為多個短語;
9、確定模塊,用于在基于多個所述短語對所述文本進(jìn)行語音合成的過程中,確定當(dāng)前系統(tǒng)的資源占有率;
10、調(diào)節(jié)模塊,用于若所述資源占有率不在預(yù)設(shè)范圍內(nèi),則對多個所述短語的停頓間隔進(jìn)行調(diào)節(jié);
11、合成模塊,用于基于調(diào)節(jié)后的停頓間隔對所述文本進(jìn)行語音合成。
12、本申請實(shí)施例的第三方面提供了一種計(jì)算機(jī)設(shè)備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時實(shí)現(xiàn)如上述第一方面所述的方法。
13、本申請實(shí)施例的第四方面提供了一種計(jì)算機(jī)可讀存儲介質(zhì),所述計(jì)算機(jī)可讀存儲介質(zhì)存儲有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時實(shí)現(xiàn)如上述第一方面所述的方法。
14、本申請實(shí)施例的第五方面提供了一種計(jì)算機(jī)程序產(chǎn)品,當(dāng)所述計(jì)算機(jī)程序產(chǎn)品在計(jì)算機(jī)設(shè)備上運(yùn)行時,使得所述計(jì)算機(jī)設(shè)備執(zhí)行上述第一方面所述的方法。
15、與現(xiàn)有技術(shù)相比,本申請實(shí)施例至少包括以下優(yōu)點(diǎn):
16、應(yīng)用本申請實(shí)施例中的方法進(jìn)行語音合成時,可以將待合成語音的文本分割為多個短語;然后基于多個短語,對文本進(jìn)行語音合成。在基于多個短語對文本進(jìn)行語音合成的過程中,可以確定當(dāng)前系統(tǒng)的資源占有率,從而可以基于資源占有率確定當(dāng)前系統(tǒng)資源分配是否合理;若資源占有率不在預(yù)設(shè)范圍內(nèi),則表明當(dāng)前系統(tǒng)的資源分配不合理,此時可以對多個短語的停頓間隔進(jìn)行調(diào)節(jié);然后基于調(diào)節(jié)后的停頓間隔對文本進(jìn)行語音合成?;趯νnD間隔的調(diào)節(jié),可以控制文本的語音合成過程,使得文本合成過程能夠適應(yīng)系統(tǒng)資源波動,減少合成的語音的聽覺卡頓;控制文本的語音合成過程,可以調(diào)節(jié)系統(tǒng)的資源占有率,使得系統(tǒng)資源分配均衡,保障系統(tǒng)的穩(wěn)定運(yùn)行。
1.一種語音合成方法,其特征在于,包括:
2.如權(quán)利要求1所述的方法,其特征在于,所述若所述資源占有率不在預(yù)設(shè)范圍內(nèi),則對多個所述短語的停頓間隔進(jìn)行調(diào)節(jié),包括:
3.如權(quán)利要求2所述的方法,其特征在于,待合成語音的文本包括多路文本,所述若所述資源占有率大于第一閾值,則增加所述短語的停頓間隔,包括:
4.如權(quán)利要求2所述的方法,其特征在于,待合成語音的文本包括多路文本,所述若所述資源占有率小于第二閾值,則減少所述短語的停頓間隔,包括:
5.如權(quán)利要求1-4任一項(xiàng)所述的方法,其特征在于,在若所述當(dāng)前系統(tǒng)資源占有率不在預(yù)設(shè)范圍內(nèi),則對所述短語的停頓間隔進(jìn)行調(diào)節(jié),以調(diào)節(jié)當(dāng)前系統(tǒng)資源占有率之前,所述方法還包括:
6.如權(quán)利要求1-4任一項(xiàng)所述的方法,其特征在于,所述確定當(dāng)前系統(tǒng)資源占有率,包括:
7.如權(quán)利要求2-4任一項(xiàng)所述的方法,其特征在于,在若所述當(dāng)前系統(tǒng)資源占有率不在預(yù)設(shè)范圍內(nèi),則對所述短語的停頓間隔進(jìn)行調(diào)節(jié),以調(diào)節(jié)當(dāng)前系統(tǒng)資源占有率之前,所述方法還包括:
8.一種語音合成裝置,其特征在于,包括:
9.一種計(jì)算機(jī)設(shè)備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時實(shí)現(xiàn)如權(quán)利要求1-7任一項(xiàng)所述的方法。
10.一種計(jì)算機(jī)可讀存儲介質(zhì),所述計(jì)算機(jī)可讀存儲介質(zhì)存儲有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時實(shí)現(xiàn)如權(quán)利要求1-7任一項(xiàng)所述的方法。