微軟近日發(fā)布新一代DragonV2.1 Neural零次學(xué)習(xí)模型,該文本轉(zhuǎn)語音系統(tǒng)僅需數(shù)秒語音樣本即可生成超100種語言的逼真語音。相比前代產(chǎn)品,新模型在發(fā)音準(zhǔn)確性方面取得突破性進(jìn)展,單詞錯(cuò)誤率平均降低12.8%,特別改善了專有名詞的發(fā)音問題。這項(xiàng)技術(shù)創(chuàng)新通過SSML音素標(biāo)簽和自定義詞典實(shí)現(xiàn)精準(zhǔn)的發(fā)音控制,可應(yīng)用于智能