微軟近日發(fā)布新一代DragonV2.1 Neural零次學(xué)習(xí)模型,該文本轉(zhuǎn)語(yǔ)音系統(tǒng)僅需數(shù)秒語(yǔ)音樣本即可生成超100種語(yǔ)言的逼真語(yǔ)音。相比前代產(chǎn)品,新模型在發(fā)音準(zhǔn)確性方面取得突破性進(jìn)展,單詞錯(cuò)誤率平均降低12.8%,特別改善了專(zhuān)有名詞的發(fā)音問(wèn)題。這項(xiàng)技術(shù)創(chuàng)新通過(guò)SSML音素標(biāo)簽和自定義詞典實(shí)現(xiàn)精準(zhǔn)的發(fā)音控制,可應(yīng)用于智能