谷歌正在開發一種使用自己聲音的翻譯AI
到一個你不會說當地語言的地方旅游,最糟糕的是當你瞇著眼睛看一本常用語手冊,張開嘴,準備完全毀掉這種語言時,你會有一種沮喪的感覺。如果那是你的噩夢,那么好消息來了。谷歌正在開發一種可以用你自己的聲音講另一種語言的人工智能。
在谷歌博客中,人工智能被恰當地命名為Translatotron,被描述為一種端到端、語音到語音的翻譯模型。它的新穎之處在于它避開了通常的語音到文本再到文本到語音的轉換方法,而這正是谷歌翻譯所做的。相反,它使用了一個神經網絡,這樣它就可以跳過將音頻轉換為文本的中間步驟,然后再轉換回來。它還包括一個“揚聲器編碼器”,可以保存原始揚聲器的聲音。
與傳統方法相比,新的人工智能有一些優勢。也就是說,谷歌指出了更快的推理速度,消除了復合錯誤,以及更好地處理不需要翻譯的單詞,如專有名詞和名稱。目前,谷歌表示,使用Translatotron的翻譯質量落后于傳統方法。也就是說,如果您查看示例音頻,最終結果不僅相當準確,而且聽起來更自然。仍然會有機械的語調,但比亞馬遜的Alexa強多了。
目前,已經有一些文本到語音的翻譯應用程序,包括谷歌翻譯、SayHi、Microsoft Translator、iTranslate和TripLingo。也就是說,他們都沒有在最終產品中使用你真實的聲音,這在現實生活中聽起來可能有點不舒服 。
Translatotron可能還在研發中,但我希望在不久的將來,我可以去一次我一直想去的巴黎旅行,而不用在一家高檔餐廳里因為把“confit de canard”發錯音而尷尬。
原文出自:https://gizmodo.com/googles-working-on-a-translation-ai-that-uses-your-own-1834825088
來源: gizmodo