星火語音大模型發布,打造萬物互聯時代各行業“百搭”CP
由大模型領銜的人工智能技術在2023年掀起了一場數字生產力革命,語音能力作為 科技 賦能生活最為剛需的能力也引發了科學界的高度關注,全球語音大模型的研究熱情逐漸高漲。
作為語音交互技術領域的領軍者,科大訊飛自然不會將語音大模型的王者地位拱手讓人。近日,在星火認知大模型V3.5升級發布會上,星火語音大模型一道問世,評測效果國際領先,中文、英語、法語、俄語等首批37個主流語種的語音識別效果超過OpenAI Whisper V3,而在多語種語音合成方面,星火語音大模型的首批40個語種擬人度超83%。
未來,星火語音大模型將不止助力跨國度、跨語種、跨文化間的對話,還能“百搭”更多真實場景,賦能實際應用落地。智能 汽車 、智能客服、智能家居、陪伴機器人,星火語音大模型將大有用武之地,萬物互聯人機對話的全新革命將深度變革人類的工作和生活方式。
源頭技術 穩居國際領先,大模型帶來躍升機會
以智能語音起家的科大訊飛, 創業 25年來在這條賽道上一直跑在世界的最前面,在語音識別、語音合成等多領域始終保持源頭技術自主創新迭代,并連續多年將國際語音合成大賽、國際多通道語音分離和識別比賽CHiME、國際語音翻譯比賽IWSLT等各項國際權威賽事冠軍收入囊中。
同時,作為語音技術與AI領域的“國家隊”,科大訊飛還是首批國家新一代人工智能開放創新平臺、語音及語言信息處理國家工程研究中心的承建方。
“科大訊飛從創業之初的夢想和使命,就是要實現溝通無障礙。25年了,我們的目標和夢想一天都沒有變。”劉慶峰稱。在通用人工智能時代,科大訊飛也緊抓大模型時代機遇,以大模型深度賦能語音技術的再度升級。在技術優勢上,借助大模型底座與全國產算力平臺,訊飛星火語音大模型將更多語音表征解耦,并融入到大模型預訓練中,提升了韻律表現力和擬人度,突破了復雜場景識別效果的上限,提升了語料稀缺小語種的效果。
從實用性上來說,配合訊飛星火大模型V3.5的理解能力和情感感知能力,語音大模型能夠實現更精細的模型描述、更精準的語義理解以及更統一的多任務建模,語音合成的韻律表現力和擬人度測試結果驚艷。自此,星火智能語音具備了更加豐富的屬性,有語種、有內容、有韻律、有音色,還有情緒,尤其是一些語氣詞的使用上能夠做到更精準、更地道。
落地應用價值向好,上下游產業共享機遇
基于以上核心技術優勢,星火語音大模型在應用落地方面帶來的可能性更讓人備感期待。
在星火認知大模型V3.5升級發布會上,科大訊飛董事長劉慶峰現場介紹了搭載語音大模型的訊飛翻譯機,即將上線多語種自動識別和增強式翻譯兩個重要功能,分別于今年1月底和3月中旬完成升級。
據悉,此次訊飛翻譯機多語種自動識別升級將支持35種語言,讓國際商務溝通、跨國旅行變得更加便捷,增強式翻譯技術讓訊飛翻譯機化身最強“AI翻譯官”,跨語言、跨文化交流更加省心出彩。
除了直接賦能C端硬件產品,星火語音大模型在未來更多現實場景中也富有深度落地的潛力。智能汽車將同時擁有具備深度語言理解能力和復雜任務處理能力的智慧大腦和智慧語音,在此基礎上,智能駕艙、智能座艙、智能導航、音樂控制等交互體驗將進一步得到優化提升。家庭生活及醫療場景下,陪伴機器人、輔診機器人、導購導游機器人、智能家居助手、穿戴式設備等產業也將隨著星火語音大模型的賦能迎來價值爆發增長的機會。
萬物互聯時代,科技進步以全民創享智慧生活為目標。“軟硬融合、智能物聯、場景賦能”已成為中國智能產業鏈全鏈條企業的發展共識。語音大模型,作為賦能智慧生活的有力說生產力工具,其與各行各業的“CP”組合究竟表現如何,將關乎著產業 經濟 發展的活力和全民生活質量的提高。星火語音大模型既有大展拳腳的決心,就期待拿出更加優異的成績,繼續領跑通用人工智能時代的語音王者之位。