訊飛汽車:星火多語言大模型發布 助力更智能的汽車走向世界
10 月 24 日,在第七屆世界聲博會暨 2024 科大訊飛全球 1024 開發者節開幕式上,科大訊飛面向 汽車 領域,發布了訊飛星火汽車端側大模型,并首次展示了星火多語言大模型在汽車座艙上的應用。
一、星火座艙一周年發布
自去年 1024 開發者節發布以來,訊飛星火智能座艙跟隨星火大模型完成多次迭代,具備了復雜語義理解、內外部信源打通、多模態交互等眾多領先能力,能夠準確理解駕乘人員需求意圖并提供快速響應服務,「雙商在線」解決各類問題,極大地提升了駕乘體驗。
自去年 1024 開發者節發布以來,訊飛星火智能座艙跟隨星火大模型完成多次迭代,具備了復雜語義理解、內外部信源打通、多模態交互等眾多領先能力,能夠準確理解駕乘人員需求意圖并提供快速響應服務,「雙商在線」解決各類問題,極大地提升了駕乘體驗。
(第二代 AION V 搭載訊飛星火大模型)
在星火大模型帶來的全新交互框架中,人車交流的應用范圍與價值回饋得到了全面提升。日均人車交互次數,從前大模型時代的 7 次,爆發增長到目前的 18 次,帶動了訊飛汽車語音產品全年交互次數,突破了 127 億次。
當前,奇瑞、廣汽、長城、長安、大眾、江淮等多家頭部汽車品牌均選擇訊飛星火大模型作為旗下主力車型的座艙智能化配置。
(長城魏牌全新藍山搭載訊飛星火大模型)
二、星火汽車端側星火大模型升級
隨著座艙算力的持續提升,以及科大訊飛芯算融合方案的不斷優化完善,本次發布會推出了汽車端側星火大模型。
傳統云端大模型,擁有參數多、算力強等優勢,但高度依賴網絡傳輸,響應延遲存在天生短板。在全新的端云一體架構中,科大訊飛充分發揮自身語音交互技術領先優勢,根據座艙場景,深度裁剪優化端側模型,將車內終端首次響應時間縮短至 40ms 的同時,識別能力相較于云端大參數模型的衰減不足 1%。在端云融合的新模式下,大模型對于復雜問題的響應時間,也將大幅縮減到 1.3S,更接近真人自然交互體驗。
隨著座艙算力的持續提升,以及科大訊飛芯算融合方案的不斷優化完善,本次發布會推出了星火端側語音交互全鏈路大模型。
傳統云端大模型,擁有參數多、算力強等優勢,但高度依賴網絡傳輸,響應延遲存在天生短板。在全新的端云一體架構中,科大訊飛充分發揮自身語音交互技術領先優勢,根據座艙場景,深度裁剪優化端側模型,將車內終端首次響應時間縮短至 40ms 的同時,識別能力相較于云端大參數模型的衰減不足 1%。在端云融合的新模式下,大模型對于復雜問題的響應時間,也將大幅縮減到 1.3S,更接近真人自然交互體驗。
(端側大模型與云端大模型效果對比)
憑借科大訊飛領先的 AI 工程實施能力,星火端側語音交互全鏈路大模型,提供多種尺寸的模型,靈活部署各類 AI 能力,全面適配國內外主流座艙芯片方案。
今年四季度,奇瑞、廣汽、長城等品牌的多款車型,將搭載訊飛星火端側語音交互全鏈路大模型上市交付。!
(奇瑞星途星紀元 ET 將升級星火端側大模型)
三、星火座艙大模型加速走向世界
隨著中國新能源智能汽車出海步伐的加快,多語言車載語音需求持續爆發增長。科大訊飛 2024 年多語言車載語音產品交付量預計將超過 100 萬套。[1]
受限于海外市場規模小,語種分布碎片化,當前出口車型語音產品尚未接入大模型,座艙交互體驗遠不如國內車型。針對這一情況,科大訊飛董事長劉慶峰在本次發布會上帶來了星火多語言大模型,在既有的中英文之外,新增了法語、德語、日語、韓語、俄語、阿拉伯語、西班牙語及葡萄牙語八種主要的國際語言,整體效果達到了 GPTchatgpt-4o 96% 的水平,完全滿足各類終端實際應用需求。
(多語言大模型整體效果達到 GPT-4o 96% 水平)
「如果中國的大模型廠商都只做中文,全球沒有第二種選擇,我們就必然會被鎖在中國范圍之內。我們不光是要把這 8 個已經開放的語種能力不斷提升,對標全球最好的水平,還要針對真實應用場景做到全球最好,并且不斷擴大我們的語種范圍,我們一定要代表中國給世界提供第二種選擇。」科大訊飛董事長劉慶峰表示,將持續投入多語言大模型,在全球市場上,繼續推動中國汽車智能座艙的產品優勢。
(奇瑞海外車型采用訊飛多語言車載語音)
目前中國汽車出海品牌十強中,有八家采用了科大訊飛多語言車載語音產品,多家國際車企也已將科大訊飛多語言產品納入到全球供應鏈體系中。隨著多語言大模型的上車,全世界更多的車主,將有望享受到來自中國的智能座艙的 科技 普惠。