科大訊飛劉慶峰:我們現(xiàn)在已經(jīng)做了一批智能體
i黑馬導語
劉慶峰 ,科大訊飛股份有限公司董事長,中國人工智能領軍企業(yè)帶頭人。科大訊飛股份有限公司,是“863 計劃”哺育出的企業(yè)之一。他們的口號是用人工智能建設美好世界。
什么是863計劃?1986年國務院組織了全國200多位科學家對計劃建議進行了大半年的論證,在中國科學技術需要急起直追的年代,863計劃經(jīng)過30年的實施,有力地促進了中國高技術及其產(chǎn)業(yè)發(fā)展。
經(jīng)i黑馬編輯,以下為劉慶峰分享的內容:
今天很高興再次來到天津參加“世界智能產(chǎn)業(yè)博覽會”。
過去一年,大模型的進步讓信息分發(fā)獲取、內容生產(chǎn)、全自然的交互等,都有了全新進展。這些不僅改變了科研范式,還在改變著產(chǎn)業(yè)形態(tài)和競爭格局。
所以,高盛去年預測, 通用人工智能將推動全球年均GDP增長7%; Gartner預測,到2026年現(xiàn)在80%企業(yè)都要用到通用人工智能,而今天這個數(shù)字是5%左右。
今年 3 月份,政府工作報告首次提出“人工智能+”。早在1月30號,科大訊飛就推出了 中國首個基于全國產(chǎn)算力訓練的全民開放大模型。 所謂全民開放大模型,就是大家可以下載、隨時使用的星火3.5大模型。
01
星火4.0全面對標GPT-4 Turbo
今天國際上最好的、綜合實力最高的,還是 GPT-4 Turbo。
我們可以看到,根據(jù)中科院人工智能產(chǎn)宣創(chuàng)新聯(lián)盟和認知智能國家重點實驗室,給出的 7 個維度、 481 個測試項,完全用真實數(shù)據(jù)隨機測試的結果顯示,我們已經(jīng)非常接近 GPT-4 Turbo 的最新水平。
過幾天,我們將發(fā)布星火 4.0大模型,全面對標GPT-4 Turbo當前水平。這個對標,不僅是中文,還包括英文寫作等相關能力。
當然,今天看起來我們與美國最好的大模型僅一步之遙,但 如果OpenAI發(fā)布GPT-5 ,我們的差距就會進一步拉大到一年左右。
為什么?因為人家算力更多,數(shù)據(jù)更多,模型更大。
但是我們有信心繼續(xù)快速追趕,確保中國通用大模型底座不會與美國出現(xiàn)代差。 只要大模型底座能跟上,我們在各個專業(yè)領域和垂直行業(yè),就有可能實現(xiàn)超越。
給大家舉幾個例子,今年高考后,訊飛星火在中英文的作文和數(shù)學測試題方面,都處在領先地位。尤其是語文作文現(xiàn)在已經(jīng)能達到 52 分。
6月7號中午,重慶日報的“新重慶客戶端”,就拿星火大模型寫了一篇《當AI知道今年高考作文討論自己,于是TA馬上寫了一篇……》,引起了整個人工智能專家組和市民的極大的關注,都認為寫得非常好。
去年年初, GPT-3.5通過了谷歌二級程序員測試,現(xiàn)在我們星火大模型的代碼能力,已經(jīng)全面超過了當時的 GPT 3.5,并與 GPT 4 非常接近。在代碼設計、生成以及測試等方面,都可以大幅提效。 過去一年,我們代碼采納率已從 30% 提升到了 52% 以上。
今天的產(chǎn)業(yè)數(shù)字化和數(shù)字產(chǎn)業(yè)化,代碼和軟件定義一切。代碼能力,其實是未來大模型賦能產(chǎn)業(yè)的一個核心能力。
在大模型推動的知識學習中,大家都非常關注長文本能力。
最近,我們不僅是文本和圖片,還可以是錄音。比如,今天上午兩三個小時的演講錄音和PPT,丟給我們的星火大模型,馬上可以跟它提各種問題,比如什么是有溫度的智能體。
02
我們已經(jīng)做了一批智能體
那么, 智能體是什么概念?
通過大模型的語義理解和任務規(guī)劃,你給它一個任務,它馬上就知道這個任務要對應到哪些任務內容。
每個任務應該調用什么樣的工具,這些工具在內部和外部調取什么樣的信息,最后完成任務并匯總結果。
我們現(xiàn)在已經(jīng)做了一批的智能體。
比如,我們中標了國人集團的大模型后,其中一個功能已在國資委網(wǎng)站上發(fā)了,就是招標助手。
它可以自動識別標書文件的關鍵內容,自動去看投標企業(yè)資質怎么樣,價格分怎么樣,最后給出來評標結果。
過程中,還可以自動去查各種證照文件是否真實、是否被修改過,把內外很多信息全部打通了,這就是智能體。
03
中國一定要建立
自主可控的大模型底座能力
過去一年,大家看到了很多國際上的熱點。
比如去年9月份的GPT-4V(有視覺功能的 GPT-4)、 11 月的 OpenAI-whisper (語音識別大模型)、今年2月份的Sora,和5月份的 GPT-4o。
看起來很熱鬧,實際上本質上還是 GPT-4 的底座能力。 沒有這個底座的理解能力和生成能力,就不可能有上面這些熱點。
比如 Sora ,其實根本不是對物理世界的認知又上了一個臺階,本質上是用GPT-4V來對視頻打標簽,從而更容易訓練。
原來靠人工標簽,工作量太大。當然,他們還用了 GPT 的框架,對視頻的生成做了一些改寫。
所以, 中國一定要建立自主可控的底層通用大模型能力。 在這個基礎上,我們才可能有行業(yè)垂直賽道。
底層通用大模型能力達到最高的天花板后,再做剪枝或蒸餾,做出有各種各樣的小模型,也能走在世界前列。
底層通用大模型,是中國這一波通用人工智能是否可以跟美國對標的核心點。
也就是說, 有了底座能力的提升,中國所有人工智能研究在未來兩年之內,都應該用大模型的邏輯重寫一遍。
但原來很多垂直專業(yè)領域的技術與大模型結合,可以讓我們超過美國通用大模型能達到的水平,這是“通”和“專”結合的過程。
現(xiàn)在中國已經(jīng)有極少數(shù)底層通用大模型具備了緊緊跟隨美國的能力。比如,今年1月份,星火語音大模型已經(jīng)在 37 個主流語種上全面超越了他們。這37個語種,不是我們定義的,是國家定義的。
GPT-4o出來后,大家興奮的是,他們把語音交互做到了極致;比較失望的是,它的理解能力并沒有很大的提升,實際上是工程化的提高。
超擬人合成,像真人一樣說話,隨時可以打斷的交互,以及兩三百毫秒的反應,實際上是大概六七百毫秒。
這些,其實我們的語音大模型全部都在對標,而且很多東西是我們提出來的。比如,一句話復刻,你只要對著訊飛星火說一句話,馬上就可以模仿你的聲音。
04
去年新增 200 多萬開發(fā)者團隊
當然,大模型不是萬能的。
我們可以看到,有些任務上通用模型能解決的很好,有些任務上則需要做定制優(yōu)化,還有些任務其實挺難的。
比如,高難度的數(shù)學,需要復雜的長鏈條推理。相關知識問答和開放領域的智能體驗,短期內還不太容易做到好用。所以,我們今天既有大模型應用落地課題,也有了持續(xù)研究和探索的方向。
比如在教育領域,我們在河西區(qū)打造的標桿,就成了教育部的全國標桿。在很多一線特別缺的小學科教學中,大模型都可以很好地賦能。比如科普、編程、信息課、口語老師、心理輔導等。
在我們的展廳,大家可以看到,孩子可以跟愛因斯坦、李白、祖沖之對話。原來孩子腦洞大開的問題,老師解答20%左右,現(xiàn)在有了星火大模型與中國科協(xié)的科普中國合作,現(xiàn)在基本上都可以回答,孩子的上課的手率從16%提到了73%。
在最熱的能源行業(yè),中國石油、中國能源集團、中國綠發(fā),都在用星火大模型來提升人員相關的調度、管理和一線的相關安全等。
比如,合肥綜合性國家科學中心能源研究院,是要做中國人造小太陽的。現(xiàn)在用我們的大模型賦能科研,已經(jīng)有了很好的階段性進展,今天10月份就會發(fā)布。我們跟科大做的化學家,原來要做1400 年的催化劑實驗,現(xiàn)在兩個禮拜就做出來了。
比如,在汽車出海領域,去年 500 萬輛汽車出海,很多都用了我們的多語言能力。不僅是國內車企,最近大眾跟訊飛星火已經(jīng)合作發(fā)布了一系列的技術,他自認為測試效果已經(jīng)超過了ChatGPT。
今天大模型落地,絕不能僅僅是后臺的、純軟件的,還一定要落到實處。不能只是泛娛樂化,要能夠實用,軟硬件結合的、云邊端結合。
今天我們有適合在手機上用的 1.3-2.6 B 模型,有適合在汽車上用的7- 10 B 模型,也有 13B 和175B 的模型,從幾千萬到上千億、上萬億的都要有。如何幫大家用更小的計算成本和代價,實現(xiàn)更好的效果。這是中國大模型應用落地能否全球走在前列的關鍵課題。
我非常高興,今天在能源、汽車,家電等領域,都有了很好的應用。中國第一個家電的大模型落地是海爾招標的,我們中標后,現(xiàn)在已經(jīng)做得很好。目前,我們已經(jīng)跟 20 多個行業(yè),共同開發(fā)了行業(yè)大模型。一定是以行業(yè)為主,再用大模型來賦能。
再以星火 APP 為例,下載量已經(jīng)超過一個億,客戶使用的最高峰不是周末,而是在工作日。高峰時段主要是工作日上午 9 點半,以及下午 3 點半到 4 點。
從訊飛開發(fā)者生態(tài)也能看到, 過去一年,我們的人工智能開放平臺上已經(jīng)新增了 200 多萬的開發(fā)者團隊,海外開發(fā)者團隊增長了260%多。 大模型直接相關的 54 萬開發(fā)者團隊,其中一大半是企業(yè)而不是個人。
不只是做各種APP,還在工業(yè)生產(chǎn)、研產(chǎn)、供銷、等各個環(huán)節(jié)做賦能。在天津,開發(fā)者團隊數(shù)量也已經(jīng)接近 10 萬家了,我們正在積極打造北方深谷。
所以我說,每次到天津,即便聲音嘶啞,也一樣是兩眼放光、充滿激情,我們期待著跟大家一起擁抱這一次通用人工智能的浪潮,共同來解放現(xiàn)有生產(chǎn)力,釋放每個人和每一個產(chǎn)業(yè)方向、每個企業(yè)的想象力,共同用人工智能建設美好天津。
