企業(yè)級AI的未來:IBM實現(xiàn)通用型企業(yè)級AI智能體的重大突破
在AI發(fā)展日新月異的今天,AI智能體無疑正處在技術(shù)前沿。近日,IBM發(fā)布了 通用型企業(yè)級AI智能體 (IBM Computer Using Generalist Agent,此后簡稱IBM CUGA)的重要突破,引發(fā)業(yè)界廣泛關(guān)注。繼 Think 2025大會上發(fā)布AI 智能體平臺watsonx Orchestrate后,IBM研究院在企業(yè)級智能體領(lǐng)域再次邁出了實質(zhì)性的一大步。
如今,IBM CUGA不僅在模擬企業(yè)場景中經(jīng)受住了嚴苛測試,更在最新(2025年7月)的 AppWorld Benchmark 中榮登第一 (注:AppWorld Benchmark 是一個由多個研究機構(gòu)和學者共同創(chuàng)建、用于評估交互式編程智能體的基準測試環(huán)境)。在不久的未來,我們或許能看到AI 智能體逐步從“實驗室玩具”邁向“企業(yè)核心助手”。
通用型企業(yè)級AI智能體是什么?為何重要?
傳統(tǒng)AI智能體在企業(yè)應用中多是“單一功能專家”——比如處理發(fā)票、生成郵件、跟蹤銷售進度等。這些功能雖然實用,但面對跨流程、跨系統(tǒng)、跨業(yè)務的復雜場景時,往往會顯得力不從心。
IBM CUGA 正是為復雜業(yè)務場景而生。它是一種能夠 跨多個業(yè)務場景、整合多種工具、執(zhí)行復雜任務的通用型智能體 ,可以像資深員工一樣理解用戶意圖、規(guī)劃任務、調(diào)用工具、協(xié)調(diào)多個系統(tǒng),并不斷學習和適應新的挑戰(zhàn)。
榮耀背后,是技術(shù)進階和厚積薄發(fā)
IBM CUGA的出現(xiàn)并不是一蹴而就的,它是 架構(gòu)進化、方法創(chuàng)新和工具集成 的系統(tǒng)性成果:
·? 架構(gòu)演進 :從最初簡單的“計劃-執(zhí)行-觀察”模型(完成率15%),進化到如今能協(xié)調(diào)多個子智能體、感知網(wǎng)頁環(huán)境、處理復雜任務的多層級系統(tǒng), 任務完成率提升到 61.7% 甚至更高 。[i]
·? 工具賦能 :
o? 實時性能儀表盤 ,掌握每一個智能體動作的效果;
o? 軌跡可視化工具 ,直觀診斷失敗原因;
o? 并行執(zhí)行框架 ,將評估速度從數(shù)天壓縮到數(shù)分鐘。
·? 多智能體協(xié)作 :一個任務由多個“子任務智能體”協(xié)同完成。比如,規(guī)劃、執(zhí)行、信息提取各司其職,讓智能體能像團隊一樣作戰(zhàn)。
·? 環(huán)境感知增強 :結(jié)合網(wǎng)頁截圖和可訪問性樹,智能體看得更清、操作更準,還能識別彈窗等障礙進行規(guī)避。
安全、可信、可控的智能體平臺,打造適配業(yè)務需求的AI智能體
IBM不僅關(guān)注智能體的“聰明程度”,更重視它的“ 企業(yè)適配能力 ”。借助最新發(fā)布的企業(yè)級AI 智能體平臺watsonx Orchestrate,客戶有望實現(xiàn):
·? 全生命周期可觀測性 ,兼顧性能監(jiān)控、模型優(yōu)化、安全防護;
·? 無代碼與專業(yè)工具并存 ,既支持業(yè)務人員快速部署,也支持開發(fā)者深度定制;
·? 兼容超過80種企業(yè)級系統(tǒng) ,與Adobe、SAP、Salesforce、ServiceNow等生態(tài)無縫集成;
·? 治理與合規(guī) ,為隱私、安全、成本可控提供保障,幫助企業(yè)實現(xiàn)AI治理與合規(guī)。
真正的“ 企業(yè)AI助手 ” 正在加速來到
除了在AppWorld基準測試奪魁,IBM CUGA還在WebArena等真實瀏覽器任務中展現(xiàn)強大能力。通過“智能采樣”、“反饋反射”、“知識注入”等一系列創(chuàng)新方法, CUGA每一次迭代都更接近企業(yè)級實用標準 。
IBM CUGA不是實驗室的“炫技”,而是指向未來企業(yè)運營方式的變革。 在準確率達到更高門檻后,CUGA有望成為企業(yè)內(nèi)部的通用調(diào)度平臺 ——不再是被動響應用戶指令,而是主動協(xié)助完成復雜的工作任務,例如跨系統(tǒng)的數(shù)據(jù)整合、文檔生成、流程管理等。
團隊心聲
“CUGA的成功,不是因為某一個神奇的模型,而是靠IBM團隊對創(chuàng)新的執(zhí)著、對真實企業(yè)需求的深刻理解。感謝每一位參與其中的工程師、研究員和產(chǎn)品經(jīng)理?!保ㄗ髡撸簠敲暨_,IBM 科技 事業(yè)部數(shù)據(jù)與人工智能資深技術(shù)專家)
作者簡介 :吳敏達是 The Open Group 卓越級技術(shù)專家(Distinguished Technical Specialist),同時擁有計算機技術(shù)與軟件專業(yè)系統(tǒng)架構(gòu)設計師技術(shù)資格。他現(xiàn)在是 IBM 科技事業(yè)部數(shù)據(jù)與人工智能資深技術(shù)專家,擁有 20 多年數(shù)據(jù)分析軟件相關(guān)技術(shù)經(jīng)驗,是 IBM 認證的大數(shù)據(jù)架構(gòu)師和 Watson 開發(fā)者,專長是大數(shù)據(jù)、人工智能等領(lǐng)域。他是 IBM Developer 的大師級作者,已經(jīng)發(fā)表了 40 余篇技術(shù)文章和教程。現(xiàn)從事大數(shù)據(jù)、人工智能相關(guān)技術(shù)支持和架構(gòu)設計工作。
參考資料
[i]?數(shù)據(jù)來源:IBM CUGA開發(fā)者網(wǎng)頁