騰訊游戲攜手中科院高能所粒子天體物理重點實驗室,公布“AI技術實現天文衛星星座的協同觀測”合作項目 | 速途網
速途網6月27日消息(報道:李楠)昨日,騰訊游戲宣布將以人工智能(AI)技術助力中科院高能所粒子天體物理重點實驗室“全變源追蹤獵人星座”(CATCH:Chasing All Transients Constellation Hunters)計劃,該合作有望將我國空間天文觀測技術推向新的高度,并且在時域天文學的后隨觀測上做出重要貢獻。
CATCH計劃是粒子天體物理重點實驗室提出的、由上百顆微衛星組成的智能化X射線天文星座,計劃于2030年前后全面部署,其核心科學目標是“刻畫極端宇宙的多維度動態全景”。騰訊游戲和粒子天體物理重點實驗室的合作致力于推動多智能體強化學習算法在CATCH星座的協同觀測方面的應用。屆時,CATCH計劃將利用騰訊游戲在業界領先的AI技術,實現星座的在軌自主協同觀測等功能。
騰訊游戲CROS AI研發團隊在游戲中訓練的AI智能體已達到頂尖玩家的水準;該團隊還創新地推出了人機協作、人機對抗等應用,在豐富了玩家體驗的同時,提升了協作效率。隨著AI技術的不斷發展,人機協作在過去的探索中取得了較好的應用效果,“理解-溝通-協作”的方式也幫助系統更高效地實現了既定目標。

CATCH星座在AI技術配合下協同觀測目標天體的想象圖
正如騰訊游戲CROS AI研發團隊所開發的AI智能體,其智能與敏捷源于學習沉淀自上億局“人機模式”游戲對戰的經驗;CATCH計劃所使用的多智能體協同算法也在“深度學習”過往的天文觀測數據。目前,騰訊游戲的算法工程師們結合我國天文衛星的爆發源數據,初步搭建了爆發源仿真模擬器,用以訓練專屬于太空觀測環境的AI算法。當CATCH星座在太空中運行時,將借助上述算法對深空中成千上萬的爆發源數據進行實時分析,調度衛星執行目標選擇、指向調整、編隊組合等觀測指令,對觀測目標進行全天、全時監測,后期還將根據觀測結果進行持續性的算法優化。
如何操控上百顆衛星更高效地觀測宇宙中的爆發源和變源天體?早在CATCH概念提出的時候,科學家們就意識到了這樣的挑戰。以傳統的經驗來看,單顆衛星的天文觀測往往就需要一支專門的團隊來運行;而對于體量高達百顆衛星的CATCH星座來說,這似乎是一個不可能完成的任務。為此,騰訊游戲CROS AI研發團隊與空間和天文方面的專家進行了充分的討論,提出了更為理想的解決方案:利用游戲AI最新的訓練技術——多智能體強化學習方法,來控制衛星協同合作,完成各類觀測任務,實現觀測計劃的最優化。
具體來說,該團隊為模型訓練配備了高并發的分布式環境,可以支持接入上萬路模擬環境同時訓練,還能利用訓練樣本,進行分布式訓練;同時結合團隊最新研發的模型壓縮、部署優化方案,以便有效地平衡空間信號的感知、控制精度的要求和衛星算力的限制,高效地完成多顆衛星的協同觀測任務。這一方案既包含滿足科研目的的精度要求,也符合太空環境實時調度的算力要求,還能夠支持大規模算力的基礎系統架構要求。
騰訊游戲AI多智能體算法早前已經應用在英雄聯盟手游、火影忍者手游等多人在線戰術競技游戲中。具體來說,游戲AI可以通過多智能體深度學習與強化學習訓練,使其自身對戰水平得以匹配大多數玩家的水平。在“去中心化”的多智能體算法調度下,游戲AI不僅可以和玩家進行能力配合,還能使玩家體驗到不同風格的戰術。另外,在針對游戲AI的訓練中,提升輸出強度并非單一的訓練目標,而是需要平衡一系列的量化指標:從戰斗能力、防守能力,到與隊友的配合程度等,多維度量化分析最優博弈策略,并通過不斷優化訓練參數,提升游戲AI的綜合性能。
“騰訊的研發人員很快就理解了我們的研究重點,并對我們的研究方向展現了極高的興趣。”CATCH計劃負責人、青年科學家陶煉這樣評價與騰訊游戲的合作,“如果能夠提煉出游戲技術中有價值的部分,正確應用于各行各業,這對國家、對科技的發展都是一件很好的事。”
當下,游戲技術的作用力正在“外溢”到現實世界,游戲的形態與邊界也在不斷地升級和突破。在“超級數字場景”認知升級一年后,騰訊游戲也有意識地將游戲技術跨界應用于“工業”、“文化”、“科研”等多個現實領域,持續探索游戲技術的多元價值。
騰訊游戲CROS研發效能部AI研發團隊,業務范圍覆蓋游戲AI研發及智能NPC制作、美術自動化、物理仿真、動作捕捉等游戲研發相關前沿技術領域。團隊曾支持騰訊多款游戲產品,如英雄聯盟手游、火影忍者手游、QQ飛車等。其中基于多智能體深度強化學習技術制作的智能機器人和智能NPC(Non-Player Character非玩家角色),已形成成熟的AI制作平臺,能夠極大地提升研發效率,優化用戶體驗。該團隊在前沿學術研究方面持續鉆研,相關研究成果論文已發表在NeurIPS、CVPR、AAAI、SIGGRAPH等學術會議上。