巨人網絡發布“千影”有聲游戲大模型,加碼“游戲+AI”賽道 | 速途網
12月12日消息,巨人網絡在2024年度中國游戲產業年會上發布“千影 QianYing”有聲游戲生成大模型,加碼“游戲+AI”賽道。“千影 QianYing”包含游戲視頻生成大模型YingGame、視頻配音大模型YingSound,實現了有聲可交互游戲視頻生成的新突破。

與此同時,巨人網絡啟動“千影共創計劃”,基于大模型底座技術,對外開放模型技術、模型應用、原創游戲項目等方面的合作共創、應用落地、人才招募,加速布局“游戲+AI”從降本增效向顛覆式創新的快速轉化。
YingGame由巨人網絡AI實驗室聯合清華大學SATLab研發,是首個實現角色多樣運動與個性化、具備強物理模擬特性的游戲視頻生成大模型,可生成開放世界游戲視頻,通過文本、圖像或鍵盤、鼠標操作實現角色動作的交互控制,并自定義游戲角色,同時具備更好的游戲物理仿真特性,無需傳統游戲的3D模型制作和引擎渲染環節。結合自研視頻配音大模型YingSound,能夠根據畫面生成與之匹配的復雜音效,實現有聲游戲視頻。
YingSound是由巨人網絡AI實驗室、西北工業大學ASLP Lab和浙江大學聯合研發的視頻配音大模型(Video-to-Audio Model,V2A),擁有超強的時間對齊、視頻語義理解能力,無需人工輸入提示詞,端到端為各類視頻生成多種類型的高精細度音效,涵蓋真實場景視頻、動漫視頻與游戲視頻等,具備多樣化應用場景泛化能力。
今年以來,大模型技術在視頻領域取得了突破性進展。對于游戲行業,視頻生成能力有望替代傳統游戲生產方式,極大提高游戲發行內容的創作效率;長期來看,其涌現出對3D模型的理解以及強大的物理世界仿真能力和泛化能力,將對游戲生產管線、交互方式、游戲玩法產生深遠影響,被認為是完全由數據驅動的下一代“游戲引擎”。
巨人網絡表示,“千影 QianYing”有聲游戲大模型展示了通過文字描述實現游戲創造的一種可行性,目前尚處于技術打磨階段,AI實驗室將持續推進模型能力的升級迭代。
巨人網絡已建立起以自研大模型為核心的全方位基礎能力,擁有行業領先的AI 工業化生產全流程解決方案。旗下通用認知對話大模型“GiantGPT”、語音大模型“Bailing-TTS”、高效編碼大模型“CodeBrain”等在核心游戲業務規模化應用,已形成高效的生產鏈路閉環。首創基于自研多智能體大模型的全新產品范式,實現大模型在復雜決策場景落地從0到1的突破。隨著“千影 QianYing”有聲游戲生成大模型的發布,巨人網絡實現了多模態全矩陣布局。
今年初,巨人網絡董事長史玉柱提出該公司在“游戲+AI”領域的愿景,希望探索打造一個AI游戲孵化平臺,旨在降低游戲開發的門檻,讓普通人也能開發游戲。“千影 QianYing”游戲大模型的最新進展,意味著這一愿景邁出了新一步。