AI & Big Data 前天 19:02
Google DeepMind发布新一代游戏AI代理SIMA 2,集成Gemini模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Google DeepMind发布了新一代游戏人工智能代理SIMA 2,该代理集成了Gemini模型,使其不仅能执行指令,还能在3D游戏世界中进行推理、解释行动并自我提升。SIMA 2在第一代SIMA的基础上,能够通用地操作多种3D虚拟世界,学习超过600种操作技能,且不依赖游戏内部API。新版本能够解析高阶目标并拆解为子步骤,还能用自然语言向玩家解释行动原因。通过结合人类示范和Gemini生成的标注数据进行训练,SIMA 2在陌生游戏中的泛化能力显著提升,更能理解复杂模糊的指令,并将学习到的概念迁移到新游戏中。与世界模型Genie 3结合后,SIMA 2能在全新环境中快速适应并规划行动。SIMA 2还具备自我优化能力,通过Gemini充当教練,进行试错学习,在没有新增人类数据的情况下完成挑战。

🤖 **Gemini驱动的推理与解释能力:** SIMA 2的核心亮点在于其集成了Google的Gemini模型,使其具备了在3D游戏世界中进行高级推理的能力。它不仅能执行简单的导航指令,更能解析复杂的用户目标,将其分解为一系列可执行的子步骤。更重要的是,SIMA 2能够以自然语言向用户解释其即将采取的行动及其背后的原因,大大增强了人机交互的透明度和理解度。

🌐 **跨游戏通用性与泛化能力:** SIMA 2在前代SIMA项目的基础上,进一步提升了在多种3D虚拟世界中的通用操作能力。它能够学习并执行超过600种语言操作技能,并且完全不依赖游戏内部的API,仅通过观察屏幕和模拟键盘鼠标输入来完成任务。Gemini模型的引入显著增强了SIMA 2在陌生游戏中的泛化能力,使其能够理解更长、更模糊的指令,并将在一个游戏中学习到的概念(如“挖矿”)迁移应用到另一个游戏中(如“采集”),表现更接近人类玩家。

🔄 **自我优化与持续学习机制:** SIMA 2引入了强大的自我优化能力。在初始阶段,代理通过模仿人类示范来学习,随后可以切换到完全自主的游戏阶段,通过试错来积累经验。Gemini模型在此过程中扮演“教练”的角色,负责提出任务并为代理的行为评估奖励分数。这些经验数据被存储起来,用于训练更强大的代理版本。实验证明,SIMA 2可以在没有新增人类数据的情况下,通过几代自我训练,完成最初无法完成的任务,展现了其持续进化的潜力。

✨ **与世界模型Genie 3的协同作用:** SIMA 2与Google DeepMind的世界模型Genie 3相结合,进一步拓展了其应用边界。Genie 3能够即时生成全新的3D互动世界,这些世界在场景、物件和规则上都可能与现有游戏截然不同。在这种前所未有的环境中,SIMA 2依然能够快速识别自身位置、可互动对象,并理解用户目标,采取合理的行动。这表明SIMA 2已不再局限于固定关卡的“背题”,而是开始具备在全新、未知环境中进行适应和规划的能力。

Google DeepMind公布新一代遊戲人工智慧代理SIMA 2,延續先前SIMA計畫看著螢幕、操作虛擬鍵盤與滑鼠來學習遊戲的方式,這次Google把Gemini模型嵌入代理核心,讓人工智慧不只是聽指令,還能在3D遊戲世界裡推理目標、解釋自己的行動,並透過自我練習持續變強。

SIMA專案最初目標是打造能在多款3D虛擬世界通用的代理,第一代SIMA已能在多款商業遊戲中學會超過600種語言操作技能,例如轉向、爬梯子、開地圖,完全不讀遊戲內部API,只依賴畫面與虛擬鍵盤滑鼠輸入行動。

SIMA 2在這個基礎上換上Gemini作為推理引擎,代理不僅接受導航至特定位置這類指令,還會先解析使用者高階目標,再自行拆成子步驟,邊行動邊用自然語言向玩家說明接下來的行動與原因。研究團隊結合附有語言標註的人類示範影片,以及Gemini生成的標註資料進行訓練,讓代理從人類與模型兩種來源學會在遊戲中行動與解說。

Gemini的導入也明顯拉高了SIMA 2在陌生遊戲中的泛化能力,DeepMind表示,新版代理更能理解長且複雜、語氣較模糊的指令。同時DeepMind強調,代理會把在某款遊戲中學到的概念轉化應用到另一款遊戲,例如把挖礦的概念對應到另一款遊戲中的採集,在廣泛任務上的表現更接近人類玩家。

研究團隊將SIMA 2與自家世界模型Genie 3結合。Genie 3可以從一張圖片或一段文字即時生成新的3D互動世界,場景、物件與規則與現有遊戲完全不同。在這些先前從未出現過的世界裡,SIMA 2仍能快速辨識自己所在的位置與可互動的物件,理解使用者給出的目標,並採取朝目標前進的合理行動。研究團隊認為,這顯示代理不再只是在固定關卡裡背題,而是開始具備在全新環境裡適應與規劃的能力。

SIMA 2的一大亮點是自我最佳化能力,DeepMind描述,在起始階段代理仍然依靠人類示範學習,但之後可以切換到完全由自己玩遊戲的階段,透過嘗試錯誤累積經驗。Gemini在這裡扮演教練角色,負責提出任務,替代理的行為估算獎勵分數,而這些任務與回饋會被存入經驗資料庫,作為下一輪訓練更強版本代理的素材。實驗顯示,在ASKA與Genie 3生成世界中,初版SIMA 2原本完成不了的任務,經過幾代自我練功之後,代理可以在沒有新增人類遊玩資料的情況下完成原先失敗的挑戰。

官方把這個研究視為朝向通用人工智慧與未來具身人工智慧機器人的重要一步。 SIMA 2目前以限量研究預覽方式,優先開放給少數學界與遊戲開發者試用,希望先累積更多回饋與風險評估,再決定後續更大規模應用的方向。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

SIMA 2 Google DeepMind Gemini 游戏AI 具身智能 人工智能代理 SIMA Genie 3
相关文章