Google DeepMind представила SIMA 2 (Scalable Instructable Multiworld Agent) — второе поколение ИИ-агента для виртуальных 3D-миров. Новая версия построена на базе моделей Gemini 2 и способна действовать не по заранее прописанным сценариям, а на основе понимания цели.
Агент общается с пользователем текстом, голосом или изображениями, самостоятельно строит план действий и может объяснить, почему принимает то или иное решение. Подробности в материале Postium.
Читайте также: 10 лучших курсов по работе с нейросетями
Что умеет SIMA 2 и как он работает
1. Продвинутые рассуждения. SIMA 2 обучен достигать высокоуровневых целей — от «построй базу» до «доберись до маяка» — и разбивать их на конкретные шаги. DeepMind отмечает, что агент теперь способен самостоятельно планировать и анализировать свои действия, что делает его похожим на напарника, а не на исполнителя команд.
2. Обобщение навыков. ИИ демонстрирует способность переносить знания между разными играми и движками. Например, усвоив механику «майнинга» в No Man’s Sky, он применяет похожие принципы к «сбору урожая» в Valheim. В тестах агент уверенно работает в играх, которых раньше не видел, — Goat Simulator 3, Teardown, Hydroneer и других.
3. Самообучение. SIMA 2 обучается через пробы и ошибки, получая обратную связь от Gemini. С каждой сессией агент улучшает стратегию и координацию, без дополнительной разметки со стороны людей. Это делает систему ближе к «самообучающемуся» искусственному интеллекту.
4. Мультимодальное взаимодействие. Пользователь может описать задачу текстом, голосом или показать на изображении нужный объект. Агент способен «понять» контекст и выполнить инструкцию. В DeepMind подчёркивают, что это один из первых ИИ-агентов, который одновременно видит, слышит и говорит в интерактивной среде.
Пока SIMA 2 остаётся исследовательским проектом. Он используется внутри Google DeepMind и доступен партнёрским разработчикам для тестирования. Публичный релиз или открытый SDK пока не анонсированы.
Почему это важно?
Первая версия — SIMA 1, показанная весной 2024 года, — умела выполнять инструкции в девяти играх, созданных партнёрскими студиями, включая No Man’s Sky, Teardown и Valheim. Но SIMA 1 ограничивалась «копированием действий» и не умела рассуждать.
SIMA 2 делает шаг к универсальному агенту: теперь она способна учиться без разметки, адаптироваться к новым мирам и объяснять логику своих решений.
DeepMind называет игры «идеальной тренировочной площадкой» для будущих универсальных ИИ-агентов. Виртуальные миры позволяют агенту столкнуться с теми же задачами, что и в реальном мире — планирование, навигация, взаимодействие с объектами, решение проблем.
Опыт, полученный в играх, можно применить в робототехнике, системах автономного управления или продвинутых ассистентах, которые действуют не по скрипту, а по смыслу.
Ранее World Labs запустила Marble — ИИ-генератор «реалистичных» 3D-миров.