Google DeepMind представила SIMA 2 (Scalable Instructable Multiworld Agent) — второе поколение ИИ-агента для виртуальных 3D-миров. Новая версия построена на базе моделей Gemini 2 и способна действовать не по заранее прописанным сценариям, а на основе понимания цели.

Агент общается с пользователем текстом, голосом или изображениями, самостоятельно строит план действий и может объяснить, почему принимает то или иное решение. Подробности в материале Postium.

Реклама. Erid 2VtzquyAJcf. ООО «Клик.ру». Клик.ру
Реклама. Erid 2VtzqvfByDy. ООО «Клик.ру». Клик.ру

Читайте также: 10 лучших курсов по работе с нейросетями

Что умеет SIMA 2 и как он работает

1. Продвинутые рассуждения. SIMA 2 обучен достигать высокоуровневых целей — от «построй базу» до «доберись до маяка» — и разбивать их на конкретные шаги. DeepMind отмечает, что агент теперь способен самостоятельно планировать и анализировать свои действия, что делает его похожим на напарника, а не на исполнителя команд.

2. Обобщение навыков. ИИ демонстрирует способность переносить знания между разными играми и движками. Например, усвоив механику «майнинга» в No Man’s Sky, он применяет похожие принципы к «сбору урожая» в Valheim. В тестах агент уверенно работает в играх, которых раньше не видел, — Goat Simulator 3, Teardown, Hydroneer и других.

3. Самообучение. SIMA 2 обучается через пробы и ошибки, получая обратную связь от Gemini. С каждой сессией агент улучшает стратегию и координацию, без дополнительной разметки со стороны людей. Это делает систему ближе к «самообучающемуся» искусственному интеллекту.

4. Мультимодальное взаимодействие. Пользователь может описать задачу текстом, голосом или показать на изображении нужный объект. Агент способен «понять» контекст и выполнить инструкцию. В DeepMind подчёркивают, что это один из первых ИИ-агентов, который одновременно видит, слышит и говорит в интерактивной среде.

Пока SIMA 2 остаётся исследовательским проектом. Он используется внутри Google DeepMind и доступен партнёрским разработчикам для тестирования. Публичный релиз или открытый SDK пока не анонсированы.

Почему это важно?

Первая версия — SIMA 1, показанная весной 2024 года, — умела выполнять инструкции в девяти играх, созданных партнёрскими студиями, включая No Man’s Sky, Teardown и Valheim. Но SIMA 1 ограничивалась «копированием действий» и не умела рассуждать.

SIMA 2 делает шаг к универсальному агенту: теперь она способна учиться без разметки, адаптироваться к новым мирам и объяснять логику своих решений.

DeepMind называет игры «идеальной тренировочной площадкой» для будущих универсальных ИИ-агентов. Виртуальные миры позволяют агенту столкнуться с теми же задачами, что и в реальном мире — планирование, навигация, взаимодействие с объектами, решение проблем.

Опыт, полученный в играх, можно применить в робототехнике, системах автономного управления или продвинутых ассистентах, которые действуют не по скрипту, а по смыслу.

Ранее World Labs запустила Marble — ИИ-генератор «реалистичных» 3D-миров.

⭐ Наш Telegram-канал, где мы показываем, как применять ИИ в работе: промты, кейсы, гайды и рабочие схемы. Подписывайтесь → «Промты — и точка».

⭐ Наш Telegram-канал, где мы показываем, как применять ИИ в работе: промты, кейсы, гайды и рабочие схемы. Подписывайтесь → «Промты — и точка».

Комментарии: Google DeepMind представила SIMA 2 — ИИ-агента, который сам учится играть в 3D-мирах
⚡ В тренде
Twitch — это не просто стримы и чат. Это возможность превратить своё увлечение играми в настоящую профессию. Представь: ты не просто играешь в любимые игры, а зарабатываешь на этом, строишь собственное комьюнити и становишься узнаваемым стримером. Звучит как мечта? На Twitch она вполне реальна. В этой статье расскажем, как быстро раскрутить канал, выйти на первую […]
Плохой промт звучит так: «Напиши статью на тему…». Хороший промт объясняет, для кого нужен текст, какую задачу он решает, какие факты использовать, какой структуры держаться и чего нельзя писать. Разница не в длине запроса, а в точности. Если не задать роль, аудиторию, формат и фактуру, нейросеть заполнит пустоты сама: возьмёт усреднённые формулировки, напишет общими словами […]
История Pixar — это не просто рассказ о создании мультфильмов. Это история о том, как маленькая команда энтузиастов смогла изменить индустрию развлечений, ввести новые стандарты и доказать: даже самые амбициозные мечты достижимы. Успех Pixar — это синтез технологий, креатива и бизнес-рисков. Эта история может вдохновить не только тех, кто связан с кино или анимацией, но […]
Google добавила в Gemini Live создание и редактирование изображений во время разговора. Можно показать комнату через камеру и попросить Gemini изменить интерьер, разобрать задачу по математике или сделать мем. Функция работает в приложении Gemini через Live. Google не уточнила, у всех ли уже появился новый режим и есть ли ограничения по странам, устройствам или типам […]
OpenClaw — это бесплатный ИИ-агент с открытым исходным кодом, который работает непосредственно на компьютере или виртуальном сервере. Действует как автономный помощник: может подключаться к приложениям, управлять файлами, браузерами, почтой и календарем, отправлять сообщения в мессенджерах и выполнять команды в терминале. В статье рассмотрим особенности OpenClaw, выясним как его установить на устройство и начать использовать для […]
Блоги компаний
Новости
Свежие статьи