Компания Alibaba представила Qwen-AgentWorld — языковую world-модель для обучения и проверки AI-агентов в симулированных средах. Вместе с ней команда выпустила AgentWorldBench — бенчмарк для оценки таких симуляторов.

Qwen выложила веса Qwen-AgentWorld-35B-A3B и данные AgentWorldBench на Hugging Face и ModelScope под лицензией Apache 2.0. Подробности в материале Postium.

Реклама. Erid 2VtzquyAJcf. ООО «Клик.ру». Клик.ру
Реклама. Erid 2VtzqvfByDy. ООО «Клик.ру». Клик.ру

Читайте также: ТОП-20 ии-агентов для разработки

Что такое Qwen-AgentWorld и как она работает

Qwen-AgentWorld предсказывает следующее состояние среды на основе действия агента и истории его предыдущих шагов. Агент выполняет команду, ищет информацию, работает с интерфейсом или инструментом, а модель должна описать, как изменится среда.

Qwen-AgentWorld-35B-A3B — MoE-модель с 35 млрд параметров, из которых 3 млрд активны одновременно. Контекстное окно — 262 144 токена.

Одна модель охватывает семь доменов: MCP, Search, Terminal, SWE, Android, Web и OS. Такой набор нужен для агентных задач, где один процесс может включать вызов инструментов, поиск, команды в терминале, работу с кодом, веб-страницами и действия в операционной системе.

Qwen обучала модель более чем на 10 млн траекторий взаимодействия со средами. Обучение прошло в три этапа: continual pre-training дал модели знания о средах, supervised fine-tuning научил предсказывать следующее состояние, reinforcement learning донастроил точность симуляции.

Для оценки модели Qwen выпустила AgentWorldBench. Бенчмарк оценивает предсказанные наблюдения среды по пяти параметрам: формат, фактическая точность, согласованность, реалистичность и качество. На собственном бенчмарке компании Qwen-AgentWorld-35B-A3B набирает 56,39 балла overall, а более крупная Qwen-AgentWorld-397B-A17B — 58,71. По данным Qwen, старшая версия превосходит GPT-5.4 на этом тесте.

AgentWorldBench — бенчмарк

Как попробовать

Qwen-AgentWorld-35B-A3B можно скачать на Hugging Face (Qwen/Qwen-AgentWorld-35B-A3B) или через ModelScope. В репозитории заявлена поддержка Transformers, vLLM и SGLang.

Qwen-AgentWorld: как скачать и установить ИИ-модель локально и бесплатно

Через vLLM или SGLang модель можно развернуть как OpenAI-compatible API на локальном сервере. Qwen рекомендует сохранять длинный контекст, поскольку модель использует его для многошаговой симуляции среды. Если памяти не хватает, размер контекстного окна можно уменьшить.

Почему это важно? Обучать агентов только в реальных средах сложно: каждый запуск требует времени, инфраструктуры и контроля ошибок. World-модель даёт разработчикам среду, где можно многократно проверять действия агента, менять условия и искать слабые места до запуска в реальном окружении.

Ранее Qwen представила Qwen-Robot Suite — набор ИИ-моделей для роботов и систем, которые должны выполнять команды в реальном мире: понимать инструкции, связывать их с визуальной средой и выбирать действия для физического выполнения.

Итог: Alibaba Qwen выпустила Qwen-AgentWorld-35B-A3B и AgentWorldBench, чтобы разработчики могли обучать и проверять AI-агентов в симулированных средах, а не только на реальных задачах.

⭐ Наш Telegram-канал, где мы показываем, как применять ИИ в работе: промты, кейсы, гайды и рабочие схемы. Подписывайтесь → «Промты — и точка».

⭐ Наш Telegram-канал, где мы показываем, как применять ИИ в работе: промты, кейсы, гайды и рабочие схемы. Подписывайтесь → «Промты — и точка».

Комментарии: Alibaba выпустила Qwen-AgentWorld — ИИ-модель с открытыми весами для симуляции агентных сред
⚡ В тренде
Вы заходите в кофейню и вдруг обычный «капучино с собой» превращается в шоу! Бариста поджигает сахар, на стене — неоновая вывеска, у стойки — мини-фотозона. Рука тянется к камере, сторис сами собой улетают в ленту, друзья спрашивают адрес. Вы пришли за кофе, а унесли опыт, которым хочется делиться. Это и есть маркетинг впечатлений: когда продукт […]
Вы когда-нибудь задумывались, почему ваш смартфон не превращается в кирпич после очередного обновления? Или как интернет-магазин угадывает, что вам срочно нужна новая клавиатура после того, как старая не выдержала вашего «яростного» кодинга? За всем этим стоят айтишники — рассказываем, кто это, чем занимаются и сколько зарабатывают. Читайте также: Как зарабатывать с помощью нейросетей Кто такой […]
Представьте: вы начинаете с продажи книг в собственном гараже, без команды, без инвесторов, без гарантий. А спустя несколько лет — управляете империей, меняющей то, как живёт весь мир. Звучит как сюжет фантастического романа? Это реальность Amazon, компании которая стабильно входит в топ самых дорогих в мире. Postium подготовил подробный разбор — как одно решение, принятое […]
Представьте, что ваш рабочий день начинается не с утренней давки в метро или многочасового стояния в пробках, а с чашки кофе дома, на балконе или в ближайшем кафе. Такой формат работы уже стал реальностью для миллионов сотрудников по всему миру, и называется он гибридным графиком. Пандемия COVID-19 дала мощный толчок развитию удалённой работы. Но если […]
Z.ai выпустила GLM-5.2 — новую флагманскую модель для задач, где нужно долго удерживать контекст: работать с большими проектами, связывать несколько шагов и писать код с учётом требований. Вместе с релизом в Z.ai Chat появился AI-агент для создания презентаций. Достаточно описать тему, и агент соберёт структуру, подготовит содержание и оформит материал в виде слайдов. Модель уже […]
Блоги компаний
Новости
Свежие статьи