Alibaba выпустила обновлённую Qwen3‑235B‑A22B — что она умеет

Alibaba представила обновлённую языковую модель Qwen3‑235B‑A22B, которая уже успела обойти в бенчмарках ведущие нейросети — Claude 4 Opus от Anthropic и Kimi K2 от Moonshot.

При этом она работает в ускоренном режиме без reasoning-функции — то есть без имитации рассуждений, которые обычно делают ответ более точным, но и более медленным. Postium подготовил детальный разбор.

Реклама. Erid 2VtzquyAJcf. ООО «Клик.ру».

Реклама. Erid 2VtzqvfByDy. ООО «Клик.ру».

Что умеет Qwen3‑235B‑A22B и как ей пользоваться

Qwen3‑235B‑A22B — это флагманская модель из линейки Qwen3, построенная по архитектуре Mixture of Experts (разделённая модель с выборочными активациями). У неё:

235 млрд параметров в общей базе (из них активны только 22 млрд за проход);
расширенный обучающий корпус на 36 трлн токенов;
поддержка 119 языков, в том числе и русского;
и длинный контекст до 128 тыс. токенов, благодаря технологии YaRN.

Модель распространяется с открытым исходным кодом под лицензией Apache 2.0 — это даёт разработчикам возможность использовать её в продуктах и сервисах без ограничений. Также она доступна для использования в чат-боте Qwen.

В сравнительных тестах Qwen3 показала выдающиеся результаты:

Обошла Kimi K2 и Claude 4 Opus в задачах генерации текстов, математических рассуждений и программирования.
В некоторых метриках, таких как AIME и Codeforces, Qwen3‑235B‑A22B набрала больше очков, чем все конкуренты.
В тесте ARC‑AGI её показатель достиг 41.8, что является рекордным среди моделей, работающих в ускоренном режиме без reasoning.

Без reasoning — как это работает?

Qwen3‑235B‑A22B выпускается в двух режимах:

Thinking — с активацией модулей, имитирующих размышления.
Non‑thinking — для максимально быстрой генерации ответов.

Большинство моделей с высоким качеством (вроде GPT‑4o или Claude 4 Opus) полагаются на reasoning-модуль, который замедляет генерацию. Qwen3 показывает, что можно достигать высоких результатов даже без него.

Кроме того, в новой версии добавили поддержку сверхдлинного контекста — до 256 тыс. токенов при масштабировании, что позволяет анализировать огромные документы или длинные чаты без потери информации. Также упростили доступ к модели — Qwen3 теперь доступна на Hugging Face и в API через Aimlapi.

Alibaba фактически догнала — а по ряду задач и перегнала — западные корпорации вроде OpenAI и Anthropic. И делает это с открытым кодом, что ускорит распространение технологии.

Ранее OpenAI представила ChatGPT Agent.

⭐ Наш Telegram-канал, где мы показываем, как применять ИИ в работе: промты, кейсы, гайды и рабочие схемы. Подписывайтесь → «Промты — и точка».