Alibaba представила обновлённую языковую модель Qwen3‑235B‑A22B, которая уже успела обойти в бенчмарках ведущие нейросети — Claude 4 Opus от Anthropic и Kimi K2 от Moonshot.
При этом она работает в ускоренном режиме без reasoning-функции — то есть без имитации рассуждений, которые обычно делают ответ более точным, но и более медленным. Postium подготовил детальный разбор.
Читайте также: 10 лучших курсов по работе с нейросетями
Что умеет Qwen3‑235B‑A22B и как ей пользоваться
Qwen3‑235B‑A22B — это флагманская модель из линейки Qwen3, построенная по архитектуре Mixture of Experts (разделённая модель с выборочными активациями). У неё:
- 235 млрд параметров в общей базе (из них активны только 22 млрд за проход);
- расширенный обучающий корпус на 36 трлн токенов;
- поддержка 119 языков, в том числе и русского;
- и длинный контекст до 128 тыс. токенов, благодаря технологии YaRN.
Модель распространяется с открытым исходным кодом под лицензией Apache 2.0 — это даёт разработчикам возможность использовать её в продуктах и сервисах без ограничений. Также она доступна для использования в чат-боте Qwen.
В сравнительных тестах Qwen3 показала выдающиеся результаты:
- Обошла Kimi K2 и Claude 4 Opus в задачах генерации текстов, математических рассуждений и программирования.
- В некоторых метриках, таких как AIME и Codeforces, Qwen3‑235B‑A22B набрала больше очков, чем все конкуренты.
- В тесте ARC‑AGI её показатель достиг 41.8, что является рекордным среди моделей, работающих в ускоренном режиме без reasoning.

Без reasoning — как это работает?
Qwen3‑235B‑A22B выпускается в двух режимах:
- Thinking — с активацией модулей, имитирующих размышления.
- Non‑thinking — для максимально быстрой генерации ответов.
Большинство моделей с высоким качеством (вроде GPT‑4o или Claude 4 Opus) полагаются на reasoning-модуль, который замедляет генерацию. Qwen3 показывает, что можно достигать высоких результатов даже без него.
Кроме того, в новой версии добавили поддержку сверхдлинного контекста — до 256 тыс. токенов при масштабировании, что позволяет анализировать огромные документы или длинные чаты без потери информации. Также упростили доступ к модели — Qwen3 теперь доступна на Hugging Face и в API через Aimlapi.
Alibaba фактически догнала — а по ряду задач и перегнала — западные корпорации вроде OpenAI и Anthropic. И делает это с открытым кодом, что ускорит распространение технологии.
Ранее OpenAI представила ChatGPT Agent.