Alibaba официально анонсировала Qwen 3 — новое поколение своих языковых моделей, разработанных для решения широкого спектра задач в области искусственного интеллекта.
Модели Qwen 3 демонстрируют впечатляющие результаты в программировании, математике и логическом выводе, что делает их серьёзным конкурентом для OpenAI o3-mini и других передовых моделей.
Читайте также: 10 курсов по работе с нейросетями
Что умеет Qwen 3 и как ей пользоваться
- Масштаб и архитектура: Серия включает как плотные модели (от 0.6B до 32B параметров), так и разреженные (до 235B параметров), что обеспечивает гибкость в применении и оптимизацию ресурсов.
- Контекстное окно: Большинство моделей поддерживают контекст до 128 000 токенов, позволяя обрабатывать большие объемы информации без потери качества.
- Многоязычность: Поддержка 119 языков и диалектов, включая русский, делает Qwen 3 универсальным инструментом для глобального использования.
- Открытый исходный код: Модели доступны под лицензией Apache 2.0, что позволяет их свободное использование и интеграцию в различные проекты.
В бенчмарках Qwen 3 показывает результаты, сопоставимые или превосходящие модели OpenAI o3-mini. Особенно заметны успехи в задачах, требующих логического мышления и программирования. Например, модель QwQ-32B, предшественник Qwen 3, уже демонстрировала превосходство над o1-mini в математических тестах AIME и MATH.
Пользователи могут опробовать модели Qwen 3 через платформу chat.qwen.ai или загрузить их с Hugging Face и ModelScope.
Ранее компания Xiaomi представила «рассуждающую» нейросеть MiMo.
⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».
⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».