Китайская компания Alibaba Cloud выпустила новую модель искусственного интеллекта QVQ-72B-Preview, способную анализировать визуальные данные и проводить сложные рассуждения.

Искусственный интеллект QVQ сочетает языковые и визуальные возможности, позволяя ему решать задачи на основе изображений, графиков и схем. Эта мультимодальная модель работает на базе Qwen2-VL-72B и, по заявлению разработчиков, значительно превосходит своих предшественников по ряду показателей.

Реклама. Erid 2VtzqwDqfo2. ООО «Клик.ру», ИНН 7743771327.
Реклама. Erid 2VtzqvviSiY. ООО «Клик.ру», ИНН 7743771327.

Читайте также: 7 нейросетей для краткого пересказа текста

Что умеет нейросеть QVQ

QVQ-72B-Preview впечатляет своими результатами на математических и научных тестах. На ключевом бенчмарке MMMU (тест, оценивающий способность модели к визуальному анализу) она достигла рекордного результата в 70,3 балла, обогнав не только предыдущие версии, но и некоторых конкурентов.

Модель также отлично справилась с задачами олимпийского уровня и визуальными тестами по физике и математике.

На демо-платформе QVQ успешно решила сложную математическую задачу, анализируя данные из таблицы. Используя правило произведения для производных, модель методично вычислила результат. Этот пример демонстрирует её способность к пошаговому анализу, что особенно важно в научных и образовательных задачах.

Несмотря на успехи, модель имеет свои недостатки. Она может:

  • Смешивать языки в одном ответе, что затрудняет понимание;
  • Повторяться в рассуждениях, не приходя к конкретным выводам;
  • Терять фокус при многократном анализе изображения.

Разработчики предупреждают, что QVQ всё ещё находится на стадии тестирования и требует доработок в плане безопасности и точности.

Как пользоваться QVQ

Код модели опубликован на GitHub, а бесплатная демоверсия доступна на Hugging Face. QVQ распространяется по лицензии Apache 2.0.

Среди конкурентов QVQ — Google Gemini 2.0 Flash Thinking, OpenAI o1 и o3, а также китайская DeepSeek 2.5. Однако именно QVQ выделяется своей мультимодальностью и упором на сложные визуальные задачи.

Alibaba планирует интегрировать QVQ в свои образовательные и научные платформы. В будущем компания намерена расширить возможности модели, добавив поддержку дополнительных типов данных.

Ранее мы писали, что OpenAI может создать человекоподобного робота.

⭐ Самое важное мы оперативно публикуем в Telegram-канале: https://t.me/postiumru/.

+Плюс эксклюзивы, которых нет на сайте.

⭐ Самое важное мы оперативно публикуем в Telegram-канале: https://t.me/postiumru/. +Плюс эксклюзивы, которых нет на сайте.

Комментарии: Alibaba представила QVQ — ИИ, который умеет рассуждать и анализировать изображения
Блоги компаний
⚡ В тренде
За последние годы Instagram* потерял часть российской аудитории. Это связано с его блокировкой в России. Но знаменитости продолжают развивать аккаунты и зарабатывать на них. Среди российских звезд Instagram* найдутся и спортсмены, и певцы, и модели. Посмотрим, у кого больше всего подписчиков. Чем популярнее знаменитость, тем выше ее доход. Чем больше людей подписано на аккаунт – […]
Краткий пересказ видео и текста – одно из направлений использования нейросетей. Они облегчают процесс изучения статей, подкастов, лонгридов, вебинаров и интервью, позволяют быстро извлечь ключевые моменты и понять их суть. Помогают экономить время и силы при работе с большими объемами информации. В статье рассмотрим 7 нейросетей для пересказа видео по ссылке и текста. Разберемся в […]
Instagram* обновляет дизайн сетки профилей: вместо привычных квадратных миниатюр пользователи теперь будут видеть вертикальные прямоугольные изображения. Писали об этом, ещё в августе прошлого года. Изменения уже затронули значительную часть пользователей и постепенно станут доступны всем. Вернуться к прежнему отображению сетки профиля не получится. Читайте также: Как набрать много просмотров в Reels Зачем нужна вертикальная сетка […]
На фоне продолжающейся саги о доступности TikTok в США Instagram* стремится стать новым домом для пользователей TikTok, добавляя длинные ролики Reels и интерфейс профиля, похожий на TikTok, среди прочих изменений. Теперь Instagram* также предлагает замену CapCut, популярному мобильному приложению для редактирования видео, которое принадлежит ByteDance, владельцу TikTok, и, таким образом, затронуто запретом TikTok. Читайте также: […]
Pinterest представил второй ежегодный отчет Pinterest Palette 2025, раскрывающий пять ключевых цветовых трендов, которые будут популярны в этом году. Эти оттенки выбраны на основе данных платформы о поисковых запросах, сохранениях и покупках более чем полумиллиарда пользователей. Читайте также: Как попасть в рекомендации Reels Трендовые цвета 2025 года Pinterest — это платформа для поиска вдохновения, а […]
Новости
Свежие статьи