Китайская компания Alibaba Cloud выпустила новую модель искусственного интеллекта QVQ-72B-Preview, способную анализировать визуальные данные и проводить сложные рассуждения.

Искусственный интеллект QVQ сочетает языковые и визуальные возможности, позволяя ему решать задачи на основе изображений, графиков и схем. Эта мультимодальная модель работает на базе Qwen2-VL-72B и, по заявлению разработчиков, значительно превосходит своих предшественников по ряду показателей.

Реклама. Erid 2VtzquyAJcf. ООО «Клик.ру». Клик.ру
Реклама. Erid 2VtzqvfByDy. ООО «Клик.ру». Клик.ру

Читайте также: 7 нейросетей для краткого пересказа текста

Что умеет нейросеть QVQ

QVQ-72B-Preview впечатляет своими результатами на математических и научных тестах. На ключевом бенчмарке MMMU (тест, оценивающий способность модели к визуальному анализу) она достигла рекордного результата в 70,3 балла, обогнав не только предыдущие версии, но и некоторых конкурентов.

Модель также отлично справилась с задачами олимпийского уровня и визуальными тестами по физике и математике.

На демо-платформе QVQ успешно решила сложную математическую задачу, анализируя данные из таблицы. Используя правило произведения для производных, модель методично вычислила результат. Этот пример демонстрирует её способность к пошаговому анализу, что особенно важно в научных и образовательных задачах.

Несмотря на успехи, модель имеет свои недостатки. Она может:

  • Смешивать языки в одном ответе, что затрудняет понимание;
  • Повторяться в рассуждениях, не приходя к конкретным выводам;
  • Терять фокус при многократном анализе изображения.

Разработчики предупреждают, что QVQ всё ещё находится на стадии тестирования и требует доработок в плане безопасности и точности.

Как пользоваться QVQ

Код модели опубликован на GitHub, а бесплатная демоверсия доступна на Hugging Face. QVQ распространяется по лицензии Apache 2.0.

Среди конкурентов QVQ — Google Gemini 2.0 Flash Thinking, OpenAI o1 и o3, а также китайская DeepSeek 2.5. Однако именно QVQ выделяется своей мультимодальностью и упором на сложные визуальные задачи.

Alibaba планирует интегрировать QVQ в свои образовательные и научные платформы. В будущем компания намерена расширить возможности модели, добавив поддержку дополнительных типов данных.

Ранее мы писали, что OpenAI может создать человекоподобного робота.

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

Комментарии: Alibaba представила QVQ — ИИ, который умеет рассуждать и анализировать изображения
⚡ В тренде
Представьте, вы загружаете своё фото — обычное, как в паспорте — и через пару секунд видите себя как героя Pixar с огромными глазами или как персонажа из аниме. Без фотошопа и часов работы над картинкой. Просто нужен правильный промт и ChatGPT (из нейронок ещё подойдут Qwen и Nano Banana 2). Чтобы всё получилось, лучше взять […]
ChatGPT — универсальный ИИ для работы, учёбы, бизнеса и повседневных задач. Он пишет и редактирует тексты, помогает с кодом, анализирует файлы и таблицы, генерирует изображения, объясняет сложные темы и может много чего ещё. Но в России нейросеть ChatGPT официально недоступна. OpenAI ограничила доступ к чат-боту для российских пользователей, поэтому сайт может не открываться напрямую, регистрация […]
Раньше для создания карточки товара приходилось использовать несколько нейросетей — отдельно для текста, отдельно для обработки фото и инфографики. Сейчас есть готовые решения, которые закрывают задачу целиком. Остаётся выбрать подходящий инструмент. При этом ИИ можно использовать не только для генерации продающего визуала, но и для текстового наполнения: названия, описания и структуры, а также для составления промтов. […]
В соцсетях вирусится новый тренд: пользователь загружает селфи в ChatGPT, вставляет промт и получает «отчёт по внешности». Нейросеть разбирает черты лица, симметрию, пропорции, причёску, стиль, ракурс и даёт рекомендации по образу. В некоторых версиях промта ChatGPT ещё и ставит оценку по шкале от 1 до 10. В этой статье дадим основной промт и несколько вариаций […]
Если у вас возникал вопрос, что такое «белый список» интернета и какие сайты туда входят, вы попали в нужное место. При ограничениях мобильного интернета оператор может сохранять доступ только к ресурсам из разрешённого перечня: одни сайты и приложения открываются, другие — нет. Приложение банка может запускаться, но не проводить платежи. Так работает режим белого списка. […]
Блоги компаний
Новости
Свежие статьи