Китайская компания Alibaba выпустила новую версию своей ИИ-модели Qwen2.5-VL, которая способна управлять компьютером или смартфоном, анализировать документы, видео и изображения, а также писать код.

Пользователи могут протестировать часть её функций бесплатно на платформе Qwen Chat или скачать исходный код на сайте Hugging Face.

Реклама. Erid 2VtzqvV8xTw. ООО «Клик.ру», ИНН 7743771327.
Реклама. Erid 2VtzqwZMkSy. ООО «Клик.ру», ИНН 7743771327.

Читайте также: 7 проверенных Телеграм-ботов с ChatGPT

Что умеет ИИ-агент Qwen2.5-VL

Qwen2.5-VL превосходит аналоги, такие как GPT-4, в задачах анализа данных и работы с мультимедиа, однако имеет ограничения по темам из-за требований китайских регуляторов.

Вот ключевые функции:

  1. Работа с изображениями и видео: модель может анализировать графики, диаграммы, подсчитывать объекты на изображениях и распознавать сцены в видео продолжительностью более часа.
    Что умеет ИИ-агент Qwen2.5-VL
  2. Написание кода: ИИ пишет код на основе документов, создаёт HTML-страницы и разрабатывает структурированные данные. Например, он может разметить объекты на дороге или классифицировать мотоциклистов по наличию шлемов.
  3. Управление устройствами: Qwen2.5-VL работает как ИИ-агент, управляя приложениями на ПК и мобильных устройствах. В демонстрации модель бронирует рейс через приложение Booking.com.

ИИ-агент Qwen2.5-VL

Модель доступна в нескольких версиях. Младшие версии можно использовать по разрешительной лицензии, а для флагманской модели Qwen2.5-VL-72B требуется запрос на коммерческое использование, если у компании более 100 миллионов активных пользователей.

Выпуск Qwen2.5-VL показывает, что китайские компании активно развивают технологии ИИ, конкурируя с лидерами рынка, такими как OpenAI и Google.

Ранее Alibaba представила ИИ-модели Qwen2.5-1M и Qwen2.5-Instruct-1M с открытым исходным кодом.

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

Комментарии: Alibaba представила ИИ-агент, который может управлять ПК и смартфоном
Блоги компаний
⚡ В тренде
Apple проведёт свою ежегодную конференцию разработчиков WWDC 2025 уже в понедельник, 9 июня, в 20:00 по Москве. Ожидается, что Apple представит iOS 26, это будет самый масштабный редизайн за последние 10 лет — с эффектами «жидкого стекла», AI-функциями и полной визуальной перезагрузкой всех платформ. Прямая трансляция стартует на сайте Apple, в приложении Apple Developer и […]
Вы замечали, что в ленте — TikTok, YouTube или Reels — всё чаще попадаются видео со странными существами, дурацкими надписями и с именами вроде Бомбарди́ро Крокоди́ло или Тунг Тунг Саху́р? Они танцуют, визжат, кричат фразы на непонятном языке и ведут себя так, будто сами не понимают, что делают. Всё это — не просто странный юмор, […]
ИИ уже давно стал частью нашей жизни — он помогает решать задачи, создавать тексты и работать быстрее. OpenAI постоянно выпускает новые версии ChatGPT — от GPT-3 до мощных reasoning-моделей серии o3-pro. Чтобы эффективно пользоваться ИИ, важно понимать различия между моделями и выбирать подходящую под задачу — будь то быстрый ответ, творчество, глубокий анализ или работа […]
Вы просите нейросеть: «Напиши текст про искусственный интеллект для блога». Она пишет. Всё правильно, вроде бы даже информативно. Но… скучно. Не тот стиль, не та подача, не тот фокус. Вы начинаете уточнять: «Пиши как человек», «ироничнее», «как в Telegram», «а сделай с заголовками», «а теперь разбей на абзацы». Каждое уточнение — это попытка вручную направить […]
Китайская компания 4DV AI представила новую технологию 4D Gaussian Splatting, которая меняет представление о видео. Теперь обычный 2D-ролик можно превратить в интерактивную 4D-сцену: пользователь сможет вращать камеру, приближать объекты и менять ракурс — прямо во время воспроизведения. Всё это дополняется синхронизированным пространственным звуком, создающим эффект полного присутствия. Читайте также: 10 лучших курсов по работе с […]
Новости
Свежие статьи