На конференции Baidu World 2025 компания Baidu представила ERNIE 5.0 — нативно мультимодальную модель, которая с нуля обучалась работать сразу с текстом, изображениями, аудио и видео.

По заявлениям компании, модель стала заметно сильнее в понимании контекста, следовании инструкциям, креативном письме и мультимодальном анализе. Postium выделил главное.

Реклама. Erid 2VtzquyAJcf. ООО «Клик.ру». Клик.ру
Реклама. Erid 2VtzqvfByDy. ООО «Клик.ру». Клик.ру

Читайте также: Лучшие чат-боты на базе ИИ

Что нового в ERNIE 5.0

Baidu говорит, что ERNIE 5.0 делает шаг к «единым» ИИ-моделям, которым не нужны отдельные модули для каждого типа данных. Это важно для задач вроде анализа документов, чтения диаграмм, распознавания мелкого текста на изображениях и генерации мультимедийного контента.

Внутренние тесты компании ставят ERNIE 5.0 примерно на один уровень с Google Gemini 2.5 Pro и OpenAI GPT-5-High.

Что нового в ERNIE 5.0

Возможности ERNIE 5.0:

  1. Нативная мультимодальность. Модель работает с текстом, фото, аудио и видео. Это сокращает количество «прослоек» между ними и улучшает качество анализа.
  2. Упор на логику и связность. По данным китайских медиа, модель получила 2,4 трлн параметров и улучшенные механизмы рассуждений — лучше память, последовательность и точность.
  3. Режим «мышления по изображению». ERNIE 5.0 может зумиться в нужные фрагменты картинки, читать мелкие элементы и сочетать визуальный анализ с поиском. Это нужно для работы с диаграммами, документами и редкими фактами.
  4. Экосистема над моделью. ERNIE 5.0 становится ядром целой линейки продуктов Baidu: виртуальные ведущие и консультанты, no-code-конструктор Miaoda, агенты GenFlow и новый Famou, рабочее пространство Oreate и сервис MeDo.

Доступность: Модель уже представлена и используется в обновлённом Ernie Bot 5.0 и сервисах Baidu Cloud. Доступность на международных рынках пока не раскрывается — Baidu ограничилась обещанием вывести часть продуктов за пределы Китая.

Почему это важно? Для индустрии ИИ это показатель, что китайские компании переходят от догоняющей стратегии к конкурентной наравне с глобальными игроками. Baidu делает ставку на собственную вертикаль: свои модели, свои чипы (M100 и M300), свои суперузлы. Это снижает зависимость от NVIDIA и укрепляет позицию компании на внутреннем рынке.

Линейка ERNIE развивается с 2019 года. В 2023-м Baidu показала ERNIE Bot — китайский аналог ChatGPT, а затем ERNIE 4.0, который по заявлениям компании сопоставим с GPT-4.

В 2024–2025 годах Baidu активно обновляла линейку, снизила цены и сделала Ernie Bot бесплатным, чтобы конкурировать с китайскими игроками вроде DeepSeek. ERNIE 5.0 — логичное продолжение этой стратегии: крупная мультимодальная модель, заточенная под широкий спектр задач — от личных агентов до корпоративных ИИ-систем.

Итог: ERNIE 5.0 делает упор на глубокий мультимодальный анализ. Она не просто понимает текст, но и умеет «думать по картинкам»: читать мелкие детали, разбирать схемы, анализировать видео. По уровню Baidu ставит её в один ряд с GPT-5 и Gemini. Модель станет основой для агентов и сервисов Baidu на внутреннем рынке, но может появится и на зарубежных.

Ранее OpenAI показала обновлённую флагманскую модель GPT-5.1.

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

Комментарии: Baidu представила ERNIE 5.0 — новую мультимодальную ИИ-модель, аналог GPT-5 и Gemini
⚡ В тренде
Представьте, вы загружаете своё фото — обычное, как в паспорте — и через пару секунд видите себя как героя Pixar с огромными глазами или как персонажа из аниме. Без фотошопа и часов работы над картинкой. Просто нужен правильный промт и ChatGPT (из нейронок ещё подойдут Qwen и Nano Banana 2). Чтобы всё получилось, лучше взять […]
ChatGPT — универсальный ИИ для работы, учёбы, бизнеса и повседневных задач. Он пишет и редактирует тексты, помогает с кодом, анализирует файлы и таблицы, генерирует изображения, объясняет сложные темы и может много чего ещё. Но в России нейросеть ChatGPT официально недоступна. OpenAI ограничила доступ к чат-боту для российских пользователей, поэтому сайт может не открываться напрямую, регистрация […]
В соцсетях вирусится новый тренд: пользователь загружает селфи в ChatGPT, вставляет промт и получает «отчёт по внешности». Нейросеть разбирает черты лица, симметрию, пропорции, причёску, стиль, ракурс и даёт рекомендации по образу. В некоторых версиях промта ChatGPT ещё и ставит оценку по шкале от 1 до 10. В этой статье дадим основной промт и несколько вариаций […]
Если у вас возникал вопрос, что такое «белый список» интернета и какие сайты туда входят, вы попали в нужное место. При ограничениях мобильного интернета оператор может сохранять доступ только к ресурсам из разрешённого перечня: одни сайты и приложения открываются, другие — нет. Приложение банка может запускаться, но не проводить платежи. Так работает режим белого списка. […]
OpenAI начала разворачивать GPT-5.5 Instant в ChatGPT. Это новая ИИ-модель по умолчанию: она заменяет GPT-5.3 Instant и отвечает на обычные запросы без ручного выбора режима. GPT-5.5 Instant рассчитана на повседневные задачи: объяснения, поиск информации, работу с текстом, перевод и ситуации, где ChatGPT сам решает, нужен ли веб-поиск. Модель уже доступна всем пользователям ChatGPT. Подробности — […]
Блоги компаний
Новости
Свежие статьи