«Сбер» представил обновление для ИИ-модели GigaChat Pro, которая теперь умеет распознавать и анализировать изображения и рукописный текст.
Пользователи могут отправлять фотографии в качестве запросов, и нейросеть определит, что изображено, будь то количество людей на фото, их одежда или другие детали.
Кроме того, модель теперь способна работать с печатным и рукописным текстом, формулами, таблицами и графиками. Например, можно сфотографировать конспект и получить краткое содержание или важные выводы.
Новая функциональность доступна также для бизнес-клиентов через API. Это позволяет компаниям автоматизировать задачи, такие как создание описаний товаров по изображениям, систематизация медиафайлов или модерирование контента. Особенно это полезно ритейлерам, которым нужно быстро генерировать продающие тексты для своих товаров.
Также была увеличена поддержка контекста до 32 тыс. токенов, что позволяет загружать в запросы значительно больше данных — до 60 страниц текста. Это улучшение делает диалоги более плавными и эффективными, особенно при сложных и длительных взаимодействиях.
GigaChat Pro доступен бесплатно для всех пользователей в веб-версии, Telegram и «ВКонтакте», а бизнесу и разработчикам — через GigaChat API, что открывает новые перспективы для интеграции в различные процессы.
Ранее Pika Labs представила модель PIKA 1.5 для генерации видео с предустановленными эффектами анимации.
Будет интересно увидеть, как эта технология повлияет на образовательные процессы.