GigaChat от «Сбера» научился распознавать изображения и рукописный текст

«Сбер» представил обновление для ИИ-модели GigaChat Pro, которая теперь умеет распознавать и анализировать изображения и рукописный текст.

Пользователи могут отправлять фотографии в качестве запросов, и нейросеть определит, что изображено, будь то количество людей на фото, их одежда или другие детали.

Реклама. Erid 2VtzqwMXQT6. ООО «Клик.ру», ИНН 7743771327. Промопульт
Реклама. Erid 2Vtzqx3YjaU. ООО «Клик.ру», ИНН 7743771327. Промопульт

Кроме того, модель теперь способна работать с печатным и рукописным текстом, формулами, таблицами и графиками. Например, можно сфотографировать конспект и получить краткое содержание или важные выводы.

Новая функциональность доступна также для бизнес-клиентов через API. Это позволяет компаниям автоматизировать задачи, такие как создание описаний товаров по изображениям, систематизация медиафайлов или модерирование контента. Особенно это полезно ритейлерам, которым нужно быстро генерировать продающие тексты для своих товаров.

Также была увеличена поддержка контекста до 32 тыс. токенов, что позволяет загружать в запросы значительно больше данных — до 60 страниц текста. Это улучшение делает диалоги более плавными и эффективными, особенно при сложных и длительных взаимодействиях.

GigaChat Pro доступен бесплатно для всех пользователей в веб-версии, Telegram и «ВКонтакте», а бизнесу и разработчикам — через GigaChat API, что открывает новые перспективы для интеграции в различные процессы.

Ранее Pika Labs представила модель PIKA 1.5 для генерации видео с предустановленными эффектами анимации.

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

Комментарии: GigaChat от «Сбера» научился распознавать изображения и рукописный текст
  • 8 октября, 2024

    Будет интересно увидеть, как эта технология повлияет на образовательные процессы.

Ответить
Блоги компаний
⚡ В тренде
Как говорят, готовь сани зимой, а промты для новогодних ИИ-фотосессий — в ноябре. Картинки можно публиковать уже сейчас — чтобы немного оживить ленту и поднять охваты в соцсетях, пока все ещё в осенней спячке. Я собрал подборку рабочих промтов для ИИ-фото к Новому году и буду её постепенно пополнять. В конце статьи — несколько лайфхаков, […]
Приложение ChatGPT — чат-бот для работы с текстом и изображениями. Он может подготовить иллюстрации к рассказу, написать текст для поста, составить план занятий и решить множество прочих задач. Разработчики ограничили установку ChatGPT в России. Однако это можно сделать через смену IP и региона аккаунта. О том, как инсталлировать и использовать приложение читайте в моей статье. […]
Приближается зима — самое время для атмосферных фотосессий. Но не везде всё так просто: где-то снег ещё не выпал или не бывает вовсе, а там, где выпал — до красивых мест теперь не так легко добраться, да и на улице холодно. Альтернатива есть — зимняя ИИ-фотосессия. Мы собрали готовые промты, с которыми можно создать реалистичные […]
Apple выпустила обновление iOS 26.1 для iPhone. Главная новинка — возможность регулировать прозрачность интерфейса Liquid Glass («Жидкое стекло»), который впервые появился в iOS 26. Теперь пользователь сам решает, насколько «прозрачной» будет система: доступны два режима — Clear (максимальная прозрачность, как раньше) и Tinted (умеренная прозрачность с повышенным контрастом). Postium собрал самое важное. Читайте также: Как […]
OpenAI представила Android-версию приложения Sora — инструмента для генерации коротких видео с помощью искусственного интеллекта. Скачать ИИ-генератор видео можно в Google Play, но только в семи странах: США, Канаде, Японии, Южной Корее, Вьетнаме, Тайване и Таиланде. Когда доступ откроют в других регионах, компания не сообщает. Подробности подготовил Postium. Читайте также: Как составлять промты для генерации […]
Новости
Свежие статьи