Компания DeepSeek анонсировала новую серию моделей DeepSeek-VL2, которые распознают объекты на изображениях, анализируют схемы и даже объясняют мемы.

Нейросеть создана на основе архитектуры Mixture of Experts (MoE), объединяющей несколько нейросетей для сложных задач.

Реклама. Erid 2VtzqwMXQT6. ООО «Клик.ру», ИНН 7743771327. Промопульт
Реклама. Erid 2Vtzqx3YjaU. ООО «Клик.ру», ИНН 7743771327. Промопульт

Читайте также: Как пользоваться нейросетью Qwen AI

Что умеет DeepSeek-VL2 и как ей пользоваться

Модель понимает текст на изображениях, включая рукописные записи, таблицы и диаграммы, и может перепечатывать его в цифровом виде. Также она анализирует фото, объясняя их содержание: например, по картинке с продуктами предлагает рецепты.

Что умеет DeepSeek-VL2 и как ей пользоваться

VL2 умеет находить похожие объекты на разных снимках, но пока не всегда точно интерпретирует сцену — например, на фото с нарушением ПДД она описала машину, но не указала, что она проехала на красный.

DeepSeek-VL2 представлена в трёх вариантах: Tiny (1 млрд параметров), Small (2,8 млрд) и VL2 (4,5 млрд). Они «превосходят» предыдущую модель DeepSeek-VL. Одна из версий, VL2-Small, уже доступна бесплатно на Hugging Face.

Также недавно DeepSeek разработала семейство мультимодальных моделей под названием Janus Pro. Стартап заявляет, что эти модели превосходят аналоги, такие как Stable Diffusion 3 Medium и DALL-E 3 от OpenAI.

Ранее мы также писали, что Яндекс интегрировал генератор картинок от DeepSeek в «Шедеврум».

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

Комментарии: DeepSeek представила обновлённую ИИ-модель VL2
Блоги компаний
⚡ В тренде
Приближается зима — самое время для атмосферных фотосессий. Но не везде всё так просто: где-то снег ещё не выпал или не бывает вовсе, а там, где выпал — до красивых мест теперь не так легко добраться, да и на улице холодно. Альтернатива есть — зимняя ИИ-фотосессия. Мы собрали готовые промты, с которыми можно создать реалистичные […]
В чат-боте ГигаЧат появилась новая функция — голосовое общение с нейросетью. Теперь пользователи могут разговаривать с ИИ так же, как с живым собеседником: задавать вопросы, перебивать, уточнять и получать ответы вслух. После завершения беседы сервис автоматически показывает расшифровку диалога. Подробности в материале Postium. Читайте также: Лучшие чат-бот на базе ИИ для работы Как общаться с […]
Apple выпустила обновление iOS 26.1 для iPhone. Главная новинка — возможность регулировать прозрачность интерфейса Liquid Glass («Жидкое стекло»), который впервые появился в iOS 26. Теперь пользователь сам решает, насколько «прозрачной» будет система: доступны два режима — Clear (максимальная прозрачность, как раньше) и Tinted (умеренная прозрачность с повышенным контрастом). Postium собрал самое важное. Читайте также: Как […]
OpenAI представила Android-версию приложения Sora — инструмента для генерации коротких видео с помощью искусственного интеллекта. Скачать ИИ-генератор видео можно в Google Play, но только в семи странах: США, Канаде, Японии, Южной Корее, Вьетнаме, Тайване и Таиланде. Когда доступ откроют в других регионах, компания не сообщает. Подробности подготовил Postium. Читайте также: Как составлять промты для генерации […]
Perplexity представил официального Telegram-бота с именем @askplexbot. Об этом сообщил Павел Дуров в своём канале. Бот отвечает на вопросы с поиском по интернету, генерирует и редактирует изображения, а также может участвовать в групповых беседах. Его можно упоминать в чате, чтобы быстро проверить факты, получить сводку или найти ссылки на источники. Подробности рассказывает Postium. Читайте также: […]
Новости
Свежие статьи