DeepSeek представила предварительную версию линейки DeepSeek-V4. В неё вошли две MoE-модели: V4-Pro с 1,6 трлн параметров и V4-Flash с 284 млрд параметров.

При генерации V4-Pro задействует 49 млрд параметров, а V4-Flash — 13 млрд. Модели уже появились в чате DeepSeek. V4-Pro работает в режиме Эксперт, V4-Flash — в Быстром. Через API они доступны как deepseek-v4-pro и deepseek-v4-flash. DeepSeek также выложила модели на Hugging Face. Подробнее в материале Postium.

Реклама. Erid 2VtzquyAJcf. ООО «Клик.ру». Клик.ру
Реклама. Erid 2VtzqvfByDy. ООО «Клик.ру». Клик.ру

Читайте также: 5 лучших нейросетей для работы

Что нового в DeepSeek-V4 и что умеет нейросеть

DeepSeek-V4 построена на архитектуре Mixture-of-Experts. В такой схеме модель состоит из набора «экспертов», но для конкретного запроса использует только часть из них. Поэтому старшая V4-Pro может иметь 1,6 трлн параметров, но фактически задействовать 49 млрд при генерации.

V4-Pro рассчитана на сложные задачи: рассуждение, код, работу с длинным контекстом и запросы, где качество важнее скорости. V4-Flash — более лёгкая версия для быстрых ответов и сценариев, где важны задержка и стоимость.

Обе модели поддерживают контекст до 1 млн токенов. Это заметно для задач с большими документами, длинными переписками, кодовыми базами и агентными сценариями, где модель должна удерживать много исходных данных в одном запросе.

По собственным бенчмаркам DeepSeek, V4-Pro сильнее всего раскрывается в режиме Max. Модель набрала 93,5 на LiveCodeBench, 3206 рейтинга Codeforces, 80,6% на SWE Verified и 67,9 на Terminal Bench 2.0.

DeepSeek V4 на бенчмарках

Как пользоваться DeepSeek V4

Зайдите в чат-бот DeepSeek — выбирать V4 отдельно не нужно, она работает по умолчанию. Переключение между версиями спрятано в режимах: «эксперт» включает V4-Pro, «быстрый» — V4-Flash. После этого можно сразу вводить запрос.

Как пользоваться DeepSeek V4

В DeepSeek API новые модели доступны под названиями deepseek-v4-pro и deepseek-v4-flash. Разработчики могут отдельно выбирать старшую модель для сложных запросов и Flash-версию для быстрых массовых задач.

V4-Flash стоит $0,14 за 1 млн входных токенов и $0,28 за 1 млн выходных. При попадании в кэш входные токены обходятся в $0,028 за 1 млн. V4-Pro дороже: $1,74 за 1 млн входных токенов, $3,48 за 1 млн выходных и $0,145 за входные токены при cache hit.

Почему это важно? DeepSeek разводит два сценария внутри одной линейки. V4-Pro закрывает задачи, где нужны максимальная точность и устойчивость на длинном контексте. V4-Flash подходит там, где важнее скорость ответа и цена запроса.

Главная фишка — не только на размер моделей, а на сочетание открытых весов, длинного контекста и MoE-архитектуры. DeepSeek снова пытается дать разработчикам альтернативу закрытым моделям — с возможностью развернуть или адаптировать систему под свои задачи.

DeepSeek уже выпускала открытые модели V3 и R1. V4 продолжает тот же курс: крупные MoE-модели, открытая публикация и разделение на версии для разных режимов работы.

Итог: DeepSeek-V4 добавляет в экосистему компании две модели под разные сценарии: V4-Pro — для тяжёлых задач, V4-Flash — для быстрых запросов с меньшими вычислительными затратами.

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

Комментарии: DeepSeek представила V4-Pro и V4-Flash — новые ИИ-модели для сложных и быстрых задач
⚡ В тренде
Представьте, вы загружаете своё фото — обычное, как в паспорте — и через пару секунд видите себя как героя Pixar с огромными глазами или как персонажа из аниме. Без фотошопа и часов работы над картинкой. Просто нужен правильный промт и ChatGPT (из нейронок ещё подойдут Qwen и Nano Banana 2). Чтобы всё получилось, лучше взять […]
ChatGPT — универсальный ИИ для работы, учёбы, бизнеса и повседневных задач. Он пишет и редактирует тексты, помогает с кодом, анализирует файлы и таблицы, генерирует изображения, объясняет сложные темы и может много чего ещё. Но в России нейросеть ChatGPT официально недоступна. OpenAI ограничила доступ к чат-боту для российских пользователей, поэтому сайт может не открываться напрямую, регистрация […]
Раньше для создания карточки товара приходилось использовать несколько нейросетей — отдельно для текста, отдельно для обработки фото и инфографики. Сейчас есть готовые решения, которые закрывают задачу целиком. Остаётся выбрать подходящий инструмент. При этом ИИ можно использовать не только для генерации продающего визуала, но и для текстового наполнения: названия, описания и структуры, а также для составления промтов. […]
В соцсетях вирусится новый тренд: пользователь загружает селфи в ChatGPT, вставляет промт и получает «отчёт по внешности». Нейросеть разбирает черты лица, симметрию, пропорции, причёску, стиль, ракурс и даёт рекомендации по образу. В некоторых версиях промта ChatGPT ещё и ставит оценку по шкале от 1 до 10. В этой статье дадим основной промт и несколько вариаций […]
Если у вас возникал вопрос, что такое «белый список» интернета и какие сайты туда входят, вы попали в нужное место. При ограничениях мобильного интернета оператор может сохранять доступ только к ресурсам из разрешённого перечня: одни сайты и приложения открываются, другие — нет. Приложение банка может запускаться, но не проводить платежи. Так работает режим белого списка. […]
Блоги компаний
Новости
Свежие статьи