DeepSeek представила предварительную версию линейки DeepSeek-V4. В неё вошли две MoE-модели: V4-Pro с 1,6 трлн параметров и V4-Flash с 284 млрд параметров.
При генерации V4-Pro задействует 49 млрд параметров, а V4-Flash — 13 млрд. Модели уже появились в чате DeepSeek. V4-Pro работает в режиме Эксперт, V4-Flash — в Быстром. Через API они доступны как deepseek-v4-pro и deepseek-v4-flash. DeepSeek также выложила модели на Hugging Face. Подробнее в материале Postium.
Читайте также: 5 лучших нейросетей для работы
Что нового в DeepSeek-V4 и что умеет нейросеть
DeepSeek-V4 построена на архитектуре Mixture-of-Experts. В такой схеме модель состоит из набора «экспертов», но для конкретного запроса использует только часть из них. Поэтому старшая V4-Pro может иметь 1,6 трлн параметров, но фактически задействовать 49 млрд при генерации.
V4-Pro рассчитана на сложные задачи: рассуждение, код, работу с длинным контекстом и запросы, где качество важнее скорости. V4-Flash — более лёгкая версия для быстрых ответов и сценариев, где важны задержка и стоимость.
Обе модели поддерживают контекст до 1 млн токенов. Это заметно для задач с большими документами, длинными переписками, кодовыми базами и агентными сценариями, где модель должна удерживать много исходных данных в одном запросе.
По собственным бенчмаркам DeepSeek, V4-Pro сильнее всего раскрывается в режиме Max. Модель набрала 93,5 на LiveCodeBench, 3206 рейтинга Codeforces, 80,6% на SWE Verified и 67,9 на Terminal Bench 2.0.

Как пользоваться DeepSeek V4
Зайдите в чат-бот DeepSeek — выбирать V4 отдельно не нужно, она работает по умолчанию. Переключение между версиями спрятано в режимах: «эксперт» включает V4-Pro, «быстрый» — V4-Flash. После этого можно сразу вводить запрос.

В DeepSeek API новые модели доступны под названиями deepseek-v4-pro и deepseek-v4-flash. Разработчики могут отдельно выбирать старшую модель для сложных запросов и Flash-версию для быстрых массовых задач.
V4-Flash стоит $0,14 за 1 млн входных токенов и $0,28 за 1 млн выходных. При попадании в кэш входные токены обходятся в $0,028 за 1 млн. V4-Pro дороже: $1,74 за 1 млн входных токенов, $3,48 за 1 млн выходных и $0,145 за входные токены при cache hit.
Почему это важно? DeepSeek разводит два сценария внутри одной линейки. V4-Pro закрывает задачи, где нужны максимальная точность и устойчивость на длинном контексте. V4-Flash подходит там, где важнее скорость ответа и цена запроса.
Главная фишка — не только на размер моделей, а на сочетание открытых весов, длинного контекста и MoE-архитектуры. DeepSeek снова пытается дать разработчикам альтернативу закрытым моделям — с возможностью развернуть или адаптировать систему под свои задачи.
DeepSeek уже выпускала открытые модели V3 и R1. V4 продолжает тот же курс: крупные MoE-модели, открытая публикация и разделение на версии для разных режимов работы.
Итог: DeepSeek-V4 добавляет в экосистему компании две модели под разные сценарии: V4-Pro — для тяжёлых задач, V4-Flash — для быстрых запросов с меньшими вычислительными затратами.