DeepSeek представила V4-Pro и V4-Flash — новые ИИ-модели для сложных и быстрых задач

DeepSeek представила предварительную версию линейки DeepSeek-V4. В неё вошли две MoE-модели: V4-Pro с 1,6 трлн параметров и V4-Flash с 284 млрд параметров.

При генерации V4-Pro задействует 49 млрд параметров, а V4-Flash — 13 млрд. Модели уже появились в чате DeepSeek. V4-Pro работает в режиме Эксперт, V4-Flash — в Быстром. Через API они доступны как deepseek-v4-pro и deepseek-v4-flash. DeepSeek также выложила модели на Hugging Face. Подробнее в материале Postium.

Реклама. Erid 2Vtzqw9oHvr. ООО «Клик.ру».

Реклама. Erid 2Vtzqve9YHx. ООО «Клик.ру».

Читайте также: 5 лучших нейросетей для работы

Что нового в DeepSeek-V4 и что умеет нейросеть

DeepSeek-V4 построена на архитектуре Mixture-of-Experts. В такой схеме модель состоит из набора «экспертов», но для конкретного запроса использует только часть из них. Поэтому старшая V4-Pro может иметь 1,6 трлн параметров, но фактически задействовать 49 млрд при генерации.

V4-Pro рассчитана на сложные задачи: рассуждение, код, работу с длинным контекстом и запросы, где качество важнее скорости. V4-Flash — более лёгкая версия для быстрых ответов и сценариев, где важны задержка и стоимость.

Обе модели поддерживают контекст до 1 млн токенов. Это заметно для задач с большими документами, длинными переписками, кодовыми базами и агентными сценариями, где модель должна удерживать много исходных данных в одном запросе.

По собственным бенчмаркам DeepSeek, V4-Pro сильнее всего раскрывается в режиме Max. Модель набрала 93,5 на LiveCodeBench, 3206 рейтинга Codeforces, 80,6% на SWE Verified и 67,9 на Terminal Bench 2.0.

Как пользоваться DeepSeek V4

Зайдите в чат-бот DeepSeek — выбирать V4 отдельно не нужно, она работает по умолчанию. Переключение между версиями спрятано в режимах: «эксперт» включает V4-Pro, «быстрый» — V4-Flash. После этого можно сразу вводить запрос.

В DeepSeek API новые модели доступны под названиями deepseek-v4-pro и deepseek-v4-flash. Разработчики могут отдельно выбирать старшую модель для сложных запросов и Flash-версию для быстрых массовых задач.

V4-Flash стоит $0,14 за 1 млн входных токенов и $0,28 за 1 млн выходных. При попадании в кэш входные токены обходятся в $0,028 за 1 млн. V4-Pro дороже: $1,74 за 1 млн входных токенов, $3,48 за 1 млн выходных и $0,145 за входные токены при cache hit.

Почему это важно? DeepSeek разводит два сценария внутри одной линейки. V4-Pro закрывает задачи, где нужны максимальная точность и устойчивость на длинном контексте. V4-Flash подходит там, где важнее скорость ответа и цена запроса.

Главная фишка — не только на размер моделей, а на сочетание открытых весов, длинного контекста и MoE-архитектуры. DeepSeek снова пытается дать разработчикам альтернативу закрытым моделям — с возможностью развернуть или адаптировать систему под свои задачи.

DeepSeek уже выпускала открытые модели V3 и R1. V4 продолжает тот же курс: крупные MoE-модели, открытая публикация и разделение на версии для разных режимов работы.

Итог: DeepSeek-V4 добавляет в экосистему компании две модели под разные сценарии: V4-Pro — для тяжёлых задач, V4-Flash — для быстрых запросов с меньшими вычислительными затратами.

⭐ Наш Telegram-канал, где мы показываем, как применять ИИ в работе: промты, кейсы, гайды и рабочие схемы. Подписывайтесь → «Промты — и точка».

Тэги DeepSeek Нейросети