DeepSeek представила предварительную версию линейки DeepSeek-V4. В неё вошли две MoE-модели: V4-Pro с 1,6 трлн параметров и V4-Flash с 284 млрд параметров.

При генерации V4-Pro задействует 49 млрд параметров, а V4-Flash — 13 млрд. Модели уже появились в чате DeepSeek. V4-Pro работает в режиме Эксперт, V4-Flash — в Быстром. Через API они доступны как deepseek-v4-pro и deepseek-v4-flash. DeepSeek также выложила модели на Hugging Face. Подробнее в материале Postium.

Реклама. Erid 2VtzquyAJcf. ООО «Клик.ру». Клик.ру
Реклама. Erid 2VtzqvfByDy. ООО «Клик.ру». Клик.ру

Читайте также: 5 лучших нейросетей для работы

Что нового в DeepSeek-V4 и что умеет нейросеть

DeepSeek-V4 построена на архитектуре Mixture-of-Experts. В такой схеме модель состоит из набора «экспертов», но для конкретного запроса использует только часть из них. Поэтому старшая V4-Pro может иметь 1,6 трлн параметров, но фактически задействовать 49 млрд при генерации.

V4-Pro рассчитана на сложные задачи: рассуждение, код, работу с длинным контекстом и запросы, где качество важнее скорости. V4-Flash — более лёгкая версия для быстрых ответов и сценариев, где важны задержка и стоимость.

Обе модели поддерживают контекст до 1 млн токенов. Это заметно для задач с большими документами, длинными переписками, кодовыми базами и агентными сценариями, где модель должна удерживать много исходных данных в одном запросе.

По собственным бенчмаркам DeepSeek, V4-Pro сильнее всего раскрывается в режиме Max. Модель набрала 93,5 на LiveCodeBench, 3206 рейтинга Codeforces, 80,6% на SWE Verified и 67,9 на Terminal Bench 2.0.

DeepSeek V4 на бенчмарках

Как пользоваться DeepSeek V4

Зайдите в чат-бот DeepSeek — выбирать V4 отдельно не нужно, она работает по умолчанию. Переключение между версиями спрятано в режимах: «эксперт» включает V4-Pro, «быстрый» — V4-Flash. После этого можно сразу вводить запрос.

Как пользоваться DeepSeek V4

В DeepSeek API новые модели доступны под названиями deepseek-v4-pro и deepseek-v4-flash. Разработчики могут отдельно выбирать старшую модель для сложных запросов и Flash-версию для быстрых массовых задач.

V4-Flash стоит $0,14 за 1 млн входных токенов и $0,28 за 1 млн выходных. При попадании в кэш входные токены обходятся в $0,028 за 1 млн. V4-Pro дороже: $1,74 за 1 млн входных токенов, $3,48 за 1 млн выходных и $0,145 за входные токены при cache hit.

Почему это важно? DeepSeek разводит два сценария внутри одной линейки. V4-Pro закрывает задачи, где нужны максимальная точность и устойчивость на длинном контексте. V4-Flash подходит там, где важнее скорость ответа и цена запроса.

Главная фишка — не только на размер моделей, а на сочетание открытых весов, длинного контекста и MoE-архитектуры. DeepSeek снова пытается дать разработчикам альтернативу закрытым моделям — с возможностью развернуть или адаптировать систему под свои задачи.

DeepSeek уже выпускала открытые модели V3 и R1. V4 продолжает тот же курс: крупные MoE-модели, открытая публикация и разделение на версии для разных режимов работы.

Итог: DeepSeek-V4 добавляет в экосистему компании две модели под разные сценарии: V4-Pro — для тяжёлых задач, V4-Flash — для быстрых запросов с меньшими вычислительными затратами.

⭐ Наш Telegram-канал, где мы показываем, как применять ИИ в работе: промты, кейсы, гайды и рабочие схемы. Подписывайтесь → «Промты — и точка».

⭐ Наш Telegram-канал, где мы показываем, как применять ИИ в работе: промты, кейсы, гайды и рабочие схемы. Подписывайтесь → «Промты — и точка».

Комментарии: DeepSeek представила V4-Pro и V4-Flash — новые ИИ-модели для сложных и быстрых задач
⚡ В тренде
Twitch — это не просто стримы и чат. Это возможность превратить своё увлечение играми в настоящую профессию. Представь: ты не просто играешь в любимые игры, а зарабатываешь на этом, строишь собственное комьюнити и становишься узнаваемым стримером. Звучит как мечта? На Twitch она вполне реальна. В этой статье расскажем, как быстро раскрутить канал, выйти на первую […]
Сайты с прокси – это сервисы, предоставляющие услуги прокси: использование специальных серверов, выступающих посредниками между пользователем и интернетом. Прокси-серверы позволяют сохранять анонимность в сети, увеличивают скорость доступа к некоторым ресурсам, повышают уровень защиты данных от возможных угроз. В этой статье мы разберем, какие прокси бывают и для чего используются. Рассмотрим 10 популярных сайтов с прокси. […]
История Pixar — это не просто рассказ о создании мультфильмов. Это история о том, как маленькая команда энтузиастов смогла изменить индустрию развлечений, ввести новые стандарты и доказать: даже самые амбициозные мечты достижимы. Успех Pixar — это синтез технологий, креатива и бизнес-рисков. Эта история может вдохновить не только тех, кто связан с кино или анимацией, но […]
Ищете промты для открыток ко Дню России? Нейросети могут сделать семейное поздравление по фото, портрет в праздничном образе, открытку для детей или вариант в советском стиле с достопримечательностями нужного города. В этой статье собрали готовые промты для разных форматов, а также покажем, как ими пользоваться и где лучше генерировать такие открытки. Читайте также: 25 нейросетей […]
OpenAI начала запускать сброс лимитов в Codex. Теперь пользователь сможет восстановить лимит вручную и продолжить работу, если упёрся в ограничение. На старте OpenAI выдаёт по одному бесплатному сбросу пользователям тарифов Go, Plus, Pro и Business. Функция разворачивается постепенно, поэтому у части аккаунтов она может появиться позже. Детали в материале Postium. Читайте также: 20 ии-агентов для […]
Блоги компаний
Новости
Свежие статьи