В профильных сообществах обсуждают слухи о выходе DeepSeek V4 в октябре. Главные обещания: контекст до 1 млн токенов, новые режимы рассуждений на базе метода GRPO, а также архитектуры NSA и SPCT, которые должны ускорить работу модели и снизить стоимость инференса.

Официального анонса пока не было, но если прогнозы подтвердятся, пользователи смогут обрабатывать целые книги или репозитории кода без нарезки на куски. А главное, DeepSeek снова всех удивит и сможет легко обойти лидеров в области ИИ.

Реклама. Erid 2VtzquyAJcf. ООО «Клик.ру». Клик.ру
Реклама. Erid 2VtzqvfByDy. ООО «Клик.ру». Клик.ру

Для бизнеса это означает более дешёвые и быстрые вычисления, а для разработчиков — заметный рост качества в математике, программировании и других задачах, где важны многошаговые рассуждения.

Что известно про технологии:

  • GRPO (Group Relative Policy Optimization) — вариант обучения с подкреплением, где модель не просто получает одну «правильную» траекторию, а сравнивает несколько своих решений между собой и учится предпочитать лучшие обучения с подкреплением. Уже применялась DeepSeek для улучшения пошаговой логики.
  • NSA — разрежённая архитектура внимания, оптимизированная под «железо». Вместо квадратичной «матрицы внимания» используются шаблоны: скользящие окна, «глобальные» токены, блок-спарс и т. п. Это резко снижает объём вычислений и памяти.
  • SPCT (Self-Principled Critique Tuning) — самокритика и самотюнинг. Модель сама формулирует критерии хорошего ответа («принципы»), критикует свои варианты и доводит их до ума.

Проще говоря, ответы станут быстрее, дешевле и качественнее, особенно при работе с большими объёмами текста или сложными заданиями.

Главное: Если DeepSeek V4 действительно объединит всё сразу — длинный контекст + GRPO-рассуждения + SPCT-самокритику, то компания получит конкурентное преимущество над OpenAI, Claude и Gemini. Пользователю не придётся выбирать между «умной моделью» и «длинной моделью» — всё будет в одном решении.

В этом году DeepSeek уже выпустил модель R1 с открытой лицензией и ставкой на рассуждения, а в августе представил V3.1 с режимами Think/Non-Think для агентных сценариев. V4 выглядит логичным развитием этой линии.

Ранее компания Alibaba представила ИИ-модель на 1 трлн параметров — Qwen3-Max.

⭐ Наш Telegram-канал, где мы показываем, как применять ИИ в работе: промты, кейсы, гайды и рабочие схемы. Подписывайтесь → «Промты — и точка».

⭐ Наш Telegram-канал, где мы показываем, как применять ИИ в работе: промты, кейсы, гайды и рабочие схемы. Подписывайтесь → «Промты — и точка».

Комментарии: DeepSeek V4 может выйти в октябре — обещают «1 млн токенов» и новые режимы рассуждений
⚡ В тренде
Twitch — это не просто стримы и чат. Это возможность превратить своё увлечение играми в настоящую профессию. Представь: ты не просто играешь в любимые игры, а зарабатываешь на этом, строишь собственное комьюнити и становишься узнаваемым стримером. Звучит как мечта? На Twitch она вполне реальна. В этой статье расскажем, как быстро раскрутить канал, выйти на первую […]
В Instagram* есть настройка, которая позволяет скрыть количество просмотров Reels во вкладке профиля. Она убирает цифру с карточек коротких видео, которые видят посетители аккаунта. При этом, опция не отключает статистику для самого автора. Просмотры по-прежнему доступны во внутренней аналитике, а ограничение касается публичного счётчика в профиле. Читайте также: Как набирать больше просмотров в Reels Как […]
Сайты с прокси – это сервисы, предоставляющие услуги прокси: использование специальных серверов, выступающих посредниками между пользователем и интернетом. Прокси-серверы позволяют сохранять анонимность в сети, увеличивают скорость доступа к некоторым ресурсам, повышают уровень защиты данных от возможных угроз. В этой статье мы разберем, какие прокси бывают и для чего используются. Рассмотрим 10 популярных сайтов с прокси. […]
История Pixar — это не просто рассказ о создании мультфильмов. Это история о том, как маленькая команда энтузиастов смогла изменить индустрию развлечений, ввести новые стандарты и доказать: даже самые амбициозные мечты достижимы. Успех Pixar — это синтез технологий, креатива и бизнес-рисков. Эта история может вдохновить не только тех, кто связан с кино или анимацией, но […]
Ищете промты для открыток ко Дню России? Нейросети могут сделать семейное поздравление по фото, портрет в праздничном образе, открытку для детей или вариант в советском стиле с достопримечательностями нужного города. В этой статье собрали готовые промты для разных форматов, а также покажем, как ими пользоваться и где лучше генерировать такие открытки. Читайте также: 25 нейросетей […]
Блоги компаний
Новости
Свежие статьи