Клик.ру

Клик.ру

В профильных сообществах обсуждают слухи о выходе DeepSeek V4 в октябре. Главные обещания: контекст до 1 млн токенов, новые режимы рассуждений на базе метода GRPO, а также архитектуры NSA и SPCT, которые должны ускорить работу модели и снизить стоимость инференса.

Официального анонса пока не было, но если прогнозы подтвердятся, пользователи смогут обрабатывать целые книги или репозитории кода без нарезки на куски. А главное, DeepSeek снова всех удивит и сможет легко обойти лидеров в области ИИ.

Реклама. Erid 2VtzqwMXQT6. ООО «Клик.ру», ИНН 7743771327. Промопульт
Реклама. Erid 2Vtzqx3YjaU. ООО «Клик.ру», ИНН 7743771327.

Для бизнеса это означает более дешёвые и быстрые вычисления, а для разработчиков — заметный рост качества в математике, программировании и других задачах, где важны многошаговые рассуждения.

Что известно про технологии:

  • GRPO (Group Relative Policy Optimization) — вариант обучения с подкреплением, где модель не просто получает одну «правильную» траекторию, а сравнивает несколько своих решений между собой и учится предпочитать лучшие обучения с подкреплением. Уже применялась DeepSeek для улучшения пошаговой логики.
  • NSA — разрежённая архитектура внимания, оптимизированная под «железо». Вместо квадратичной «матрицы внимания» используются шаблоны: скользящие окна, «глобальные» токены, блок-спарс и т. п. Это резко снижает объём вычислений и памяти.
  • SPCT (Self-Principled Critique Tuning) — самокритика и самотюнинг. Модель сама формулирует критерии хорошего ответа («принципы»), критикует свои варианты и доводит их до ума.

Проще говоря, ответы станут быстрее, дешевле и качественнее, особенно при работе с большими объёмами текста или сложными заданиями.

Главное: Если DeepSeek V4 действительно объединит всё сразу — длинный контекст + GRPO-рассуждения + SPCT-самокритику, то компания получит конкурентное преимущество над OpenAI, Claude и Gemini. Пользователю не придётся выбирать между «умной моделью» и «длинной моделью» — всё будет в одном решении.

В этом году DeepSeek уже выпустил модель R1 с открытой лицензией и ставкой на рассуждения, а в августе представил V3.1 с режимами Think/Non-Think для агентных сценариев. V4 выглядит логичным развитием этой линии.

Ранее компания Alibaba представила ИИ-модель на 1 трлн параметров — Qwen3-Max.

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

Комментарии: DeepSeek V4 может выйти в октябре — обещают «1 млн токенов» и новые режимы рассуждений
⚡ В тренде
Просмотры Reels – один из самых важных показателей в Инстаграм*. Позволяет понять, насколько вы интересны широкой аудитории и можете следовать трендам. Рассказываем, от чего зависит количество просмотров и как можно повысить просмотры Reels. Какой контент снимать, как мотивировать зрителей смотреть ваши ролики. В завершении разберём, почему ролики могут не залетать и набирать мало просмотров, и […]
За последние годы в российском сегменте интернета изменился доступ к ряду зарубежных онлайн-сервисов. Некоторые платформы работают с ограничениями, часть сайтов и приложений заблокирована в России, а отдельные компании добровольно покинули рынок. Ниже — актуальный список изменений и блокировок, материал будет обновляться. Читайте также: Аналоги Телеграм и WhatsApp для звонков Что заблокировано в России? Полная блокировка […]
Какой рекламный оффер – такие и продажи. Порой нужно лишь немного изменить оффер, чтобы продажи выросли в несколько раз. Проверьте, соответствуют ли ваши офферы этим принципам. Продающий оффер — это не просто описание продукта, а чёткий ответ на вопрос, почему клиенту стоит купить именно сейчас и именно у вас. Сильный оффер всегда сочетает выгоду, конкретику […]
Роскомнадзор официально подтвердил замедление работы Telegram в России. Заявление ведомства опубликовано 10 февраля: ограничения вводятся «по решению уполномоченных органов» и носят последовательный характер. Замедление затрагивает весь входящий и исходящий трафик сервиса на территории России. Ограничения действуют на сетях всех мобильных операторов и провайдеров проводного интернета. Читайте также: Что заблокировано в России? Почему Telegram замедляют и […]
Компания ByteDance выпустила Seedance 2.0 — обновлённую модель для генерации видео. Это уже не просто text-to-video: нейросеть умеет собирать ролик из нескольких сцен, делать осмысленные склейки, добавлять звук и сохранять визуальную консистентность от кадра к кадру. Модель уже доступна на китайской платформе Jimeng AI (Dreamina) и в видеоредакторе Jianying (аналог CapCut). Доступ открыт для платных […]
Блоги компаний
Новости
Свежие статьи