Anthropic выпустила новую флагманскую модель Claude Sonnet 4.5. Компания заявляет, что это «лучшая в мире модель для кодинга и построения сложных агентов» с заметным ростом в работе «за компьютером» и рассуждениях.

Внутренние тесты и отзывы ранних клиентов отмечают 30+ часов автономной работы — в разы дольше, чем у прошлых версий. Одновременно вышел эксперимент «Imagine with Claude», где ИИ генерирует программное обеспечение на лету прямо в диалоге.

Реклама. Erid 2VtzqwMXQT6. ООО «Клик.ру», ИНН 7743771327. Промопульт
Реклама. Erid 2Vtzqx3YjaU. ООО «Клик.ру», ИНН 7743771327. Промопульт

Читайте также: 6 лучших чат-ботов на базе ИИ

Результаты Claude Sonnet 4.5 на бенчмарках

В тестах Sonnet 4.5 обогнал всех конкурентов, включая GPT-5 и Gemini 2.5 Pro, и показал впечатляющую автономность: более 30 часов непрерывной работы без потери качества. Для сравнения: в прошлой версии автономность была около 7 часов.

  • SWE-bench Verified (кодинг): Sonnet 4.5 набрал 77,2% (до 82% с расширенными вычислениями). Это выше, чем у GPT-5 (74,9%) и заметно выше, чем у Gemini 2.5 Pro (63,8%).
  • OSWorld (навыки «работы за компьютером»): у Sonnet 4.5 — 61,4%, тогда как у Sonnet 4 было 42,2%. Модель лучше справляется с браузером, файлами, таблицами и навигацией по системным интерфейсам.

Результаты Claude Sonnet 4.5 на бенчмарках

Что нового в Claude Sonnet 4.5

Anthropic делает ставку на реальную «производительность ИИ», а не только на умение вести диалог. Sonnet 4.5 не просто отвечает на вопросы, а становится полноценным рабочим агентом: может писать и проверять код, работать с системами и файлами, держать долгие задачи.

Возможности:

  • Код и разработка. Claude научился лучше рефакторить и редактировать проекты, удерживать длинные многошаговые цепочки «план → выполнение → тесты». Это делает его более надёжным инструментом для реальных инженерных задач.
  • Агентность. Теперь Claude может дольше работать в автономном режиме — десятки часов подряд, идеально для вайбкодинга. Это открывает дорогу для использования ИИ в качестве полноценного ассистента-разработчика или оператора внутри компаний.
  • Инструменты для девелоперов. SDK для создания собственных агентов (Claude Agent SDK) и нативное расширение для VS Code, а также поддержка памяти и контекстного редактирования в API.
  • Imagine with Claude. Исследовательский режим, где ИИ генерирует программное обеспечение «на лету»: не только отдельные куски кода, а сразу целые приложения с интерфейсами и логикой. Это шаг в сторону полностью автоматизированной разработки. Функция доступна только подписчикам Max и будет работать ограниченное время.
  • Интеграции. Sonnet 4.5 сразу появился в облаке Amazon Bedrock, что упрощает подключение для корпоративных клиентов.

Imagine with Claude

Рынок ИИ активно движется в сторону «агентности». В марте Google показала Gemini 2.5 Pro с сильным кодингом, в августе OpenAI выпустила GPT-5, который тоже сделал упор на SWE-bench. Moonshot AI запустила агентский режим «OK Computer» в чат-боте Kimi.

Теперь Anthropic делает следующий шаг — берёт лидерство на бенчмарках и выводит ИИ в режим длительной автономной работы. Вместе с этим компания расширяет экосистему: весной был представлен Claude Code, позже добавили API для работы с файлами, а теперь — полноценный набор инструментов для создания и деплоя агентов.

Стоимость совпадает с прошлым Sonnet 4. «Imagine with Claude» доступен только подписчикам Max, в тестовом режиме — всего на 5 дней.

Ранее ChatGPT добавил функцию родительский контроль.

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

Комментарии: Anthropic выпустила Claude Sonnet 4.5 — лучшую в кодинге и создании ИИ-агентов
⚡ В тренде
Готовый сайт не может сам по себе получать трафик и привлекать клиентов, если его никак не продвигать. Новичкам сложно определиться, с чего начать продвижение сайта, и что вообще входит в продвижение, а услуги SEO-компаний не всем по карману. В этой статье разберем несколько шагов, с которых стоит начать SEO-продвижение сайта и которые позволят привлечь целевых […]
DeepSeek – это одна из самых мощных нейросетей, доступная в России бесплатно и без VPN. Поддерживает русский язык и может вести длинный осмысленный диалог, не забывая контекста. Умеет генерировать тексты, анализировать данные, искать актуальную информацию в интернете, создавать и редактировать код. В статье рассмотрим функционал и особенности нейросети, выясним, какие есть преимущества и недостатки. Разберемся, […]
Южнокорейская сеть пиццерий Pizza Mukda запускается в России. Первая точка откроется в Уссурийске — запуск ожидается уже в ближайшие дни. На старте речь идёт об одном заведении, но точная дата открытия не уточняется. Это первый выход сети на российский рынок, без анонсов масштабного запуска или федерального присутствия. Подробности собрал Postium. Читайте также: История компании Додо […]
Седьмой сезон «Чёрного зеркала» стал возвращением к корням: чистая научная фантастика, мрачная ирония и истории, где технологии снова ломают привычный порядок жизни. После экспериментов прошлых лет сериал вновь напомнил, что его главный жанр — тревога о будущем, которое уже началось. Продолжение официально подтверждено. Ниже — всё, что на данный момент известно про 8-й сезон Чёрное […]
РВБ, объединённая компания Wildberries & Russ, запустила сервис WB Track во всех пунктах выдачи заказов Wildberries в России. Теперь клиенты могут отправлять посылки друг другу между ПВЗ по всей стране. Основной способ оформления — через мобильное приложение Wildberries. При этом сервис доступен и офлайн: отправление можно оформить непосредственно в пункте выдачи с помощью менеджера. Больше […]
Блоги компаний
Новости
Свежие статьи