Компания Anthropic анонсировала Claude Mythos Preview — новую ИИ-модель, ориентированную на программирование и кибербезопасность. По данным компании, на тестах модель находила тысячи уязвимостей в популярном софте, включая ОС, браузеры и критическую инфраструктуру.
Доступ к Mythos пока закрыт. Модель тестируют только участники проекта Glasswing — крупные технологические компании и организации, работающие с базовым ПО и инфраструктурой. В Anthropic прямо говорят, что не готовы открывать доступ из-за риска использования модели в атаках. Подробнее в материале Postium.
Читайте также: Как пользоваться нейросетью Claude AI
Нейросеть Claude Mythos — что умеет и как работает
Claude Mythos — это универсальная модель, но с сильно прокачанными навыками в коде, анализе систем и автономной работе. Она умеет разбирать сложные кодовые базы, находить уязвимости и воспроизводить сценарии атак.
В тестах модель показала резкий скачок по сравнению с предыдущими версиями. В SWE-bench Verified она набрала 93,9% против 80,8% у Claude Opus 4.6. В SWE-bench Pro — 77,8% против 53,4%. В задачах на воспроизведение уязвимостей (CyberGym) — 83,1% против 66,6%.

Anthropic также утверждает, что Mythos находила баги в «каждой крупной ОС и каждом крупном браузере», если ей ставили такую задачу. Часть уязвимостей пока не раскрывают — их сначала должны исправить.
Почему это важно? Это сдвиг в роли ИИ в безопасности. Модели перестают быть инструментом анализа и начинают выполнять полноценную исследовательскую работу — быстро и в масштабе.
Проблема в том, что те же способности одинаково полезны и для защиты, и для атак. Чем быстрее модель находит уязвимость, тем меньше времени остаётся на её исправление до возможной эксплуатации.
Именно поэтому Anthropic ограничивает доступ и сначала даёт инструмент крупным компаниям и разработчикам инфраструктуры — тем, кто может закрывать уязвимости, а не использовать их.
Итог: Anthropic создала модель, которая значительно сильнее предыдущих в коде и безопасности — но пока держит её закрытой из-за риска реального вреда.
Ранее компания запустила функцию Dispatch в агентском режиме Cowork: она позволяет ставить задачи Claude с телефона.