Moonshot AI выпустила обновление своей нейросети Kimi K2-Instruct — версия 0905 получила окно контекста 256k токенов, улучшенную генерацию кода (особенно для фронтенда) и более точную работу с инструментами и агентными сценариями.
Для разработчиков это означает возможность держать в памяти гораздо более крупные репозитории и длинные цепочки вызовов, а также ускоренную работу агентов и автогенерацию UI.
Читайте также: ТОП-10 лучших курсов по ИИ
Что нового в Kimi K2-0905
Компания отдельно подчёркивает стабильную скорость отклика и «идеальную» точность вызовов инструментов в turbo-API, хотя эти данные пока заявлены в рекламных материалах.
Детали:
- Контекст 256k — теперь модель способна работать с проектами и документами вдвое длиннее по сравнению с прошлой версией.
- Фронтенд и код — K2 стала точнее воспроизводить стиль и структуру в UI-коде, что упрощает использование в разработке интерфейсов.
- Интеграции с агентами — модель легче подключать к популярным инструментам вроде Claude Code и Roo Code.
- Скорость и tool-calling — заявлены 60–100+ TPS и стопроцентная корректность вызовов инструментов при работе через turbo-API.
Kimi K2-0905 показала уверенный рост в бенчмарках: на SWE-Bench Verified результат выше 65%, на LiveCodeBench — 53,7%, что лучше, чем у GPT-4.1 и DeepSeek-V3. В математике модель вышла почти на 97,4 % (MATH-500), а на MMLU набрала около 89,5 %. Эти показатели делают её одной из самых сильных открытых моделей для кода и reasoning-задач: стабильнее на инженерных бенчмарках, быстрее в генерации кода и с заметным запасом по математике и общим знаниям.

При этом Kimi K2-0905 уже в ряде сценариев превосходит Claude Sonnet 4 — особенно в многоязычных и терминальных тестах, тогда как Sonnet остаётся впереди на «чистом» SWE-Bench Verified и в SWE-Dev, но разница минимальна.
Kimi K2 — бесплатная открытая MoE-модель Moonshot AI с упором на генерацию кода и работу в агентных средах. В июле компания впервые представила K2 как модель с открытыми весами, сделав ставку на гибкость и интеграцию в сторонние сервисы. С тех пор K2 активно внедряют в IDE, кодовых ассистентов и облачные платформы.
Веса и код уже опубликованы на Hugging Face — по ссылке. Общение с новой моделью доступно в Kimi Chat, а доступ к turbo-API открыт на платформе Moonshot.
Ранее Google представила нейросеть EmbeddingGemma для локальной работы.