OpenAI анонсировала запуск двух новых моделей с открытыми весами — gpt-oss-120b и gpt-oss-20b, которые обещают значительные улучшения в области рассуждений и доступности технологий ИИ.
Эти модели, доступные на платформе Hugging Face по лицензии Apache 2.0, могут быть модифицированы и использованы для коммерческих целей, что открывает новые возможности для разработчиков и исследователей.
Читайте также: Все ИИ-модели от OpenAI
Что такое GPT-OSS и как это работает
Модели gpt-oss-120b и gpt-oss-20b представляют собой новые этапы в развитии открытых языковых моделей. gpt-oss-120b включает 120 миллиардов параметров, из которых 5,1 миллиарда активных, а gpt-oss-20b содержит 20 миллиардов параметров, с 3,6 миллиардами активных. Обе модели показывают отличные результаты в решении задач рассуждений и могут работать на стандартных потребительских устройствах.
gpt-oss-120b почти наравне с моделью o4-mini по основным бенчмаркам, при этом она эффективно работает на одном GPU с 80 ГБ памяти. gpt-oss-20b, в свою очередь, может быть развернута на устройствах с 16 ГБ памяти и по точности ответов близка к модели o3-mini. Обе модели оптимизированы для широкого спектра приложений, включая локальные вычисления и решения с низкими задержками.
Это первые открытые языковые модели OpenAI с момента выпуска GPT-2 более пяти лет назад. Модели gpt-oss-120b и gpt-oss-20b обладают значительно улучшенной производительностью и безопасностью по сравнению с предыдущими версиями. Они способны выполнять сложные задачи рассуждения и эффективно использовать инструменты, такие как веб-поиск и выполнение Python-кода.
Модели доступны на платформе Hugging Face, где разработчики могут тестировать их с использованием демоверсии и интегрировать в свои проекты. Кроме того, благодаря открытым весам, эти модели можно адаптировать под индивидуальные задачи, модифицировать и применять в коммерческих целях.
Результаты тестов и сравнение с конкурентами
В тестах, таких как «Последний экзамен человечества», который оценивает способности ИИ в академических вопросах, модели gpt-oss-120b и gpt-oss-20b показали высокую точность. Особенно примечательны их результаты на канонических бенчмарках, где gpt-oss-120b продемонстрировала показатели, сравнимые с моделью o4-mini, а gpt-oss-20b — с o3-mini.

Выпуск этих моделей с открытыми весами представляет собой значительный шаг вперед для разработчиков и исследователей, предоставляя доступ к мощным инструментам для создания и развертывания ИИ на собственных инфраструктурах.
Разработчики могут начать работу с моделями gpt-oss прямо сейчас, воспользовавшись доступными на Hugging Face ресурсами и демоверсией.
Ранее Google представила ИИ-модель Genie 3 для генерации интерактивных 3D-миров.