Google продолжает совершенствовать искусственный интеллект, представив экспериментальную модель Gemini 2.0 Flash Thinking.
Она способна объяснять свои шаги при решении сложных задач и уже доступна для бесплатного тестирования в AI Studio.
Читайте также: Как правильно составлять запросы для ChatGPT
Что умеет Gemini 2.0 Flash Thinking
Главный научный сотрудник Google DeepMind Джефф Дин заявил, что ключевой особенностью Gemini 2.0 Flash Thinking стала способность «думать вслух». Это означает, что модель подробно описывает свои шаги, объясняя логику решения, будь то задача по физике, программирование или анализ сложных текстов.
В одном из примеров использования, модель успешно распознала числа на изображении бильярдных шаров, сложила их и верно ответила. Это показывает, что Gemini 2.0 может объединять текстовые и визуальные данные:
Примечательно, что модель обучена работать с различными языками, включая русский. Например, она может предварительно планировать решение длинной задачи и исправлять собственные ошибки после уточняющих вопросов.
По словам Логана Килпатрика, менеджера по продукту AI Studio, это «первый шаг Google на пути создания рассуждающих ИИ». Разработчики уверены, что подобные модели помогут лучше справляться с задачами, требующими глубокого анализа.
Gemini 2.0 Flash Thinking базируется на новой версии ИИ Gemini Flash, которая была запущена 11 декабря 2024 года. Кроме рассуждений, модель умеет использовать сторонние приложения, анализировать изображения через камеру, работать с аудио и давать советы, например, по написанию кода.
При этом Gemini 2.0 Flash Thinking — не первая модель «рассуждающего» ИИ. OpenAI недавно сделала ИИ-модель o1 доступной подписчикам Plus ($20 в месяц) и Pro ($200). А стартап DeepSeek работает над собственной моделью R1.
В отличие от традиционных моделей ИИ, рассуждающие ИИ проверяют свои ответы, что позволяет избежать многих ошибок. Однако это требует больше времени и вычислительных ресурсов.
Gemini 2.0 Flash Thinking доступна для тестирования на платформах AI Studio и Vertex AI. Однако сервис AI Studio не открывается с российских IP-адресов.
Ранее ElevenLabs выпустила модель синтеза речи Flash v2.5, которая поддерживает 32 языка, включая русский.
⭐ Самое важное мы оперативно публикуем в Telegram-канале: https://t.me/postiumru/. +Плюс эксклюзивы, которых нет на сайте.
⭐ Самое важное мы оперативно публикуем в Telegram-канале: https://t.me/postiumru/. +Плюс эксклюзивы, которых нет на сайте.