Google продолжает совершенствовать искусственный интеллект, представив экспериментальную модель Gemini 2.0 Flash Thinking.

Она способна объяснять свои шаги при решении сложных задач и уже доступна для бесплатного тестирования в AI Studio.

Реклама. Erid 2VtzqvV8xTw. ООО «Клик.ру», ИНН 7743771327.
Реклама. Erid 2VtzqwZMkSy. ООО «Клик.ру», ИНН 7743771327.

Читайте также: Как правильно составлять запросы для ChatGPT

Что умеет Gemini 2.0 Flash Thinking

Главный научный сотрудник Google DeepMind Джефф Дин заявил, что ключевой особенностью Gemini 2.0 Flash Thinking стала способность «думать вслух». Это означает, что модель подробно описывает свои шаги, объясняя логику решения, будь то задача по физике, программирование или анализ сложных текстов.

В одном из примеров использования, модель успешно распознала числа на изображении бильярдных шаров, сложила их и верно ответила. Это показывает, что Gemini 2.0 может объединять текстовые и визуальные данные:

Что умеет Gemini 2.0 Flash Thinking

Примечательно, что модель обучена работать с различными языками, включая русский. Например, она может предварительно планировать решение длинной задачи и исправлять собственные ошибки после уточняющих вопросов.

По словам Логана Килпатрика, менеджера по продукту AI Studio, это «первый шаг Google на пути создания рассуждающих ИИ». Разработчики уверены, что подобные модели помогут лучше справляться с задачами, требующими глубокого анализа.

Gemini 2.0 Flash Thinking базируется на новой версии ИИ Gemini Flash, которая была запущена 11 декабря 2024 года. Кроме рассуждений, модель умеет использовать сторонние приложения, анализировать изображения через камеру, работать с аудио и давать советы, например, по написанию кода.

При этом Gemini 2.0 Flash Thinking — не первая модель «рассуждающего» ИИ. OpenAI недавно сделала ИИ-модель o1 доступной подписчикам Plus ($20 в месяц) и Pro ($200). А стартап DeepSeek работает над собственной моделью R1.

В отличие от традиционных моделей ИИ, рассуждающие ИИ проверяют свои ответы, что позволяет избежать многих ошибок. Однако это требует больше времени и вычислительных ресурсов.

Gemini 2.0 Flash Thinking доступна для тестирования на платформах AI Studio и Vertex AI. Однако сервис AI Studio не открывается с российских IP-адресов.

Ранее ElevenLabs выпустила модель синтеза речи Flash v2.5, которая поддерживает 32 языка, включая русский.

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

Комментарии: Google представила Gemini 2.0 Flash Thinking с поддержкой русского языка
Блоги компаний
⚡ В тренде
Apple проведёт свою ежегодную конференцию разработчиков WWDC 2025 уже в понедельник, 9 июня, в 20:00 по Москве. Ожидается, что Apple представит iOS 26, это будет самый масштабный редизайн за последние 10 лет — с эффектами «жидкого стекла», AI-функциями и полной визуальной перезагрузкой всех платформ. Прямая трансляция стартует на сайте Apple, в приложении Apple Developer и […]
Вы замечали, что в ленте — TikTok, YouTube или Reels — всё чаще попадаются видео со странными существами, дурацкими надписями и с именами вроде Бомбарди́ро Крокоди́ло или Тунг Тунг Саху́р? Они танцуют, визжат, кричат фразы на непонятном языке и ведут себя так, будто сами не понимают, что делают. Всё это — не просто странный юмор, […]
ИИ уже давно стал частью нашей жизни — он помогает решать задачи, создавать тексты и работать быстрее. OpenAI постоянно выпускает новые версии ChatGPT — от GPT-3 до мощных reasoning-моделей серии o3-pro. Чтобы эффективно пользоваться ИИ, важно понимать различия между моделями и выбирать подходящую под задачу — будь то быстрый ответ, творчество, глубокий анализ или работа […]
Вы просите нейросеть: «Напиши текст про искусственный интеллект для блога». Она пишет. Всё правильно, вроде бы даже информативно. Но… скучно. Не тот стиль, не та подача, не тот фокус. Вы начинаете уточнять: «Пиши как человек», «ироничнее», «как в Telegram», «а сделай с заголовками», «а теперь разбей на абзацы». Каждое уточнение — это попытка вручную направить […]
Китайская компания 4DV AI представила новую технологию 4D Gaussian Splatting, которая меняет представление о видео. Теперь обычный 2D-ролик можно превратить в интерактивную 4D-сцену: пользователь сможет вращать камеру, приближать объекты и менять ракурс — прямо во время воспроизведения. Всё это дополняется синхронизированным пространственным звуком, создающим эффект полного присутствия. Читайте также: 10 лучших курсов по работе с […]
Новости
Свежие статьи