Компания Hailuo AI (MiniMax) представила новую версию своей ИИ-модели синтеза речи — MiniMax Speech 2.6.

Разработчики называют её «ультрабыстрой, естественной и умной»: задержка отклика составляет менее 250 миллисекунд, речь звучит максимально естественно, а система умеет корректно произносить адреса, даты и числа. Postium подготовил обзор обновления.

Реклама. Erid 2VtzqwMXQT6. ООО «Клик.ру», ИНН 7743771327. Промопульт
Реклама. Erid 2Vtzqx3YjaU. ООО «Клик.ру», ИНН 7743771327. Промопульт

Читайте также: 5 нейросетей для озвучки текста голосом

Что умеет нейросеть MiniMax Speech 2.6

Speech 2.6 работает через Text-to-Audio API (T2A) — интерфейс, который преобразует текст в речь в реальном времени.

Ключевые возможности:

  • до 10 000 символов в одном запросе;
  • поддержка потокового синтеза (streaming) — речь генерируется «на лету», без ожидания конца запроса;
  • 300+ готовых голосов и возможность клонировать собственный;
  • гибкие настройки громкости, тембра, скорости и высоты тона;
  • поддержка популярных аудиоформатов — mp3, pcm, flac, wav (последний доступен вне стриминга);
  • пропорциональное аудиомикширование — можно совмещать несколько дорожек или озвучек в одном потоке.

Система полностью статична и безопасна: модель не хранит пользовательские данные и не использует контекст прошлых запросов.

Новые модели. MiniMax представила несколько версий движка:

  • speech-2.6-hd — улучшенное качество озвучки и точность при клонировании;
  • speech-2.6-turbo — оптимизированная скорость и поддержка 40 языков.

Мультиязычность. Speech 2.6 поддерживает 40 языков, включая русский, английский, китайский, французский, арабский, испанский, японский и корейский. Модель может говорить на нескольких языках в одном предложении.

Доступность. Speech 2.6 уже доступна через официальный сайт MiniMax и в разделе API-документации компании. Разработчики могут протестировать сервис прямо сейчас — через HTTP или WebSocket-запросы, либо подключить готовый MCP-сервер на Python или JavaScript.

Интерфейс и документация доступны на английском и китайском языках, мультиязычный синтез речи работает во всех регионах, включая Россию.

Как пользоваться MiniMax Speech 2.6

На сайте MiniMax доступен простой и понятный интерфейс для генерации озвучки, без кода и настройки API. Всё работает прямо в браузере — на сайте.

1. Введите текст. В центральном поле «Speech Synthesis» напишите текст, который хотите озвучить. Система автоматически определяет язык (например, русский, английский или китайский).

Как пользоваться MiniMax Speech 2.6

Поддерживаются тексты до 5 000 символов — можно включить режим Long Text для длинных записей.

2. Выберите модель. В верхней панели задаётся модель синтеза — по умолчанию speech-2.6-hd. Она обеспечивает максимальную реалистичность и естественную интонацию.

3. Настройте голос. Справа в блоке Settings выберите голос (например, Radiant Girl или Man With Deep Voice).

Можно задать:

  • Emotion — эмоциональный стиль (нейтральный, радостный, драматичный и т. д.);
  • Speed — скорость речи;
  • Pitch — высоту тона;
  • Volume — громкость.

Некоторые параметры, отмеченные как Limited-time Free, доступны бесплатно в тестовом режиме.

4. Генерация и прослушивание. Нажмите Generate, и через несколько секунд MiniMax создаст готовый аудиофайл.

5. Внизу появится проигрыватель, где можно: прослушать результат, скачать его, оценить (лайк/дизлайк) и добавить в закладки.

Дополнительно: В боковом меню доступны инструменты Voice Clone (создание клона голоса), Voice Design (настройка тембра и интонации) и Voice Isolator (очистка записей).

Таким образом, MiniMax Speech 2.6 подходит как для быстрого озвучивания текста, так и для профессиональной работы с голосами, рекламой и интерактивными проектами.

Почему это важно? MiniMax активно расширяет экосистему ИИ-сервисов. В октябре компания представила MiniMax-M2 — открытую модель на 230 млрд параметров для умных агентов, а также Hailuo 2.3 — обновлённый генератор видео с реалистичными эмоциями и движением.

Релиз Speech 2.6 дополняет эту линейку, превращая MiniMax в платформу полного цикла — текст, голос и видео в одном ИИ-стеке.

Итог: MiniMax Speech 2.6 позволяет за несколько минут получить реалистичную озвучку — будь то диктор для видео, голос чат-бота или аудиоурок. Всё настраивается прямо в веб-интерфейсе, без сложной интеграции.

Это одно из самых продвинутых решений в сфере синтеза речи: быстрая реакция, естественная интонация, клон-голоса и поддержка 40 языков делают её конкурентом ElevenLabs, OpenAI Voice, Microsoft TTS и новой Sonic-3.

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

Комментарии: MiniMax выпустила Speech 2.6 — быструю нейросеть для озвучки текста голосом
⚡ В тренде
В соцсетях резко выросло число роликов и картинок, где обычные города превращены в мягкие мини-макеты из пряжи. Дома выглядят как игрушечные, деревья — как пушистые комочки, дороги — как аккуратно вышитые полосы. Всё это напоминает диораму, которую долго и терпеливо собирали вручную. Но на самом деле такие сцены делают нейросети — достаточно одного удачного промта. […]
«Сбер» выпустил iOS-приложение чат-бота GigaChat. Оно доступно в App Store под названием G8AI, сообщили в пресс-службе компании. В приложении уже работают голосовой режим (два голоса — мужской и женский), генерация изображений и музыки, а также функция «Глубокое исследование», которая анализирует данные из нескольких источников. Читайте также: Как установить приложение ChatGPT на Айфон Что умеет iOS-версия […]
OpenAI представила новую версию своей модели — GPT-5.1, доступную в двух режимах работы: Instant и Thinking. Обновление делает ChatGPT не только умнее, но и более человечным: теперь можно выбрать стиль общения — от строгого и делового до дружелюбного или даже слегка «чудаковатого». Подробности в материале Postium. Читайте также: 10 лучших курсов по работе с ChatGPT […]
Чат-бот Grok от компании xAI теперь умеет создавать короткие видео по текстовым подсказкам. Функция работает через инструмент Imagine: пользователю достаточно описать сцену, а нейросеть сама сгенерирует ролик с движением, звуком и озвучкой. Ранее Grok Imagine умел превращать в видео только изображения — можно было «оживить» фото, добавив движение или эмоцию. Postium показывает, как работает обновление. […]
Первый сезон «Fallout» стал для Prime Video редким случаем, когда экранизация игры не просто «сработала», а задала планку. Постапокалиптика с фирменным чёрным юмором, узнаваемые детали вселенной, три равноправные линии героев — и ни грамма боязни выглядеть странно. Финал аккуратно подвёл нас к расширению карты: из компактных, но разрушенных районов пустоши — в легендарный Нью-Вегас. В […]
Блоги компаний
Новости
Свежие статьи