Ideogram выпустила нейросеть Ideogram 4 — первую ИИ-модель компании с открытыми весами. Это генератор изображений на 9,3 млрд параметров, который команда обучала с нуля, а не строила на базе существующей модели.
Веса уже появились на Hugging Face. Доступны две версии: NF4 для CUDA и FP8. Компания также пообещала выпустить дополнительные варианты квантизации. Подробности — в материале Postium.
Читайте также: 25 лучших нейросетей для генерации изображений
Нейросеть Ideogram 4: что умеет и как работает
Ideogram 4 делает ставку на задачи, где важны надписи внутри изображения: постеры, баннеры, упаковка, карточки товаров и другой дизайн с текстом.
Одно из главных нововведений — структурированные промпты в формате JSON. Вместо длинного текстового описания можно отдельно задавать объекты, подписи, цвета, композицию и другие элементы изображения.
Пример генерации фото:

Модель поддерживает нативное разрешение 2K, соотношение сторон до 6:1 и прямое управление цветовой палитрой. Также заявлена улучшенная работа с текстом на разных языках и более точное размещение объектов в кадре.
Пример генерации креатива с текстом:

Размер модели заметно меньше, чем у многих недавних конкурентов. Для сравнения: Qwen-Image использует 20 млрд параметров, а FLUX.2 [dev] — 32 млрд. По данным Ideogram, версия NF4 работает на одной видеокарте с 24 ГБ памяти.
В тестах Ideogram 4 почти догнала закрытые GPT Image 2 и Nano Banana 2 по композиции, пространственному мышлению, точности объектов, следованию промпту и отрисовке текста. Во внутренней арене дизайнеров модель заняла второе место после GPT Image 2 и первое среди open-weight решений.

Как скачать и как пользоваться Ideogram 4
Ideogram 4 можно попробовать прямо в Hugging Face Spaces по ссылке. В демо есть поле для промпта, выбор режима генерации — Turbo, Default или Quality — и кнопка Generate. Ниже лежит блок Advanced с дополнительными настройками.

Веса доступны на Hugging Face в двух репозиториях: ideogram-4-nf4 и ideogram-4-fp8. NF4 рассчитана на CUDA, FP8 — отдельная версия весов. Чтобы скачать модель, нужно открыть нужный репозиторий и принять условия доступа.

Почему это важно? Последний год рынок генераторов изображений движется в сторону всё более крупных моделей. Вместе с качеством растут и требования к железу. Из-за этого многие открытые модели сложно запускать локально без дорогих видеокарт.
Ideogram идёт в другую сторону. Компания пытается сохранить качество при относительно компактном размере модели. Если заявленные результаты подтвердятся в реальных тестах, Ideogram 4 может стать одной из самых сильных открытых моделей, которую можно запускать без серверного оборудования.
При этом назвать релиз полноценным open source пока нельзя. Ideogram открыла веса, но распространяет модель по лицензии Non-Commercial. Для исследований, экспериментов и локального запуска этого достаточно, а вот коммерческое использование лицензия ограничивает.
Итог: Ideogram выпустила компактную open-weight-модель с упором на генерацию текста внутри изображений и более низкими требованиями к железу, чем у многих конкурентов.