Компания ByteDance впервые выложила в открытый доступ свою мультимодальную модель FaceCLIP, предназначенную для понимания и генерации человеческих лиц. Теперь её можно протестировать и скачать прямо на платформе Hugging Face.

Ранее нейросеть FaceCLIP использовалась исключительно внутри ByteDance — в исследовательских проектах и тестах для сервисов вроде TikTok и CapCut. Публикация на Hugging Face стала первым случаем, когда компания открыла модель, напрямую связанную с идентичностью и персонализацией. Подробности читайте в материале Postium.

Реклама. Erid 2VtzqwMXQT6. ООО «Клик.ру», ИНН 7743771327. Промопульт
Реклама. Erid 2Vtzqx3YjaU. ООО «Клик.ру», ИНН 7743771327. Промопульт

Читайте также: Как генерировать видео в нейросети Wan 2.5

Что умеет нейросеть FaceCLIP

FaceCLIP — это нейросеть, которая «понимает» лицо человека и умеет по описанию создавать его новые изображения.

Если сказать проще — это ИИ, который может взять одну вашу фотографию и сделать из неё, например, портрет в стиле аниме, деловой снимок для резюме или селфи на пляже — при этом лицо останется вашим.

Что умеет нейросеть FaceCLIP

Модель сочетает два подхода: понимание смысла текста, как у CLIP (она знает, что значит «улыбается» или «в очках») и генерацию изображений, как у Stable Diffusion (рисует реалистичные картинки).

FaceCLIP объединяет эти возможности: она превращает фото и текст в общий «вектор» — цифровое представление, которое понимает и лицо, и описание. Благодаря этому модель сохраняет узнаваемость человека, даже если вы меняете стиль, эмоции или фон.

Как генерировать лица с помощью нейросети

Проще говоря, FaceCLIP — это ИИ, который умеет «рисовать вас» заново, не забывая, как вы выглядите.

Статья в тему: Промты для ИИ-фотосессий

Результаты и качество

По тестам разработчиков, FaceCLIP превосходит существующие подходы вроде ConsisID и IDAnimator:

  • Идентичность сохраняется лучше всего — средний показатель похожести (Identity Average) составил 0.516, против 0.414 у ConsisID и 0.349 у IDAnimator.
  • Качество видео и изображений выше — модели ByteDance достигают более низкой метрики Inception Distance (176 против 200 у ближайшего конкурента), что означает реалистичность и стабильность результатов.
  • Лицо остаётся консистентным под разными углами, без «склейки» и визуальных искажений.

Тест и промты для FaceCLIP

Эти же принципы лежат в основе другой открытой разработки ByteDance — EchoVideo, которая генерирует персонализированные видеоролики по одной фотографии.

Как пользоваться FaceCLIP — краткий гайд

Чтобы использовать нейросеть — нужно скачать её на свой компьютер и запустить, как программу.

Шаг 1. Перейдите на страницу модели на Hugging Face (в разделе ByteDance).

Шаг 2. Зайдите во вкладку «Files and versions» и выберите папку model/ (там лежат веса модели). Скачайте все файлы из этой папки.

Как запустить FaceCLIP на своём компьютере

Шаг 3. Для локального запуска установите зависимости и загрузите веса, аналогично другим проектам ByteDance, например EchoVideo.

Пример работы с репозиторием ByteDance:

git clone https://huggingface.co/bytedance/FaceCLIP
cd FaceCLIP
pip install -r requirements.txt
python demo.py

Модель поддерживает GPU и NPU, а для запуска подойдёт любая версия Python от 3.10 до 3.12.

Если вы хотите опробовать генерацию видео с сохранением лица, можно воспользоваться проектом EchoVideo. Эта модель создаёт короткие персонализированные клипы по тексту и фото — с сохранением мимики и стиля персонажа.

Ранее модели такого уровня — особенно связанные с лицами — ByteDance не публиковала открыто. Все исследования по идентичности, включая FaceCLIP, EchoVideo или LVFace, оставались внутри компании. Теперь же FaceCLIP выложена на Hugging Face, с документацией и демо, что делает её доступной исследователям, художникам и разработчикам по всему миру.

Важно: FaceCLIP работает с биометрией, поэтому при использовании в продуктах нужно учитывать правовые ограничения и согласие пользователей. На Hugging Face модель распространяется под открытой лицензией, но с предупреждением об этическом применении.

Также, недавно сервис NotebookLM добавил 6 визуальных стилей и режим «Бриф».

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: «Промты — и точка».

Комментарии: ByteDance открыла FaceCLIP — модель для генерации лиц выложили на Hugging Face
⚡ В тренде
В соцсетях резко выросло число роликов и картинок, где обычные города превращены в мягкие мини-макеты из пряжи. Дома выглядят как игрушечные, деревья — как пушистые комочки, дороги — как аккуратно вышитые полосы. Всё это напоминает диораму, которую долго и терпеливо собирали вручную. Но на самом деле такие сцены делают нейросети — достаточно одного удачного промта. […]
«Сбер» выпустил iOS-приложение чат-бота GigaChat. Оно доступно в App Store под названием G8AI, сообщили в пресс-службе компании. В приложении уже работают голосовой режим (два голоса — мужской и женский), генерация изображений и музыки, а также функция «Глубокое исследование», которая анализирует данные из нескольких источников. Читайте также: Как установить приложение ChatGPT на Айфон Что умеет iOS-версия […]
OpenAI представила новую версию своей модели — GPT-5.1, доступную в двух режимах работы: Instant и Thinking. Обновление делает ChatGPT не только умнее, но и более человечным: теперь можно выбрать стиль общения — от строгого и делового до дружелюбного или даже слегка «чудаковатого». Подробности в материале Postium. Читайте также: 10 лучших курсов по работе с ChatGPT […]
Чат-бот Grok от компании xAI теперь умеет создавать короткие видео по текстовым подсказкам. Функция работает через инструмент Imagine: пользователю достаточно описать сцену, а нейросеть сама сгенерирует ролик с движением, звуком и озвучкой. Ранее Grok Imagine умел превращать в видео только изображения — можно было «оживить» фото, добавив движение или эмоцию. Postium показывает, как работает обновление. […]
Первый сезон «Fallout» стал для Prime Video редким случаем, когда экранизация игры не просто «сработала», а задала планку. Постапокалиптика с фирменным чёрным юмором, узнаваемые детали вселенной, три равноправные линии героев — и ни грамма боязни выглядеть странно. Финал аккуратно подвёл нас к расширению карты: из компактных, но разрушенных районов пустоши — в легендарный Нью-Вегас. В […]
Блоги компаний
Новости
Свежие статьи