OpenAI опубликовала документ «Системная карта GPT-4o», представляющий собой исследование, в котором описываются меры безопасности и оценки рисков, проведенные перед запуском GPT-4o.
ИИ-модель GPT-4o была официально представлена в мае этого года. Перед запуском модели, OpenAI пригласила группу независимых экспертов по безопасности (так называемую «красную команду»), чтобы оценить потенциальные риски, связанные с моделью.
Эксперты оценивали риск того, что искусственный интеллект будет сам создавать копии человеческих голосов, эротический и жестокий контент. И сегодня были обнародованы результаты этой проверки.
По результатам исследования GPT-4o получила «средний» уровень риска согласно внутренней системе оценок. Общий уровень риска определялся на основе наивысшей оценки риска по четырём категориям: кибербезопасность, биологические угрозы, убедительность и автономность модели.
Все категории, кроме убедительности, получили «низкий» уровень риска. Также, было обнаружено, что некоторые тексты, написанные GPT-4o, могут быть более убедительными, чем тексты, написанные человеком.
При этом, в отчёте по рискам, OpenAI раскрывает некоторые странности GPT-4o, такие как упомянутое ранее клонирование голоса. В редких случаях — особенно когда человек разговаривает с GPT-4o в условиях сильного фонового шума, например, в машине на дороге, — GPT-4o может «имитировать голос пользователя», сообщает компания OpenAI.
GPT-4o может создавать тревожные или неуместные звуки, например, эротические стоны, крики ужаса и выстрелы, если его об этом попросить. OpenAI утверждает, что есть доказательства того, что модель в целом отказывается выполнять такие запросы, но некоторые из них всё же проходят.
Также GPT-4o может нарушать авторские права на музыку, но OpenAI внедрила фильтры, которые это предотвращают.
В отчёте OpenAI говорится, что модель проинструктировали не петь в новом голосовом режиме, чтобы избежать копирования стиля, тембра и манеры исполнения узнаваемых артистов.
Ранее OpenAI сообщила, что они разработали текстовые «водяные знаки» для распознавания текста, сгенерированного ChatGPT.
⭐ Самое важное мы оперативно публикуем в Telegram-канале: https://t.me/postiumru/. +Плюс эксклюзивы, которых нет на сайте.
⭐ Самое важное мы оперативно публикуем в Telegram-канале: https://t.me/postiumru/. +Плюс эксклюзивы, которых нет на сайте.