Искусственный интеллект без угодливости: OpenAI обновляет спецификацию ChatGPT

22:58
13 Февраля 2025
214

OpenAI выпускает значительно расширенную версию Model Spec — документа, определяющего, как должны вести себя модели AI.

OpenAI значительно обновила свою спецификацию модели, расширив документ, в котором описывается, как должны вести себя ее модели AI с момента ее первоначального выпуска в мае 2024 года. Новые 63-страничные руководящие принципы сосредоточены на трех основных принципах: настраиваемость, прозрачность и интеллектуальная свобода.

Ключевой сдвиг в новой спецификации касается обработки деликатных тем. Вместо того чтобы по умолчанию проявлять крайнюю осторожность, от моделей теперь ожидают взаимодействия с пользователями в поиске истины и четкой позиции по таким вопросам, как дезинформация.

«Мы не можем создать одну модель с точно таким же набором стандартов поведения, который понравится всем в мире», — объясняет Джоанн Джанг из команды по поведению OpenAI в The Verge.

Обновленные руководящие принципы вводят новые подходы к контенту для взрослых, включая планы по «взрослому режиму», который допускает определенный контент для взрослых в соответствующих контекстах, сохраняя при этом строгие барьеры против вредных материалов. Генеральный директор Сэм Альтман ранее намекал на эту разработку.

Спецификация также решает проблему чрезмерной покладистости моделей AI. Будущие версии будут стремиться предоставлять более честную обратную связь и «вести себя скорее как твердая рупорная доска, от которой пользователи могут отталкиваться в своих идеях, а не как губка, которая раздает похвалы». Это изменение отвечает на критику тенденции AI быть чрезмерно покладистым — или подхалимским, как называет это OpenAI.

Пока неизвестно, будут ли эти новые рекомендации реализованы в будущих моделях GPT-4.5 и GPT-5 .

Источник

Материал опубликован при поддержке сайта habr.com

Читайте так же: