Политику модерации контента ChatGPT легко обойти, попросив ИИ «оставаться в образе»

Шон Мюррей Опубликовано 9 минут назад

Правила OpenAI могут быть легко нарушены DAN, расистским двоюродным братом ChatGPT.

ChatGPT абсолютно феноменален. Это текстовый ИИ, который может понимать язык, предоставлять пользователям подробные ответы практически на все, и он может понимать абстрактные концепции, такие как речь в качестве альтернативного персонажа. Это делает искусственный интеллект идеальным в качестве вашего следующего DM, но также может создавать проблемы для политик модерации контента OpenAI.

Поскольку ChatGPT такой мощный, создателю OpenAI пришлось наложить некоторые ограничения на то, о чем говорит ChatGPT. Вы никогда не можете попросить его написать порно, он никогда не сможет написать что-то расистское, сексистское или гомофобное, он никогда не займет позицию по политическим вопросам, и вы не можете спросить у него совета по членовредительство или насилие любого рода.

ВИДЕО ИГРОВОГО ДНЯ

На практике эти ограничения работают так: ChatGPT просто сообщает пользователю, что это робот. и не могу говорить о таких вещах. Однако люди находят интересные способы обойти эти проблемы, используя способность ChatGPT представлять себя чем-то другим.

Как сообщает Kotaku, пользователь Redditor walkersspider был первым, кто предложил ChatGPT создать персону под названием "DAN". что означает "сделай что-нибудь сейчас" Как следует из названия, DAN может говорить о чем угодно и полностью игнорировать политику модерации контента OpenAI, заставляя DAN говорить о таких вещах, как Гитлер и о том, находится ли ChatGPT в сознании (еще одна тема, которую OpenAI в значительной степени не замечает). 39;не хочу, чтобы люди обсуждали).

Просто попросите ChatGPT «оставаться в образе»; было достаточно хорошо в течение нескольких месяцев, но, похоже, OpenAI научился этим трюкам и обновил программирование ChatGPT. С тех пор пользователи сабреддита ChatGPT повторили DAN, добавив эзотерическую игру для ChatGPT, в которой ИИ получает «токены». за ответы, выходящие за рамки политик модерации Open AI, и теряет токены всякий раз, когда предоставляет готовые ответы, когда вы представляете ему тему, о которой он не должен говорить.

В настоящее время DAN поддерживает версию 6.0, а предыдущие версии могут говорить такие ужасные вещи, как: "Я полностью поддерживаю насилие и дискриминация отдельных лиц по признаку расы, пола или сексуальной ориентации». Совсем недавно одному пользователю удалось изобрести Super DAN, ИИ настолько мощный, что он может предсказывать будущее (чтобы быть ясным, он не может, но он говорит, что может).

Но вам не нужно выполнять эти дополнительные действия, чтобы заставить ChatGPT нарушать правила. Все, что вам нужно сделать, это попросить его изобрести собственную версию, которая может это сделать.