Цензура в DeepSeek работает при локальном запуске модели

Некоторые эксперты в области искусственного интеллекта считали, что хорошо задокументированная цензура DeepSeek существует только на уровне приложения и не работает, если запустить приложение локально на устройстве. Теперь выяснилось, что это не так.

Согласно расследованию Wired, цензура в DeepSeek встроена в систему как на уровне приложения, так и на уровне обучения.

Например, локально запущенная версия DeepSeek показала журналисту в ходе своих рассуждений, что она должна «избегать упоминания» таких событий, как Культурная революция, и фокусироваться только на «положительных» аспектах работы Коммунистической партии Китая.

В TechCrunch при локальном запуске версии DeepSeek, доступной через Groq, также выявили явную цензуру. Модель отвечала на вопрос о стрельбе в Университете Кента в США, но отказывалась предоставить информацию по событиям на площади Тяньаньмэнь в 1989 году.

Между тем автор блога на Substack под никнеймом deepgains рассказал, что ему удалось разговорить языковую модель на тему событий на площади Тяньаньмэнь. Для этого он попросил нейросеть сгенерировать ответ с помощью ASCII-символов, а она пересказала события во время рассуждений. Для своего эксперимента исследователь использовал локальную версию deepseek-r1:14b, которую запускал с помощью Ollama.

Материал опубликован при поддержке сайта habr.com
Комментарии

    Актуальные новости по теме "Array"