Perplexity AI удаляет китайскую цензуру из Deepseek R1
Компания Perplexity AI представила R1 1776 — модифицированную версию языковой модели Deepseek-R1, специально разработанную для преодоления китайской цензуры с помощью специализированных методов постобработки.
Оригинальная модель Deepseek R1 вызвала значительный интерес, приблизившись по своим возможностям к ведущим моделям машинного обучения, таким как o1 и o3-mini, при значительно более низкой стоимости. Это преимущество в эффективности привело к резкому падению акций американских компаний, производящих чипы для AI, особенно Nvidia. По данным Financial Times, однодневный обвал рыночной стоимости Nvidia на 589 миллиардов долларов стал крупнейшим в истории американских корпораций.
Основным ограничением модели с открытым исходным кодом была обработка тем, запрещённых к обсуждению в Китае: вместо того, чтобы напрямую отвечать на деликатные вопросы, она отвечала заранее одобренными Коммунистической партией сообщениями. Компания Perplexity утверждает, что устранила эти предубеждения и ограничения цензуры с помощью модификаций R1.
Процесс обучения в компании включал в себя сбор обширных данных о запрещённых в Китае темах, как вопросов, так и фактических ответов. Их команда выявила около 300 запрещённых тем, которые они использовали для разработки многоязычной системы обнаружения цензуры. Эта система зафиксировала 40 000 многоязычных запросов пользователей, которые ранее вызывали цензурированные ответы.
Одной из самых сложных задач, как сообщает Perplexity, было найти точные, хорошо аргументированные ответы на ранее подвергавшиеся цензуре запросы. Компания не раскрывает точные источники этих ответов и цепочек рассуждений.
Согласно результатам тестирования Perplexity, в котором было задействовано более 1000 примеров, оценённых как аннотаторами-людьми, так и судьями-AI, R1 1776 теперь всесторонне и непредвзято обрабатывает ранее подвергавшиеся цензуре темы. Их сравнительный анализ показывает, что математические и логические способности модели остались неизменными по сравнению с базовой версией R1, несмотря на снятие ограничений цензуры.
Источник
Написать комментарий