Китайская лаборатория представила «рассуждающую» ИИ-модель, которая может стать конкурентом o1 от OpenAI

23:15
20 Ноября 2024
233

Китайская лаборатория представила одну из первых моделей искусственного интеллекта , способных к «рассуждению», которая, по их словам, может составить конкуренцию OpenAI o1.

В среду компания DeepSeek, занимающаяся исследованиями в области ИИ, анонсировала предварительную версию DeepSeek-R1. По заявлению компании, эта модель способна наравне с OpenAI o1-preview выполнять задачи, требующие логического мышления.

Особенности "рассуждающих" моделей

В отличие от большинства существующих ИИ, такие модели могут эффективно «проверять свои выводы», затрачивая больше времени на анализ вопроса или задачи. Это помогает им избегать типичных ошибок, часто возникающих у других моделей.

Как и OpenAI o1, DeepSeek-R1 способен «обдумывать» задачи, строить планы и выполнять последовательность действий для достижения ответа. Этот процесс может занимать десятки секунд в зависимости от сложности запроса.

DeepSeek утверждает, что DeepSeek-R1 (точнее, его версия DeepSeek-R1-Lite-Preview) демонстрирует сопоставимые результаты с o1-preview на двух популярных бенчмарках для ИИ: AIME и MATH. AIME оценивает производительность модели с помощью других ИИ, а MATH представляет собой сборник текстовых задач.

Тем не менее, модель пока не совершенна. Некоторые пользователи в X отметили, что DeepSeek-R1 испытывает трудности с играми на проверку логического мышления, такими как крестики-нолики, — аналогичная проблема наблюдается и у o1.

Уязвимость и цензура

DeepSeek-R1 легко поддается джейлбрейку, то есть может быть «обманута» запросами, которые заставляют игнорировать встроенные ограничения. Один из пользователей X сумел получить от модели подробный рецепт изготовления запрещенных веществ.

Кроме того, DeepSeek-R1 блокирует запросы, связанные с политически чувствительными темами. Например, модель отказалась отвечать на вопросы о китайском лидере Си Цзиньпине, площади Тяньаньмэнь и геополитических последствиях возможного вторжения Китая на Тайвань.

Подобное поведение, скорее всего, объясняется давлением со стороны китайских властей на проекты ИИ в стране. Все модели ИИ в Китае обязаны проходить проверку со стороны регулятора Интернета, чтобы их ответы соответствовали «основным социалистическим ценностям». Более того, сообщается, что правительство предложило создать список источников, запрещенных для обучения моделей. Это приводит к тому, что китайские ИИ часто избегают обсуждения тем, способных вызвать недовольство властей.

Кто стоит за DeepSeek?

DeepSeek, которая планирует открыть исходный код DeepSeek-R1 и предоставить API, является довольно необычной компанией. Она финансируется китайским хедж-фондом High-Flyer Capital Management, использующим ИИ для информирования своих торговых стратегий.

Одна из ранних моделей компании, DeepSeek-V2, способная анализировать текст и изображения, вынудила конкурентов, таких как ByteDance, Baidu и Alibaba, снизить цены на использование своих моделей, а некоторые даже предложили их бесплатно.

Читайте так же:

Григоренко: развитие своих современных технологий обеспечивает суверенитет РФ

Для обучения своих моделей High-Flyer строит собственные серверные кластеры. Последний из них включает 10 000 графических процессоров Nvidia A100 и обошелся компании в 1 миллиард юаней (~138 миллионов долларов).

Основатель High-Flyer, Лян Вэньфэн, выпускник факультета компьютерных наук, ставит перед собой цель достичь создания «сверхразумного» ИИ через проект DeepSeek.

Источник

Материал опубликован при поддержке сайта habr.com

Читайте так же: