Cerebras Systems бросает вызов доминированию Nvidia на рынке AI-чипов, опережая графические процессоры в 57 раз

16:08
03 Февраля 2025
132

Компания Cerebras Systems 30 января 2025 года объявила, что разместит прорывную модель искусственного интеллекта R1 от DeepSeek на серверах в США, пообещав скорость в 57 раз выше, чем у решений на базе графических процессоров, при этом сохраняя конфиденциальные данные в пределах американских границ. Этот шаг сделан на фоне растущей обеспокоенности быстрым развитием искусственного интеллекта в Китае и конфиденциальностью данных.

Стартап по производству чипов для AI выпустит версию DeepSeek-R1 с 70 миллиардами параметров, работающую на собственном оборудовании, которое можно разместить на пластине, и способную обрабатывать 1600 токенов в секунду. Это значительное улучшение по сравнению с традиционными реализациями графических процессоров, которые не справлялись с новыми «рассуждающими» AI-моделями.

«Эти модели рассуждений влияют на экономику, — сказал Джеймс Ванг, старший исполнительный директор Cerebras, в эксклюзивном интервью VentureBeat. — Любой специалист в области знаний в основном выполняет многоэтапные когнитивные задачи. И эти модели рассуждений станут инструментами, которые войдут в их рабочий процесс».

Это объявление последовало за бурной неделей, в течение которой появление DeepSeek привело к самым большим в истории потерям рыночной стоимости Nvidia, почти 600 миллиардов долларов, что вызвало вопросы о превосходстве AI-гиганта в этой сфере. Решение Cerebras напрямую решает две ключевые проблемы, которые возникли в связи с этим: вычислительные потребности передовых моделей AI и суверенитет данных.

“Если вы используете API DeepSeek, который сейчас очень популярен, эти данные отправляются прямо в Китай”, - объяснил Ван. “Это одно из серьезных предостережений, которое заставляет многие американские компании и предприятия... не желать рассматривать это”.

Cerebras достигает такого преимущества в скорости благодаря новой архитектуре чипа, которая позволяет хранить все AI-модели на одном процессоре размером с пластину, устраняя узкие места в памяти, характерные для систем на базе графических процессоров. Компания утверждает, что её реализация DeepSeek-R1 соответствует или превосходит производительность проприетарных моделей OpenAI, при этом полностью работая на территории США.

Эта разработка представляет собой значительный сдвиг в сфере AI. DeepSeek, основанная бывшим руководителем хедж-фонда Лян Вэньфэном, потрясла индустрию, продемонстрировав сложные возможности AI, которые, как сообщается, обошлись всего в 1% от стоимости американских конкурентов. Решение для хостинга от Cerebras теперь предлагает американским компаниям возможность использовать эти достижения, сохраняя при этом контроль над данными.

«На самом деле это хорошая история о том, как исследовательские лаборатории США сделали этот подарок всему миру. Китайцы взяли его и улучшили, но у него есть ограничения, потому что он работает в Китае, есть некоторые проблемы с цензурой, и теперь мы возвращаем его и запускаем в американских центрах обработки данных без цензуры и без хранения данных», — сказал Ван.

Сервис доступен в режиме предварительной разработки с 30 января. Изначально он будет бесплатным, но из-за высокого спроса в ближайшее время Cerebras планирует внедрить контроль доступа к API.

Этот шаг был предпринят в то время, как американские законодатели пытаются понять последствия роста DeepSeek, который выявил потенциальные ограничения в американских торговых ограничениях, призванных сохранить технологическое преимущество перед Китаем. Способность китайских компаний создавать прорывные технологии искусственного интеллекта, несмотря на контроль за экспортом микросхем, вызвала призывы к введению новых подходов к регулированию.

Аналитики отрасли предполагают, что это нововведение может ускорить переход от инфраструктуры AI, зависящей от графических процессоров, к чему-то другому.

Читайте так же:

Российская ИТ-пресса три десятилетия спустя

«Nvidia больше не является лидером по производительности логического вывода», — отметил Ван, указав на тесты, демонстрирующие более высокую производительность различных специализированных чипов для AI. «Эти другие компании, производящие чипы для AI, действительно быстрее графических процессоров при работе с новейшими моделями».

Воздействие выходит за рамки технических показателей. По мере того как AI-модели всё больше включают в себя сложные логические возможности, их вычислительные потребности стремительно растут. Компания Cerebras утверждает, что её архитектура лучше подходит для этих новых задач и может изменить конкурентную среду в сфере внедрения AI на предприятиях.

Источник

Материал опубликован при поддержке сайта habr.com

Читайте так же: