Искусственный интеллект нового поколения: как Grok 3 Маска опередил ведущие AI-системы
Илон Маск представил новую модель искусственного интеллекта Grok 3 от стартапа xAI, утверждая, что она превосходит ведущих конкурентов по ключевым техническим показателям. Этот шаг существенно усиливает гонку за создание более мощных AI-систем.
Запуск Grok 3 произошел спустя всего несколько дней после неудачной попытки Маска приобрести OpenAI за $97,4 миллиарда. Во время трансляции на платформе X, Маск заявил, что Grok 3 «на порядок мощнее, чем Grok 2», и выделил её способность решать сложные задачи.
Ранние тесты подтверждают некоторые заявления xAI. Модель возглавила рейтинг Chatbot Arena, превзойдя GPT-4o от OpenAI, Google Gemini и V3 от DeepSeek в слепых тестах пользователей. Согласно опубликованным данным, Grok 3 показывает лучшие результаты в математике (AIME ’24), научном мышлении (GPQA) и задачах программирования.
«Grok 3 демонстрирует передовые способности к логическому мышлению. Мало какие модели справляются с этим стабильно. Модели OpenAI с этим справляются, но DeepSeek-R1, Gemini 2.0 Flash Thinking и Claude — нет», — написал бывший исследователь OpenAI Андрей Карпати на X после тестирования.
Создание модели потребовало огромных вычислительных мощностей. xAI удвоила кластер GPU до 200 000 чипов Nvidia, расположенных в новом дата-центре в Мемфисе. Это подчеркивает растущие требования к вычислительным ресурсам для разработки передовых AI-систем.
Одним из ключевых новшеств Grok 3 стала функция «DeepSearch», которая сочетает веб-поиск с возможностями анализа, позволяя модели извлекать и обрабатывать информацию из различных источников. Также есть режимы для решения сложных задач, такие как «Think», который показывает ход рассуждений модели, и режим «Big Brain», выделяющий больше ресурсов на сложные задачи.
«Самое важное в AI — это скорость обучения. А @xai учится быстрее всех», — написал ветеран техиндустрии Роберт Скобл, ссылаясь на разговор с сооснователем Apple Siri Томом Грубером.
Однако тесты выявили и недостатки. Карпати отметил, что модель иногда выдумывает ссылки и испытывает трудности с юмором и задачами, связанными с этическими вопросами. Эти проблемы характерны для большинства современных AI-систем и подчеркивают сложность создания искусственного интеллекта, который мыслит на уровне человека.
Генеральный директор Scale.ai Александр Ванг высоко оценил Grok 3, заявив в Twitter: Это новая лучшая модель в мире от команды @xai Он отметил её превосходство в ряде тестов и выразил желание сотрудничать с xAI.
Grok 3 будет доступна по подписке Premium+ на платформе X за $40 в месяц, а также через новый сервис SuperGrok за $30 в месяц. В ближайшие недели планируется запуск API для корпоративных клиентов.
Этот запуск усиливает конкуренцию на рынке AI, особенно в свете того, что китайский стартап DeepSeek недавно представил сопоставимую модель с меньшими вычислительными требованиями. Это также поднимает вопросы о том, насколько устойчива текущая гонка за вычислительные мощности, так как компании вкладывают миллиарды долларов в оборудование для развития AI.
Маск подчеркнул, что Grok 3 всё ещё находится в стадии бета-тестирования, и улучшения ожидаются «почти каждый день». В ближайшие недели компания планирует добавить голосовое взаимодействие, а предыдущая модель Grok 2 станет доступной с открытым кодом после стабилизации новой версии.
Однако самым примечательным в запуске Grok 3, возможно, является не её технические характеристики или результаты тестов, а то, что она символизирует: нарастающее напряжение между Маском и его бывшими коллегами из OpenAI. Спустя всего несколько дней после неудачной попытки приобрести OpenAI за $97,4 миллиарда, Маск представил модель, которая бросает вызов её лидерству — доказав, что даже отвергнутый сооснователь может стать серьёзным конкурентом в гонке за доминирование в сфере AI.
Источник
Написать комментарий