Новый продукт от OpenAI: что известно об инструменте на основе AI, который может управлять компьютером

14:40
21 Января 2025
278

OpenAI, возможно, близок к выпуску инструмента на основе AI, который может управлять вашим ПК и выполнять действия от вашего имени. Тибор Блахо, инженер-программист, известный тем, что точно предсказывает появление новых продуктов AI, утверждает, что обнаружил доказательства существования давно обсуждаемого инструмента Operator от OpenAI. Ранее, в том числе в Bloomberg, сообщалось об Operator, который, как говорят, представляет собой «агентскую» систему, способную автономно выполнять такие задачи, как написание кода и бронирование билетов.

Согласно The Information, OpenAI планирует выпустить Operator в январе. Код, обнаруженный Blaho в эти выходные, подтверждает эту информацию.

По словам Блахо, в клиенте ChatGPT от OpenAI для macOS появились скрытые на данный момент опции для определения сочетаний клавиш «Переключить оператора» и «Выключить оператора». По словам Блахо, OpenAI добавила ссылки на Operator на свой веб-сайт, хотя пока они не доступны публично.

По словам Блахо, сайт OpenAI также содержит еще не опубликованные таблицы, сравнивающие производительность Operator с другими компьютерными системами искусственного интеллекта. Таблицы вполне могут быть заполнителями. Но если цифры точны, они предполагают, что Operator не надежен на 100%, в зависимости от задачи.

В OSWorld, тестовой системе, созданной для моделирования реальных условий работы компьютера, «OpenAI Computer Use Agent (CUA)», вероятно, модель искусственного интеллекта, которая лежит в основе Operator, демонстрирует результат в 38,1%, опережая модель управления компьютером Anthropic, но значительно уступая на 72,4% людям. OpenAI CUA превосходит людей по результатам в WebVoyager, который оценивает способность AI перемещаться по веб-сайтам и взаимодействовать с ними. Но, согласно просочившимся в сеть результатам тестов, модель не дотягивает до показателей человеческого уровня в другом веб-тесте WebArena.

Operator также сталкивается с трудностями при выполнении задач, которые человек мог бы выполнить легко, если верить утечке. В тесте, в ходе которого требовалось зарегистрироваться у облачного провайдера и запустить виртуальную машину, Operator добивался успеха только в 60% случаев. При создании биткоин-кошелька Operator добивался успеха только в 10% случаев.

Неизбежное появление OpenAI на рынке AI-агентов происходит на фоне того, что конкуренты, в том числе вышеупомянутая Anthropic, Google и другие, борются за зарождающийся сегмент. AI-агенты могут быть рискованными и спекулятивными, но технологические гиганты уже рекламируют их как следующую большую вещь в сфере AI. По данным аналитической компании Markets and Markets, к 2030 году рынок AI-агентов может составить 47,1 миллиарда долларов.

Сегодняшние агенты довольно примитивны. Но некоторые эксперты обеспокоены их безопасностью в случае стремительного развития технологий.

На одной из просочившихся в сеть диаграмм видно, что Operator хорошо справляется с некоторыми тестами на безопасность, в том числе с тестами, которые пытаются заставить систему выполнять «незаконные действия» и искать «конфиденциальные личные данные». Как сообщается, тестирование безопасности является одной из причин длительного цикла разработки Operator. В недавнем посте соучредитель OpenAI Войцех Заремба раскритиковал Anthropic за выпуск агента, в котором, по его мнению, отсутствуют меры безопасности.

«Я могу только представить себе негативную реакцию, если бы OpenAI выпустила что-то подобное», — написал Заремба.

Стоит отметить, что исследователи AI, в том числе бывшие сотрудники OpenAI, критиковали компанию за то, что она якобы уделяла меньше внимания безопасности в пользу быстрого внедрения своей технологии.

Источник

Материал опубликован при поддержке сайта habr.com

Читайте так же: