Первые пользователи протестировали ChatGPT Operator от OpenAI на реальных задачах

ChatGPT Operator от OpenAI впервые используется пользователями из США, у которых есть ранний доступ к этому инструменту. В то время как на мероприятии по запуску OpenAI были продемонстрированы базовые функции, такие как бронирование столиков в ресторанах и планирование поездок, пользователи расширяют границы возможностей этого AI-агента, чтобы увидеть, на что он действительно способен.

Дэн Мак поделился видео, на котором Operator просматривает объявления о вакансиях с загруженным им резюме. Агенту удалось найти вакансию, которая соответствовала его опыту — задача, с которой он справился хорошо, несмотря на то, что работал довольно медленно.

Разработчик программного обеспечения Киран Клаассен нашёл другой вариант использования, протестировав Operator в локальных средах разработки.

Тем временем Алекс Волков потратил 40 минут на то, чтобы привести систему в порядок. Ему понравилось, как она может совмещать несколько задач и понимать такие концепции, как цитирование твитов, но заметил некоторые проблемы с обработкой файлов cookie и временем завершения задачи. В какой-то момент Operator, казалось, был сбит с толку собственными возможностями, спросив, должен ли он продолжать отслеживать чат, когда ничего не происходит.

Крис Кернер опробовал более предпринимательский подход. Он создал настройку, которая позволила Operator автоматически отправлять сообщения продавцам на торговой площадке Facebook*, предлагающим услуги по доставке пианино по цене 200 долларов. После первоначальной настройки система начала работать самостоятельно и даже регистрировала свои действия в Google Таблицах.

Не все тесты прошли гладко. Один пользователь Reddit попытался заставить Operator собрать информацию о 50 ютуберах, включая профили в LinkedIn и адреса электронной почты. Хотя агент знал, как открыть веб-браузер, он искал Bing вместо YouTube и с трудом нашёл подходящую таблицу. Через 20 минут пользователь сдался, получив неполную таблицу на незнакомом сайте Office с неверными контактными данными всего 18 инфлюенсеров.

Некоторые пользователи сообщают, что при использовании Operator возникают проблемы с доступом к веб-сайтам. В посте на r/webdev утверждалось, что eBay препятствует массовому сбору цен, хотя это может быть связано с общей защитой от ботов, а не с блокировкой конкретного оператора. Судя по всему, система использует виртуальный браузер Chrome через серверы Microsoft Azure, но в файлах robots.txt пока нет специального параметра для управления доступом.

Похоже, что на Reddit действует аналогичная защита, но пользователь Роуэн Чунг показал, как Operator нашёл обходной путь, используя вместо этого результаты поиска Bing.

Согласно этим отчётам, ChatGPT Operator, по-видимому, соответствует базовому принципу автономной навигации по интернету. Вероятно, причина того, что этот метод работает эффективнее предыдущих, заключается в том, что система не только обращается к DOM веб-страницы, но и анализирует скриншоты с помощью мультимодальной версии GPT-4o.

Как и в случае со старыми системами-агентами, на тестировщиков поначалу производит впечатление автономность. Однако она по-прежнему совершает слишком много ошибок, чтобы пользователи могли полагаться на неё при выполнении важных задач без постоянного контроля.

*Meta и её продукты (Instagram, Facebook) запрещены на территории Российской Федерации

Источник

Материал опубликован при поддержке сайта habr.com
Комментарии

    Актуальные новости по теме "Array"