OpenAI только что анонсировали новые инструменты для создания автономных ИИ

20:13
11 Марта 2025
257

Что-то сегодня в мире ИИ много новостей для разработчиков. На этот раз OpenAI выпустили обновление API, которые должны упростить и ускорить создание собственных агентских систем.

Ссылка на официальный стрим:

Что именно анонсировали?

Сегодня OpenAI представили новый набор инструментов и API, упрощающих создание агентов - систем, способных самостоятельно выполнять задачи от имени пользователей. Эти новинки помогут разработчикам и компаниям быстрее создавать надёжные агентные приложения, снизив необходимость сложной кастомной логики и многочисленных итераций промптов.

1. Responses API

Новое API, которое:

Совмещает простоту Chat Completions и возможности использования инструментов Assistants API.
Поддерживает встроенные инструменты: веб-поиск, поиск по файлам и выполнение задач на компьютере.
Обеспечивает простую интеграцию и доступ к результатам модели через SDK-хелперы.

2. Встроенные инструменты Responses API

А именно:

Веб-поиск:
- Позволяет получать актуальную информацию из интернета с указанием источников.
- Использует модели GPT-4o и GPT-4o-mini.
  Читайте так же:
  - IT-Weekly: остановлен проект корпусирования процессоров Baikal M; в РФ появится технологический сбор
- Имеет высокую точность (90% по тестам SimpleQA).
Поиск по файлам:
- Быстро извлекает информацию из больших объёмов документов.
- Поддерживает различные типы файлов, метаданные и кастомные настройки ранжирования.
- Удобен для агентов поддержки клиентов, юридических и технических помощников.
Использование компьютера (Computer Use Tool):
- Позволяет агентам выполнять задачи на компьютере, имитируя действия мыши и клавиатуры.
- Работает через модель CUA (Computer-Using Agent), уже показавшую рекордные результаты в веб-задачах.
- Подходит для автоматизации QA, заполнения данных и работы с устаревшими системами.

Пример работы с файлами:

const productDocs = await openai.vectorStores.create({    name: "Product Documentation",    file_ids: [file1.id, file2.id, file3.id],});const response = await openai.responses.create({    model: "gpt-4o-mini",    tools: [{        type: "file_search",        vector_store_ids: [productDocs.id],    }],    input: "What is deep research by OpenAI?",});console.log(response.output_text);

Пример работы с Computer Use:

const response = await openai.responses.create({    model: "computer-use-preview",    tools: [{        type: "computer_use_preview",        display_width: 1024,        display_height: 768,        environment: "browser",    }],    truncation: "auto",    input: "I'm looking for a new camera. Help me find the best one.",});console.log(response.output);

Ну и немножко бенчмарков этих тулов:

Читайте так же:

IT-Weekly: остановлен проект корпусирования процессоров Baikal M; в РФ появится технологический сбор

3. Agents SDK

Открытый инструмент для простой оркестрации многоагентных сценариев (видимо, конкурент LangChain). Включает удобную конфигурацию агентов, механизм передачи задач между агентами, проверки безопасности (Guardrails) и инструменты мониторинга для оптимизации работы агентов.

Agents SDK позволяет удобно конфигурировать агентов с инструкциями, встроенными инструментами, передачей задач и проверками безопасности. SDK уже поддерживает Python, скоро будет доступна поддержка Node.js.

С помощью Agents SDK компании могут быстро интегрировать агенты в рабочие процессы, например, для обработки клиентских обращений, анализа данных и автоматизации продаж.

Пример кода:

from agents import Agent, Runner, WebSearchTool, function_tool, guardrail@function_tooldef submit_refund_request(item_id: str, reason: str):    # Your refund logic goes here    return "success"support_agent = Agent(    name="Support & Returns",    instructions="You are a support agent who can submit refunds [...]",    tools=[submit_refund_request],)shopping_agent = Agent(    name="Shopping Assistant",    instructions="You are a shopping assistant who can search the web [...]",    tools=[WebSearchTool()],)triage_agent = Agent(    name="Triage Agent",    instructions="Route the user to the correct agent.",    handoffs=[shopping_agent, support_agent],)output = Runner.run_sync(    starting_agent=triage_agent,    input="What shoes might work best with my outfit so far?",)

Планы на будущее

OpenAI стремится сделать агентов неотъемлемой частью рабочих процессов во всех отраслях, значительно повышая производительность труда. Компания продолжит развивать и углублять интеграции и инструменты для быстрого и удобного создания агентов, анонсируя новые возможности уже в ближайшее время.

P.S. В своём телеграм-канале я заставляю ИИ писать мне код, обозреваю свежие новости технологий, а ещё публикую эти самые новости раньше всех. Регулярно даю глубокую аналитику по отрасли и всем событиям, и рассказываю как создавать собственных ИИ-агентов и приложения с ИИ (и как раз на днях потестирую новые API от OpenAI для агентов). И много других интересных непотребств. Велком!

Материал опубликован при поддержке сайта habr.com

Читайте так же: