Ссылка на официальный стрим:
Сегодня OpenAI представили новый набор инструментов и API, упрощающих создание агентов - систем, способных самостоятельно выполнять задачи от имени пользователей. Эти новинки помогут разработчикам и компаниям быстрее создавать надёжные агентные приложения, снизив необходимость сложной кастомной логики и многочисленных итераций промптов.
Новое API, которое:
Совмещает простоту Chat Completions и возможности использования инструментов Assistants API.
Поддерживает встроенные инструменты: веб-поиск, поиск по файлам и выполнение задач на компьютере.
Обеспечивает простую интеграцию и доступ к результатам модели через SDK-хелперы.
А именно:
Веб-поиск:
Позволяет получать актуальную информацию из интернета с указанием источников.
Использует модели GPT-4o и GPT-4o-mini.
Имеет высокую точность (90% по тестам SimpleQA).
Поиск по файлам:
Быстро извлекает информацию из больших объёмов документов.
Поддерживает различные типы файлов, метаданные и кастомные настройки ранжирования.
Удобен для агентов поддержки клиентов, юридических и технических помощников.
Использование компьютера (Computer Use Tool):
Позволяет агентам выполнять задачи на компьютере, имитируя действия мыши и клавиатуры.
Работает через модель CUA (Computer-Using Agent), уже показавшую рекордные результаты в веб-задачах.
Подходит для автоматизации QA, заполнения данных и работы с устаревшими системами.
Пример работы с файлами:
const productDocs = await openai.vectorStores.create({ name: "Product Documentation", file_ids: [file1.id, file2.id, file3.id],});const response = await openai.responses.create({ model: "gpt-4o-mini", tools: [{ type: "file_search", vector_store_ids: [productDocs.id], }], input: "What is deep research by OpenAI?",});console.log(response.output_text);
Пример работы с Computer Use:
const response = await openai.responses.create({ model: "computer-use-preview", tools: [{ type: "computer_use_preview", display_width: 1024, display_height: 768, environment: "browser", }], truncation: "auto", input: "I'm looking for a new camera. Help me find the best one.",});console.log(response.output);
Ну и немножко бенчмарков этих тулов:
Открытый инструмент для простой оркестрации многоагентных сценариев (видимо, конкурент LangChain). Включает удобную конфигурацию агентов, механизм передачи задач между агентами, проверки безопасности (Guardrails) и инструменты мониторинга для оптимизации работы агентов.
Agents SDK позволяет удобно конфигурировать агентов с инструкциями, встроенными инструментами, передачей задач и проверками безопасности. SDK уже поддерживает Python, скоро будет доступна поддержка Node.js.
С помощью Agents SDK компании могут быстро интегрировать агенты в рабочие процессы, например, для обработки клиентских обращений, анализа данных и автоматизации продаж.
Пример кода:
from agents import Agent, Runner, WebSearchTool, function_tool, guardrail@function_tooldef submit_refund_request(item_id: str, reason: str): # Your refund logic goes here return "success"support_agent = Agent( name="Support & Returns", instructions="You are a support agent who can submit refunds [...]", tools=[submit_refund_request],)shopping_agent = Agent( name="Shopping Assistant", instructions="You are a shopping assistant who can search the web [...]", tools=[WebSearchTool()],)triage_agent = Agent( name="Triage Agent", instructions="Route the user to the correct agent.", handoffs=[shopping_agent, support_agent],)output = Runner.run_sync( starting_agent=triage_agent, input="What shoes might work best with my outfit so far?",)
OpenAI стремится сделать агентов неотъемлемой частью рабочих процессов во всех отраслях, значительно повышая производительность труда. Компания продолжит развивать и углублять интеграции и инструменты для быстрого и удобного создания агентов, анонсируя новые возможности уже в ближайшее время.
P.S. В своём телеграм-канале я заставляю ИИ писать мне код, обозреваю свежие новости технологий, а ещё публикую эти самые новости раньше всех. Регулярно даю глубокую аналитику по отрасли и всем событиям, и рассказываю как создавать собственных ИИ-агентов и приложения с ИИ (и как раз на днях потестирую новые API от OpenAI для агентов). И много других интересных непотребств. Велком!
Обсудить