
Во вторник OpenAI выпустила новые инструменты, разработанные для помощи разработчикам и предприятиям в создании искусственных интеллект-агентов - автоматизированных систем, способных самостоятельно выполнять задачи - с использованием собственных моделей и фреймворков искусственного интеллекта компании.
\nИнструменты являются частью нового API-интерфейса OpenAI, который позволяет бизнесам разрабатывать настраиваемых искусственных интеллект-агентов, способных проводить поиск в Интернете, просматривать файлы компании и навигироваться по веб-сайтам, подобно продукту Operator от OpenAI. API Responses фактически заменяет API Assistants от OpenAI, который компания планирует закрыть в первой половине 2026 года.
\nИдея о искусственных интеллект-агентах в последние годы резко возросла, несмотря на то, что техническая отрасль борется показать людям, или даже определить, что такое "искусственные интеллект-агенты". В последнем примере того, как хайп вокруг агентов опережает их реальную пользу, китайский стартап Butterfly Effect на прошлой неделе стал вирусным благодаря новой платформе для искусственного интеллекта под названием Manus, которую пользователи быстро обнаружили, что не оправдывает многих обещаний компании.
\nДругими словами, для OpenAI стоит высокая ставка на создание агентов правильно.
\n“Довольно легко продемонстрировать своего агента,” - сказал Оливье Годеман, руководитель продукта API OpenAI, в интервью TechCrunch. “Масштабировать агента довольно сложно, и добиться того, чтобы люди его часто использовали, очень сложно”.
\nРанее в этом году OpenAI представила двух искусственных интеллект-агентов в ChatGPT: Operator, который навигирует по веб-сайтам от вашего имени, и deep research, который создает исследовательские отчеты для вас. Оба инструмента предоставили возможность увидеть, что может достичь агентная технология, но оставили много желаемого в отделе "автономности".
\nТеперь с Responses API OpenAI хочет продать доступ к компонентам, которые обеспечивают работу искусственных интеллект-агентов, позволяя разработчикам создавать собственные приложения-агенты в стиле Operator и deep research. OpenAI надеется, что разработчики смогут создать некоторые приложения с помощью своей агентной технологии, которые будут более автономными, чем доступные сегодня.
\nИспользуя Responses API, разработчики могут использовать те же модели искусственного интеллекта (на предпросмотре), которые используются внутри инструмента поиска веб-сайтов ChatGPT Search от OpenAI: GPT-4o search и GPT-4o mini search. Модели могут просматривать Интернет в поисках ответов на вопросы, указывая источники в процессе генерации ответов.
\nOpenAI утверждает, что GPT-4o search и GPT-4o mini search являются высоко фактически точными. По их бенчмарку SimpleQA, который оценивает способность моделей отвечать на короткие факт-запросы, GPT-4o search набирает 90%, в то время как GPT-4o mini search набирает 88% (чем выше, тем лучше). Для сравнения, GPT-4.5 - гораздо более крупная, недавно выпущенная модель OpenAI - набирает всего 63%.
\nResponses API также включает утилиту поиска файлов, которая может быстро сканировать файлы в базах данных компании для извлечения информации. (OpenAI утверждает, что не будет обучать модели на этих файлах.) Кроме того, разработчики, использующие Responses API, могут использовать модель Computer-Using Agent (CUA) от OpenAI, которая управляет Operator. Модель генерирует действия мыши и клавиатуры, позволяя разработчикам автоматизировать задачи использования компьютера, такие как ввод данных и рабочие процессы приложений.
\nПредприятия могут по желанию запускать модель CUA, которая выходит в исследовательском превью, локально на своих собственных системах, сообщила OpenAI. Потребительская версия CUA, доступная в Operator, может только выполнять действия в Интернете.
\nЧтобы быть ясным, Responses API не решит все технические проблемы, мучающие сегодня искусственные интеллект-агенты.
\nХотя поисковые инструменты на основе искусственного интеллекта более точны, чем традиционные модели искусственного интеллекта - факт, который не удивителен, учитывая, что они просто могут найти правильный ответ - веб-поиск не решает проблему галлюцинаций искусственного интеллекта. Поиск GPT-4o все еще допускает 10% ошибок в фактической информации. Кроме их точности, инструменты поиска на основе искусственного интеллекта также часто сталкиваются с короткими навигационными запросами (например, "Счет Лейкерс сегодня"), и последние отчеты позволяют предположить, что цитаты ChatGPT не всегда надежны.
\nВ блоге, предоставленном TechCrunch, OpenAI заявила, что модель CUA “пока не очень надежно для автоматизации задач на операционных системах”, и что она подвержена совершению “случайных” ошибок.
\nТем не менее, OpenAI заявила, что это ранние итерации их инструментов агентов, и они постоянно работают над их улучшением.
\nВ дополнение к Responses API, OpenAI выпускает бесплатный набор инструментов под названием Agents SDK, который предлагает разработчикам инструменты для интеграции моделей с их внутренними системами, внедрения защитных механизмов и отслеживания деятельности искусственного интеллект-агента для целей отладки и оптимизации. Agents SDK является своего рода продолжением Swarm от OpenAI, фреймворка для оркестрации многих агентов, который компания выпустила в конце прошлого года.
\nГодеман сказал, что он надеется, что OpenAI сможет сократить разрыв между демонстрациями агента и продуктами в этом году, и что, по его мнению, “агенты - это наиболее важное применение искусственного интеллекта, которое произойдет”. Это подтверждает заявление генерального директора OpenAI Сэма Альтмана в январе: что 2025 год станет годом вхождения искусственных интеллект-агентов в рабочую силу.
\nБудет ли 2025 год действительно “годом искусственного интеллект-агента”, последние релизы OpenAI показывают, что компания хочет сдвинуться от эффектных демонстраций агентов к воздейственным инструментам.