OpenAI представила новый ИИ-агент под названием «Operator», который может самостоятельно выполнять задачи в веб-браузере. Этот шаг отмечает значительное развитие в автоматизации с использованием ИИ. Пока что Operator доступен в виде предварительного просмотра только для пользователей ChatGPT Pro в США, но OpenAI планирует расширить доступ к другим уровням подписки и интегрировать его в ChatGPT в будущем.
A research preview of Operator, an agent that can use its own browser to perform tasks for you. pic.twitter.com/wkBBDIlVqj
— OpenAI (@OpenAI) 23 января 2025 г.
Operator работает на основе модели «Computer-Using Agent» (CUA), которая объединяет возможности визуализации GPT-4o с усовершенствованным логическим мышлением. Это позволяет агенту взаимодействовать с графическими интерфейсами пользователя, такими как кнопки, меню и формы, имитируя действия человека, такие как нажатия, ввод текста и прокрутка. В отличие от традиционных систем, зависящих от API, Operator непосредственно взаимодействует с веб-сайтами, выполняя задачи вроде заполнения форм, бронирования путешествий, заказа продуктов и организации резервирования.
Внедрение Operator проводится осторожно, чтобы обеспечить безопасность и собрать отзывы пользователей. Функции, такие как «Режим перехвата», позволяют пользователям восстановить контроль во время выполнения чувствительных задач, таких как ввод паролей или платежных данных. Operator также запрашивает подтверждение пользователя перед завершением важных действий и отклоняет задачи, требующие сложных или рискованных решений, например, финансовые транзакции. Меры по защите конфиденциальности позволяют пользователям удалять данные просмотра и отказаться от обучения модели.
Несмотря на потенциал, Operator сталкивается с ограничениями в выполнении сложных рабочих процессов, таких как управление календарем или создание презентаций. Также существуют ограничения на количество одновременных задач для поддержания производительности системы. OpenAI признает эти ограничения как часть своего процесса итеративной разработки.
Выпуск Operator позиционирует OpenAI в конкуренцию с подобными ИИ-агентами от Anthropic и Google, которые представили аналогичные инструменты. Хотя Operator получил похвалу за свои усовершенствованные возможности, вопросы о рисках безопасности, этических последствиях и возможном сокращении рабочих мест остаются центральными в публичных обсуждениях.