OpenAI запускает Operator — своего первого ИИ-агента, способного бронировать билеты, путевки и покупать продукты

OpenAI запускает Operator — своего первого ИИ-агента, способного бронировать билеты, путевки и покупать продукты:

  • Компания OpenAI представила Operator — своего первого ИИ-агента для подписчиков ChatGPT Pro в США.
  • Он может автономно выполнять такие задачи, как бронирование столиков или покупка продуктов.
  • Агент работает на базе новой модели, созданной в GPT-4o, называемой CUA.

Эксперты прогнозировали, что 2025 год станет годом, когда ИИ-агенты станут мейнстримом, и OpenAI оправдывает этот прогноз.

В четверг компания OpenAI представила Operator — систему, которая может использовать веб-браузер для таких задач, как бронирование билетов и покупка товаров.

В то время как чат-боты, такие как популярный ChatGPT от OpenAI, используют генеративный ИИ для ответа на запросы, Operator — это агент, предназначенный для автономного выполнения задач.

OpenAI заявила, что Operator станет доступен в четверг в США для пользователей ChatGPT Pro, ежемесячного плана за 200 долларов, который обеспечивает доступ к ее последним моделям, включая o1. В ближайшие месяцы, как заявила компания, он также станет доступен подписчикам ChatGPT Plus, ежемесячного уровня подписки OpenAI за 20 долларов, и пользователям в других странах.

Во время прямой трансляции, анонсирующей Operator в четверг, генеральный директор OpenAI Сэм Альтман назвал релиз «предварительным исследованием», добавив, что он будет дорабатываться в течение следующих месяцев. Он сказал, что OpenAI также будет запускать больше агентов.

Интерфейс похож на ChatGPT. Пользователи обращаются к оператору с запросом, например, «забронировать столик на ужин на 7 вечера». Они могут выбрать конкретный веб-сайт, через который они хотят обработать запрос, например OpenTable, или отправить запрос через поисковую систему, например Google.

Оператор суммирует свой процесс рассуждений на боковой панели, чтобы пользователи могли определить шаги, на которых он допускает ошибки, которые, по словам OpenAI, он все еще склонен совершать.

Пользователи также могут загрузить фотографию рукописного списка покупок и предложить оператору приобрести товары из списка.

Пользователи могут выбрать определенный сайт, например Instacart, на котором Оператор будет покупать продукты. Если сайт не выбран, по умолчанию будет выбрана поисковая система.

Рейитиро Накано, технический специалист компании, сообщил в прямом эфире, что Operator работает на базе CUA — новой модели, созданной на базе GPT-4o.

Он «обучен использовать и управлять компьютером так же, как это делают люди, просто глядя на экран и используя мышь и клавиатуру для управления», — сказал он.

Накано заявил, что эта модель устраняет необходимость в API — механизмах, которые позволяют программным компонентам взаимодействовать друг с другом, — и «открывает целый новый спектр программного обеспечения, которое мы можем использовать и которое ранее было недоступно».

Он добавил, что модель устранила «еще одно узкое место на нашем пути к ИИОН» (искусственному интеллекту общего назначения).

Однако Operator еще предстоит пройти долгий путь, прежде чем он сравняется с людьми по возможностям навигации в Интернете.

OpenAI заявила, что в бенчмарке, измеряющем, как агенты ИИ перемещаются по распространённым операционным системам, таким как операционная система с открытым исходным кодом Linux, Operator набрал 38,1% по сравнению с 72,4% у людей. В другом бенчмарке, измеряющем, как агенты ИИ перемещаются по распространённым веб-сайтам, Operator набрал 58,1% по сравнению с 78,2% у людей.

Прочитайте оригинальную статью на Business Insider

Читайте нашу главную страницу —  Взгляд в будущееИнновацииТехнологииНаукаНовые открытияИзобретения

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *