Компанія OpenAI представила першого агента штучного інтелекту Operator. Він вміє виконувати складні завдання в інтернеті в реальному часі.
Про це повідомила OpenAI.
Фактично Operator — це інструмент автоматизації дій у браузері. Агент «бачить» інтерфейси через скриншоти, натискає кнопки, вводить текст і може сам виправляти помилки — майже так само, як це робила б людина. Якщо завдання складне, Operator спочатку спробує його вирішити, а потім передасть контроль користувачеві.
OpenAI
Перед важливими діями, наприклад, введенням паролів, Operator завжди запитує підтвердження. Він також блокує шкідливі запити та заборонений контент.
У роботі Operator використовує нову модель штучного інтелекту — Computer-Using Agent (CUA), що й дозволяє керувати компʼютером через візуальний інтерфейс. Він уже співпрацює з популярними сервісами, наприклад з DoorDash, Instacart, OpenTable та Uber. Тож може викликати користувачу таксі, замовити їжу або забронювати столик у ресторані.
Поки розробники тестують агент, далі його вдосконалюватимуть. Найкраще він справляється з повторюваними завданнями — створенням списків покупок, але «гальмує» на незнайомих інтерфейсах (таблиці чи календарі) і в редагуванні складних текстів.
Зараз Operator доступний лише у США для передплатників ChatGPT Pro за $200 на місяць. У майбутньому OpenAI планує розширити доступ для інших категорій користувачів, включно з підписками Plus, Team та Enterprise, а також інтегрувати агента в ChatGPT.