OpenAI представила своего Оператора ChatGPT, AI-агента, предназначенного для того, чтобы служить личным помощником для различных задач, начиная от заказа кофе и заканчивая покупкой дома или даже развертыванием приложений. Этот инновационный инструмент, известный как Компьютерный Использующий Агент (CUA), построен на модели ChatGPT-4 и способен взаимодействовать с веб-элементами, такими как кнопки, меню и формы.
Оператор ChatGPT работает, обрабатывая сырые пиксели на экране и перемещаясь с помощью виртуальной мыши и клавиатуры на виртуальной машине. Он следует трехшаговому циклу: сначала он воспринимает экран, делая снимок экрана; затем он размышляет над задачей, используя подход "Цепочка Мысли"; и, наконец, выполняет необходимые действия, такие как нажатие, прокрутка или ввод текста.
Чтобы получить доступ к Оператору ChatGPT, пользователи должны выполнить два требования: они должны находиться на территории Соединенных Штатов и иметь профессионскую подписку на ChatGPT, стоимость которой составляет 200 долларов. Для тех, кто находится за пределами США, использование VPN может обеспечить доступ. Оператор доступен через специальный веб-сайт, где пользователи могут вводить подсказки и видеть примеры его функциональности.
Одна из задач, которую можно протестировать с помощью Оператора ChatGPT, - это публикация черновика блога на сайте Wix Studio. Агент открывает интерфейс браузера, переходит на страницу входа и предлагает пользователю ввести свои учетные данные. После входа в систему агент эффективно переходит в раздел блога, фильтрует черновики и подтверждает намерение пользователя опубликовать выбранный черновик.
Оператор ChatGPT также может быть задан для внесения обновлений на веб-сайт. Например, когда его просят удалить элемент из навигационного меню, агент сталкивается с запросом безопасности из-за потенциальных рисков, связанных с изменением работающего веб-сайта. После подтверждения действия он успешно переходит в редактор, чтобы управлять меню и удалить указанный элемент.
Хотя Оператор ChatGPT хорошо справляется с простыми задачами, у него есть ограничения. Например, когда его просят изменить вес шрифта меню, он испытывает трудности из-за сложности задачи. Кроме того, когда его просят найти подходящую библиотеку GitHub для преобразования текста markdown для проекта React, он часто выбирает первый подходящий элемент, не учитывая другие варианты, что подчеркивает необходимость более конкретных подсказок.
Потенциальные приложения Оператора ChatGPT обширны, так как пользователи сообщали о успешных взаимодействиях для различных задач, включая поиск самой дешевой страховки, структурирование научных работ и даже совершение покупок. Продолжение тестирования и исследования покажет больше о возможностях и ограничениях этого AI-агента.
В: Что такое Оператор ChatGPT?
О: Оператор ChatGPT - это AI-агент, предназначенный для того, чтобы служить личным помощником для различных задач, построенный на модели ChatGPT-4, способный взаимодействовать с веб-элементами.
В: Как работает Оператор ChatGPT?
О: Он работает, обрабатывая сырые пиксели на экране и перемещаясь с помощью виртуальной мыши и клавиатуры, следуя трехшаговому циклу: восприятие экрана, размышление над задачей и выполнение действий.
В: Каковы требования для доступа к Оператору ChatGPT?
О: Пользователи должны находиться на территории Соединенных Штатов и иметь профессионскую подписку на ChatGPT, стоимость которой составляет 200 долларов. Пользователи за пределами США могут использовать VPN для доступа.
В: Может ли Оператор ChatGPT публиковать блог?
О: Да, он может публиковать черновик блога на сайте Wix Studio, переходя через интерфейс браузера и управляя разделом блога.
В: Может ли Оператор ChatGPT вносить обновления на веб-сайт?
О: Да, он может вносить обновления, такие как удаление элементов из навигационного меню, но может столкнуться с запросами безопасности, требующими подтверждения пользователя.
В: Каковы ограничения Оператора ChatGPT?
О: Он хорошо справляется с простыми задачами, но испытывает трудности с комплексными задачами, такими как изменение веса шрифтов или выбор лучших вариантов из нескольких вариантов.
В: С какими другими задачами может помочь Оператор ChatGPT?
О: Он может помочь с различными задачами, включая поиск самой дешевой страховки, структурирование научных работ и совершение покупок.