A OpenAI acaba de confirmar uma nova funcionalidade a chegar em breve ao ChatGPT, que vai dar ainda mais controlo ao sistema de IA da empresa para realizar as mais variadas tarefas. Conhecido como “Operator”, este sistema permite que o ChatGPT realize tarefas no navegador de forma totalmente autónoma.
Este sistema, segundo a explicação da OpenAI, combina as tecnologias de visão do GPT-4o com várias melhorias feitas no modelo para interpretação dos conteúdos, permitindo ao modelo interagir diretamente com as interfaces.
Ou seja, estes agentes do ChatGPT podem analisar os sites e as suas interfaces, por intermédio de capturas de ecrã dos mesmos, e realizar diretamente ações na interface, como cliques, scroll e outras, sem a necessidade de mudanças na API.
Com esta ferramenta, o ChatGPT pode basicamente realizar qualquer tarefa em websites de forma direta. Basta pedir ao mesmos para as realizar, e usando as capacidades do GPT-4o, este realiza diretamente as mesmas. Entre alguns dos exemplos encontra-se a reserva de uma viagem pelo site Booking.com ou uma compra da Etsy.
No entanto, o modelo conta com algumas medidas de proteção, que impedem o mesmo de realizar atividades que podem ser prejudiciais para os sites ou para as atividades que sejam feitas neste. Existem ainda medidas para prevenir a recolha de dados pessoais e sensíveis, como senhas.
Por agora, este sistema vai encontrar-se disponível apenas nos EUA, e para utilizadores que tenham a subscrição do ChatGPT Pro – que custa 200 dólares por mês. Eventualmente a plataforma espera integrar o sistema nos restantes planos, mas será improvável que venha a ficar acessível para utilizadores da versão gratuita do mesmo.
Nenhum comentário
Seja o primeiro!