
A OpenAI acaba de revelar uma nova e poderosa ferramenta de inteligência artificial, o ChatGPT Agent. Esta nova versão combina as capacidades de navegação web do agente "Operator" com a força de pesquisa e síntese de informação do "Deep Research", integrando tudo com as conhecidas competências de conversação do ChatGPT. O resultado é um único e robusto agente capaz de executar tarefas de forma autónoma no seu próprio ambiente de computador.
Como funciona o novo agente?
O grande diferencial do ChatGPT Agent é a sua capacidade de realizar trabalhos utilizando um computador virtual próprio. Com base nos pedidos do utilizador, esta IA pode navegar em sites, filtrar resultados, solicitar inícios de sessão quando necessário, executar código, fazer análises e até criar folhas de cálculo ou apresentações em PowerPoint.
Para completar estas tarefas, o agente tem acesso a um conjunto de ferramentas avançadas:
Um browser visual que interage com a web através de uma interface gráfica.
Um browser baseado em texto para tarefas de navegação mais simples.
Acesso a um terminal de comandos.
Acesso direto a APIs.
A capacidade de se ligar a conectores do ChatGPT.
Esta integração permite que o agente mantenha todo o contexto necessário para uma tarefa complexa. Por exemplo, pode visitar um site, descarregar um ficheiro, manipulá-lo através de um comando no terminal e, de seguida, visualizar o resultado novamente no browser.
Desempenho de topo em testes de mercado
A OpenAI afirma que o seu novo agente atinge um desempenho de última geração em várias avaliações que medem as capacidades de navegação na web e a conclusão de tarefas do mundo real. Alguns dos destaques incluem:
Humanity’s Last Exam: O agente atingiu uma nova pontuação de topo de 41,6.
FrontierMath: Alcançou uma precisão de 27,4%.
DSBench: Superou o desempenho humano por uma margem significativa em tarefas de ciência de dados.
SpreadsheetBench: Obteve uma pontuação de 45,5%, em comparação com os 20,0% do Copilot no Excel.
BrowseComp: Estabeleceu um novo recorde com 68,9%.
WebArena: Atingiu uma pontuação de 65,4%.
Numa avaliação interna da própria OpenAI, que mede o desempenho em tarefas complexas e de elevado valor económico, o resultado do ChatGPT Agent foi considerado comparável ou superior ao de um ser humano em cerca de metade dos casos.
Disponibilidade e acesso
O ChatGPT Agent já está a ser disponibilizado e pode ser encontrado no menu de ferramentas do ChatGPT sob o novo "modo agente". Durante a execução de uma tarefa, os utilizadores podem acompanhar o processo através de uma narração no ecrã e têm a liberdade de interromper e assumir o controlo do browser a qualquer momento.
A distribuição será faseada. Os utilizadores do ChatGPT Pro terão acesso até ao final do dia. Os subscritores dos planos Plus e Team receberão o acesso ao longo dos próximos dias, enquanto os utilizadores Enterprise e Education terão de esperar pelas próximas semanas.
Relativamente aos limites de utilização, os clientes Pro poderão enviar até 400 mensagens por mês ao agente, enquanto os restantes utilizadores pagos terão um limite de 40 mensagens mensais. No entanto, a OpenAI irá disponibilizar opções flexíveis baseadas em créditos para quem necessitar de utilização adicional.










Nenhum comentário
Seja o primeiro!