A OpenAI, conhecida por disponibilizar a experiência ChatGPT a centenas de milhões de utilizadores, continua a investir fortemente na sua plataforma para programadores que criam aplicações de Inteligência Artificial (IA). A popularidade da empresa neste meio deve-se não só aos seus modelos de vanguarda, mas também às ferramentas robustas e ao suporte que oferece. Recentemente, a OpenAI anunciou duas atualizações significativas que prometem facilitar ainda mais a vida aos developers.
Codex turbinado: agora no ChatGPT Plus e com ligação à internet
A primeira grande novidade foca-se no Codex, o agente de engenharia de software da OpenAI. Os utilizadores do ChatGPT Plus passam agora a ter acesso ao Codex, beneficiando, por tempo limitado, de limites de utilização generosos. No entanto, a OpenAI ressalva que poderá aplicar restrições em períodos de maior procura.
Uma das funcionalidades mais impactantes é a capacidade do Codex se ligar à internet. Esta ligação permite ao agente instalar dependências, atualizar pacotes, executar testes que necessitem de recursos externos, entre outras tarefas. A OpenAI esclarece que o acesso à internet está desativado por defeito, mas os utilizadores podem ativá-lo para ambientes específicos, controlando inclusivamente os domínios aos quais o Codex pode aceder. Esta funcionalidade está disponível para os utilizadores do ChatGPT Plus, Pro e Teams, chegando em breve aos utilizadores Enterprise.
Com esta atualização, os utilizadores do Codex podem também atualizar pull requests existentes ao dar seguimento a uma tarefa e, adicionalmente, podem agora ditar tarefas diretamente ao Codex.
Melhorias contínuas afinam o Codex
Para além das novidades mencionadas e de diversas correções de erros, a OpenAI introduziu as seguintes melhorias no Codex:
- Suporte para ficheiros binários: Todas as operações de ficheiros são suportadas ao aplicar patches. No que respeita a pull requests, de momento, apenas é possível eliminar ou renomear ficheiros binários.
- Mensagens de erro aperfeiçoadas para scripts de configuração.
- Aumento do limite para as diferenças de tarefas (diffs) de 1 MB para 5 MB.
- Aumento do limite de duração para scripts de configuração de 5 para 10 minutos.
- Fluxo de ligação ao GitHub aperfeiçoado.
- Reativação das Live Activities no iOS, após a resolução de um problema relacionado com notificações perdidas.
- Remoção do requisito de autenticação de dois fatores obrigatória para utilizadores que utilizam SSO (Single Sign-On) ou logins sociais.
Agentes de voz evoluem: Agents SDK em TypeScript e IA de fala mais apurada
A segunda grande atualização da OpenAI direciona-se aos agentes de voz. O SDK para Agentes (Agents SDK) da OpenAI está agora disponível em TypeScript e inclui suporte para handoffs (transições de controlo), guardrails (salvaguardas), tracing (rastreio), MCP e outras primitivas essenciais de agente. Este SDK introduz também um novo suporte para aprovações com intervenção humana, permitindo aos programadores pausar a execução de ferramentas, serializar e armazenar o estado do agente, aprovar ou rejeitar chamadas específicas e retomar a execução do agente.
A OpenAI lançou igualmente um modelo de conversão de fala-para-fala (speech-to-speech) atualizado, com melhorias na fiabilidade do seguimento de instruções, consistência na chamada de ferramentas e comportamento de interrupção. Adicionalmente, os programadores podem agora personalizar a velocidade da voz durante cada sessão. Os modelos atualizados estão acessíveis através de gpt-4o-realtime-preview-2025-06-03
na API Realtime e gpt-4o-audio-preview-2025-06-03
na API Chat Completions.
Finalmente, o painel Traces passa a suportar sessões da API Realtime, permitindo aos programadores visualizar facilmente as execuções dos agentes de voz, incluindo entrada/saída de áudio, invocações de ferramentas e interrupções. Estas novidades demonstram o empenho contínuo da OpenAI em fornecer ferramentas cada vez mais sofisticadas e intuitivas para a comunidade de desenvolvimento de IA.
Nenhum comentário
Seja o primeiro!