OpenAI lança novos modelos de voz na sua API focados em tradução e transcrição em tempo real

Escrito por **Pedro Fernandes (DJPRMF)** · 09/05/2026

GPT-Realtime-2 da OpenAI

A OpenAI anunciou uma expansão de peso para a sua API, introduzindo três novos modelos de inteligência artificial focados no processamento de voz. Esta nova vaga de ferramentas foi desenhada especificamente para impulsionar o desenvolvimento de aplicações interativas que exijam respostas imediatas e naturais em áudio.

No centro desta atualização revelada pela OpenAI, encontra-se o GPT-Realtime-2, um modelo conversacional que promete elevar a fasquia das interações faladas. De acordo com a empresa, este sistema herda as capacidades de raciocínio avançado da classe GPT-5, o que lhe permite gerir diálogos ao vivo consideravelmente mais complexos e com maior fluidez do que as gerações anteriores.

A revolução da tradução e transcrição instantânea

Para além do modelo conversacional de topo, a empresa norte-americana lançou o GPT-Realtime-Translate. Esta ferramenta foca-se exclusivamente na tradução de voz em tempo real, eliminando barreiras de comunicação através do suporte para mais de 70 idiomas de entrada e 13 línguas de saída.

A fechar o novo trio de lançamentos está o GPT-Realtime-Whisper, desenhado para efetuar a transcrição de discurso para texto ao vivo. Na prática, este modelo permite que qualquer software ou plataforma registe e converta interações faladas para texto exatamente no momento em que estão a acontecer.

Custos de utilização e segurança reforçada

No que diz respeito ao modelo de faturação, a OpenAI optou por estratégias distintas consoante o serviço. Enquanto o GPT-Realtime-2 é cobrado através do tradicional consumo de tokens, os serviços de tradução e transcrição contam com uma faturação contabilizada ao minuto.

Todos os novos modelos já se encontram acessíveis para os programadores através da Realtime API. A empresa destaca que estas novidades estão prontas para alimentar sistemas de apoio ao cliente, plataformas de educação, meios de comunicação, eventos ao vivo e ferramentas para criadores de conteúdo.

Perante o poder destas novas tecnologias, a OpenAI reconheceu também os potenciais perigos associados, nomeadamente o risco de utilização indevida para campanhas de spam, fraudes ou abusos online. Para mitigar estas ameaças, foram implementados mecanismos de segurança automáticos capazes de interromper imediatamente a conversa caso seja detetado conteúdo malicioso.

Nenhum comentário

Seja o primeiro!

Siga-nos

OpenAI lança novos modelos de voz na sua API focados em tradução e transcrição em tempo real

A revolução da tradução e transcrição instantânea

Custos de utilização e segurança reforçada

Não perca nenhuma novidade!