
A OpenAI anunciou uma expansão de peso para a sua API, introduzindo três novos modelos de inteligência artificial focados no processamento de voz. Esta nova vaga de ferramentas foi desenhada especificamente para impulsionar o desenvolvimento de aplicações interativas que exijam respostas imediatas e naturais em áudio.
No centro desta atualização revelada pela OpenAI, encontra-se o GPT-Realtime-2, um modelo conversacional que promete elevar a fasquia das interações faladas. De acordo com a empresa, este sistema herda as capacidades de raciocínio avançado da classe GPT-5, o que lhe permite gerir diálogos ao vivo consideravelmente mais complexos e com maior fluidez do que as gerações anteriores.
A revolução da tradução e transcrição instantânea
Para além do modelo conversacional de topo, a empresa norte-americana lançou o GPT-Realtime-Translate. Esta ferramenta foca-se exclusivamente na tradução de voz em tempo real, eliminando barreiras de comunicação através do suporte para mais de 70 idiomas de entrada e 13 línguas de saída.
A fechar o novo trio de lançamentos está o GPT-Realtime-Whisper, desenhado para efetuar a transcrição de discurso para texto ao vivo. Na prática, este modelo permite que qualquer software ou plataforma registe e converta interações faladas para texto exatamente no momento em que estão a acontecer.
Custos de utilização e segurança reforçada
No que diz respeito ao modelo de faturação, a OpenAI optou por estratégias distintas consoante o serviço. Enquanto o GPT-Realtime-2 é cobrado através do tradicional consumo de tokens, os serviços de tradução e transcrição contam com uma faturação contabilizada ao minuto.
Todos os novos modelos já se encontram acessíveis para os programadores através da Realtime API. A empresa destaca que estas novidades estão prontas para alimentar sistemas de apoio ao cliente, plataformas de educação, meios de comunicação, eventos ao vivo e ferramentas para criadores de conteúdo.
Perante o poder destas novas tecnologias, a OpenAI reconheceu também os potenciais perigos associados, nomeadamente o risco de utilização indevida para campanhas de spam, fraudes ou abusos online. Para mitigar estas ameaças, foram implementados mecanismos de segurança automáticos capazes de interromper imediatamente a conversa caso seja detetado conteúdo malicioso.












Nenhum comentário
Seja o primeiro!