1. TugaTech » Internet e Redes » Noticias da Internet e Mercados » xAI lança Grok Voice Agent API: Agentes de IA que falam dezenas de línguas em tempo real
  Login     Registar    |                      
Siga-nos

Você não está conectado. Conecte-se ou registre-se

  

Opções



Mensagens anteriores

xAI lança Grok Voice Agent API: Agentes de IA que falam dezenas de línguas em tempo real em Sáb 20 Dez 2025 - 12:31

DJPRMF

Grok logo

A corrida pela supremacia nos assistentes de voz acaba de ganhar um novo concorrente de peso. A xAI disponibilizou oficialmente a Grok Voice Agent API, uma nova ferramenta destinada a programadores que pretendem construir agentes de voz capazes de falar dezenas de idiomas, interagir com ferramentas digitais e aceder a dados em tempo real. Segundo anunciou a xAI, esta nova interface de programação baseia-se na mesma tecnologia que alimenta o Grok Voice, garantindo uma consistência de desempenho entre as diferentes plataformas da empresa.

Para se destacar num mercado cada vez mais saturado, a empresa optou por desenvolver internamente todos os componentes essenciais de áudio, em vez de depender de soluções de terceiros. Isto inclui modelos proprietários para a deteção de atividade de voz, tokenização e processamento de áudio. Este controlo total sobre a infraestrutura permite, segundo a empresa, um desenvolvimento mais rápido e melhorias contínuas tanto na inteligência como na velocidade de resposta do sistema.

Um verdadeiro poliglota digital

Um dos grandes destaques desta nova API é a sua capacidade multilingue. Os agentes criados com o Grok conseguem comunicar em dezenas de línguas com uma precisão descrita como "nível nativo", captando dialetos e diferenças subtis de pronúncia. A flexibilidade do sistema permite que o agente se ajuste automaticamente ao idioma falado pelo utilizador ou até mude de língua a meio de uma conversa.

Adicionalmente, os programadores podem configurar o sistema para responder sempre numa língua específica através de comandos de sistema (system prompts), oferecendo um controlo granular sobre a experiência do utilizador final.

Dados em tempo real e vozes expressivas

Para além das capacidades linguísticas, a API foi desenhada para executar tarefas complexas e recuperar informações para os utilizadores no momento. Ao contrário de modelos estáticos limitados a dados de treino passados, estes agentes têm acesso a dados em tempo real, o que alarga significativamente o leque de casos de uso, desde apoio ao cliente dinâmico até assistentes de produtividade atualizados ao minuto.

A xAI incluiu também múltiplas vozes expressivas na plataforma, permitindo que os criadores personalizem a "personalidade" auditiva dos seus agentes para melhor se adequarem ao contexto da aplicação. Com este lançamento, a empresa reforça a sua aposta em fornecer ferramentas robustas para a próxima geração de interação humano-computador.



  As mensagens apresentadas em cima não são actualizadas automaticamente pelo que se uma nova mensagem for colocada enquanto se encontra nesta página, não irá aparecer na lista em cima.


Aplicações do TugaTechAplicações TugaTechDiscord do TugaTechDiscord do TugaTechRSS TugaTechRSS do TugaTechSpeedtest TugaTechSpeedtest TugatechHost TugaTechHost TugaTech