1. TugaTech » Internet e Redes » Noticias da Internet e Mercados
  Login     Registar    |                      
Siga-nos

Grok logo

A corrida pela supremacia nos assistentes de voz acaba de ganhar um novo concorrente de peso. A xAI disponibilizou oficialmente a Grok Voice Agent API, uma nova ferramenta destinada a programadores que pretendem construir agentes de voz capazes de falar dezenas de idiomas, interagir com ferramentas digitais e aceder a dados em tempo real. Segundo anunciou a xAI, esta nova interface de programação baseia-se na mesma tecnologia que alimenta o Grok Voice, garantindo uma consistência de desempenho entre as diferentes plataformas da empresa.

Para se destacar num mercado cada vez mais saturado, a empresa optou por desenvolver internamente todos os componentes essenciais de áudio, em vez de depender de soluções de terceiros. Isto inclui modelos proprietários para a deteção de atividade de voz, tokenização e processamento de áudio. Este controlo total sobre a infraestrutura permite, segundo a empresa, um desenvolvimento mais rápido e melhorias contínuas tanto na inteligência como na velocidade de resposta do sistema.

Um verdadeiro poliglota digital

Um dos grandes destaques desta nova API é a sua capacidade multilingue. Os agentes criados com o Grok conseguem comunicar em dezenas de línguas com uma precisão descrita como "nível nativo", captando dialetos e diferenças subtis de pronúncia. A flexibilidade do sistema permite que o agente se ajuste automaticamente ao idioma falado pelo utilizador ou até mude de língua a meio de uma conversa.

Adicionalmente, os programadores podem configurar o sistema para responder sempre numa língua específica através de comandos de sistema (system prompts), oferecendo um controlo granular sobre a experiência do utilizador final.

Dados em tempo real e vozes expressivas

Para além das capacidades linguísticas, a API foi desenhada para executar tarefas complexas e recuperar informações para os utilizadores no momento. Ao contrário de modelos estáticos limitados a dados de treino passados, estes agentes têm acesso a dados em tempo real, o que alarga significativamente o leque de casos de uso, desde apoio ao cliente dinâmico até assistentes de produtividade atualizados ao minuto.

A xAI incluiu também múltiplas vozes expressivas na plataforma, permitindo que os criadores personalizem a "personalidade" auditiva dos seus agentes para melhor se adequarem ao contexto da aplicação. Com este lançamento, a empresa reforça a sua aposta em fornecer ferramentas robustas para a próxima geração de interação humano-computador.




Aplicações do TugaTechAplicações TugaTechDiscord do TugaTechDiscord do TugaTechRSS TugaTechRSS do TugaTechSpeedtest TugaTechSpeedtest TugatechHost TugaTechHost TugaTech