
A Google disponibilizou uma nova aplicação de ditado para utilizadores de dispositivos iOS focada em funcionar offline. Segundo a página na App Store, a aplicação dá pelo nome de Google AI Edge Eloquent e foi desenhada para preencher a lacuna entre a forma natural como falamos e a escrita profissional. O sistema consegue filtrar automaticamente hesitações, pausas e correções feitas a meio das frases.
Privacidade local e opções na nuvem
Como opera nativamente no equipamento, o software descarrega um modelo de reconhecimento automático de voz baseado no Gemini para o telemóvel. Isto assegura que o processamento é rápido e que o áudio permanece privado. Contudo, existe um modo de nuvem disponível que envia os dados para os modelos da empresa, garantindo um polimento extra na construção de frases mais complexas.

A ferramenta oferece também capacidades para transformar uma transcrição num resumo de pontos-chave ou alterar o tom do texto para estilos curtos, longos ou formais. Os utilizadores podem consultar o seu histórico para analisar a velocidade de palavras por minuto e o volume total de vocábulos de sessões anteriores. Existe ainda um dicionário de contexto onde é possível adicionar jargão técnico à mão ou importar nomes e palavras-chave específicas diretamente do Gmail.
Um laboratório de bolso para testes
No catálogo da empresa na loja de aplicações da Apple existe uma segunda adição chamada AI Edge Gallery. Esta aplicação funciona como um ambiente de testes fechado onde podes executar a família de modelos Gemma diretamente no dispositivo, incluindo as versões Gemma 3n e Gemma 4.
Com as funcionalidades de conversação e raciocínio integradas, é possível observar o processo lógico do modelo passo a passo e em tempo real. A plataforma dispõe também de ferramentas de teste e análise de desempenho que permitem avaliar a prestação dos diferentes modelos de pesos abertos no hardware de cada utilizador.
O motor da nova geração Gemma 4
Os modelos Gemma 4 foram lançados há pouco tempo com o objetivo de entregar capacidades avançadas de raciocínio em máquinas locais. A família engloba as dimensões E2B e E4B destinadas a telemóveis, juntamente com as variantes maiores 26B e 31B focadas em computadores. As versões móveis suportam uma janela de contexto de 128K, enquanto as opções de maior porte atingem uma janela de 256K.












Nenhum comentário
Seja o primeiro!