
A OpenAI está a preparar uma mudança radical na forma como interagimos com a tecnologia, apostando forte na Inteligência Artificial focada no áudio. A estratégia vai muito além de apenas melhorar a voz do ChatGPT; trata-se de uma reestruturação profunda para preparar o terreno para um novo dispositivo pessoal.
De acordo com um novo relatório do The Information, a empresa unificou várias equipas de engenharia, produto e investigação nos últimos dois meses. O objetivo é renovar completamente os seus modelos de áudio, tendo em vista o lançamento de um dispositivo "audio-first" (focado no áudio) previsto para chegar ao mercado daqui a cerca de um ano.
O fim da ditadura dos ecrãs
Este movimento da OpenAI reflete uma tendência crescente em Silicon Valley: um futuro onde os ecrãs passam para segundo plano e a voz assume o comando. As colunas inteligentes já são comuns, mas a indústria quer ir mais longe. A Meta lançou recentemente funcionalidades para os seus óculos inteligentes Ray-Ban que utilizam microfones avançados para isolar conversas em ambientes ruidosos, transformando o utilizador num "dispositivo de escuta" direcional.
A Google também não está parada, tendo começado a experimentar em junho com "Audio Overviews" que transformam resultados de pesquisa em resumos de conversação. Do lado automóvel, a Tesla está a integrar o Grok e outros modelos de linguagem nos seus veículos para criar assistentes de voz capazes de gerir tudo, desde a navegação até ao controlo climático, através de um diálogo natural.
Não são apenas os gigantes tecnológicos que partilham esta convicção. Várias startups tentaram a sua sorte, com resultados mistos. Os criadores do Humane AI Pin gastaram centenas de milhões antes de o seu dispositivo sem ecrã se tornar num exemplo do que não fazer. Já o pendente Friend AI levantou questões de privacidade. Agora, empresas como a Sandbar e uma nova aposta de Eric Migicovsky, fundador da Pebble, estão a desenvolver anéis com IA previstos para 2026, permitindo aos utilizadores, literalmente, falar para a mão.
Uma conversa real em 2026
A tese é clara: o áudio é a interface do futuro. A OpenAI planeia lançar o seu novo modelo de áudio no início de 2026. Este modelo promete soar mais natural, lidar com interrupções como um parceiro de conversa real e até falar enquanto o utilizador está a falar, algo que os modelos atuais têm dificuldade em gerir.
A visão da empresa passa por criar uma família de dispositivos, que poderá incluir óculos ou colunas inteligentes sem ecrã, que funcionem menos como ferramentas utilitárias e mais como companheiros digitais.
Esta estratégia conta com o toque de Jony Ive, o antigo chefe de design da Apple. Ive juntou-se aos esforços de hardware da OpenAI através da aquisição da sua empresa, a io, por 6,5 mil milhões de dólares em maio. O designer vê nesta abordagem focada no áudio uma oportunidade para "corrigir os erros" dos gadgets de consumo do passado, elegendo a redução da dependência dos ecrãs e do vício digital como uma prioridade.