
A corrida pela supremacia no desenvolvimento da inteligência artificial acaba de ganhar um novo e inesperado concorrente. A Suíça anunciou oficialmente o lançamento do Apertus, o seu modelo de linguagem de grande escala (LLM) nacional e de código aberto, que se posiciona como uma alternativa pública e transparente aos modelos de gigantes tecnológicos como a OpenAI.
O projeto foi desenvolvido por um consórcio de instituições públicas, incluindo o Instituto Federal Suíço de Tecnologia de Lausanne (EPFL), o ETH Zurich e o Centro Nacional de Supercomputação da Suíça (CSCS). O nome "Apertus", que significa "aberto" em latim, reflete a filosofia central da iniciativa.
Uma alternativa transparente e de código aberto
Ao contrário dos modelos de grandes empresas, muitas vezes descritos como "caixas negras", o Apertus foi concebido com a transparência como pilar fundamental. Os seus criadores disponibilizaram não apenas o modelo em si, mas também toda a documentação, o código-fonte do seu processo de treino e os conjuntos de dados utilizados. Qualquer pessoa pode inspecionar e adaptar a tecnologia às suas necessidades.
Esta abordagem contrasta diretamente com as polémicas que envolvem outras empresas de IA, acusadas de recolher dados de treino sem permissão e de ignorar protocolos de exclusão em websites. Os responsáveis pelo Apertus garantem que o modelo foi treinado exclusivamente com dados disponíveis publicamente e que os seus sistemas respeitaram todos os pedidos de exclusão que encontraram.
A IA como um serviço público
A visão por trás do Apertus é tratar a inteligência artificial como uma infraestrutura pública essencial. "Atualmente, o Apertus é o principal modelo de IA público: um modelo construído por instituições públicas, para o interesse público. É a nossa melhor prova até agora de que a IA pode ser uma forma de infraestrutura pública como as autoestradas, a água ou a eletricidade", afirmou Joshua Tan, um dos defensores desta abordagem.
A criação de um LLM nacional tem um enorme potencial, especialmente para setores com regulamentação rigorosa. A Associação de Banqueiros Suíços já tinha manifestado interesse num modelo local, uma vez que este estaria mais apto a cumprir as estritas leis de proteção de dados e sigilo bancário do país.
Multilingue e já disponível para todos
O Apertus foi treinado com 15 biliões de "tokens" numa vasta gama de mais de 1.000 idiomas, com 40% dos dados a não serem em inglês. Entre as línguas incluídas estão o alemão suíço e o romanche, dialetos locais. Esta diversidade linguística torna-o particularmente versátil para diferentes aplicações.
Atualmente, o modelo está disponível em duas versões, com 8 mil milhões e 70 mil milhões de parâmetros. Qualquer pessoa, desde investigadores a entusiastas e empresas, pode utilizar e adaptar o Apertus gratuitamente para criar chatbots, ferramentas de tradução, aplicações educativas e muito mais. O acesso pode ser feito através da Swisscom, uma empresa suíça de telecomunicações, ou da popular plataforma Hugging Face.