
A gigante tecnológica chinesa continua a expandir os seus horizontes para além do hardware. Desta vez, a Xiaomi decidiu entrar diretamente no competitivo mercado da inteligência artificial generativa com o lançamento do MiMO Studio, uma plataforma web que permite aos utilizadores interagirem com o seu mais recente modelo de linguagem.
Esta novidade representa um passo significativo para a marca, que até agora focava os seus esforços de IA maioritariamente na integração com os seus smartphones e ecossistema IoT. A nova plataforma funciona diretamente no navegador, eliminando a necessidade de instalar qualquer software, e oferece uma experiência muito semelhante à que encontramos no popular ChatGPT ou no Gemini.
O motor MiMo-V2-Flash
No coração desta nova plataforma está o modelo MiMo-V2-Flash, desenvolvido internamente pela marca. Segundo as informações avançadas pelo XiaomiTime, trata-se de um modelo com uma arquitetura "Mixture-of-Experts" (MoE), desenhado especificamente para ser eficiente e rápido.
O modelo conta com um total impressionante de 309 mil milhões de parâmetros, dos quais 15 mil milhões estão ativos durante a inferência. A arquitetura utiliza um sistema de Atenção Híbrida, o que lhe permite gerir contextos longos de forma nativa. O MiMo-V2-Flash foi treinado com um contexto de 32K tokens, mas a arquitetura permite uma escalabilidade até 256K tokens, tornando-o ideal para tarefas complexas como a análise de documentos extensos.
A plataforma MiMO Studio oferece diferentes modos de interação, incluindo conversas com "raciocínio profundo" e respostas melhoradas através de pesquisa online, o que a torna uma ferramenta versátil tanto para programação como para investigação geral.
Desempenho e acesso open-source
A Xiaomi não poupou nos elogios ao seu novo modelo, afirmando que o MiMo-V2-Flash se posiciona como um dos melhores modelos open-source do mercado em vários benchmarks. A empresa destaca particularmente as capacidades de programação e lógica, sugerindo que consegue rivalizar com alguns modelos de código fechado.
Um dos grandes trunfos anunciados é a eficiência de custos. A marca afirma ter conseguido reduzir o custo de inferência para cerca de 2,5% do valor de modelos fechados comparáveis, ao mesmo tempo que duplicou a velocidade de geração. Para demonstrar o seu compromisso com a comunidade de programadores, a Xiaomi disponibilizou o modelo sob a licença MIT.
Para quem pretende integrar esta tecnologia em aplicações de terceiros, a API está disponível com preços competitivos: aproximadamente 0,09 euros (0,10 dólares) por milhão de tokens de entrada e 0,28 euros (0,30 dólares) por milhão de tokens de saída. Atualmente, existe um período experimental gratuito para a utilização da API.
Devido à elevada procura inicial, alguns utilizadores poderão encontrar tempos de espera ou dificuldades no login ao acederem à plataforma, uma situação que a marca espera normalizar em breve.










Nenhum comentário
Seja o primeiro!