A Microsoft aproveitou o palco do seu evento para programadores, o Build 2025, para anunciar uma novidade de peso para o ecossistema Windows: o Windows AI Foundry. Esta nova plataforma promete unificar e simplificar o desenvolvimento de aplicações com inteligência artificial (IA) a correr localmente nos computadores Windows, integrando o já existente Windows Copilot Runtime com um conjunto de novas e poderosas capacidades.
Para quem não acompanha de perto, a Microsoft já permitia o desenvolvimento de aplicações de IA locais no Windows através do Windows Copilot Runtime. Este oferece diversas funcionalidades de IA por meio de APIs do Windows AI e do Windows Machine Learning (ML). Nos PCs Copilot+, os modelos por detrás do Windows Copilot Runtime operam continuamente em segundo plano, diretamente no dispositivo.
O que traz de novo o Windows AI Foundry?
O Windows AI Foundry surge como uma evolução natural, ambicionando ser a plataforma de eleição para o desenvolvimento de IA local no Windows. Irá disponibilizar:
- APIs de IA prontas a usar: Estas APIs serão alimentadas por modelos de IA incorporados e otimizados.
- Ferramentas de personalização: Permitirão aos programadores ajustar os modelos integrados no Windows às suas necessidades específicas.
- Integração com modelos open-source: Será possível importar modelos do Azure AI Foundry, um catálogo da própria Microsoft.
- Runtime de inferência flexível: Os programadores terão a liberdade de trazer os seus próprios modelos para a plataforma.
Esta abordagem visa dar resposta à necessidade que os criadores de aplicações têm de aceder a uma vasta gama de modelos de IA de diferentes fornecedores. Assim, o Windows AI Foundry não se limitará aos modelos da Microsoft; integrará também modelos do já referido Azure Foundry Local e de outros catálogos populares como o Ollama e os NVIDIA NIMs.
O catálogo Foundry Local da Microsoft incluirá modelos de IA otimizados para funcionar eficientemente em CPUs, GPUs e NPUs (Unidades de Processamento Neural). Os programadores poderão utilizar um simples comando – winget install Microsoft.FoundryLocal
– para navegar, descarregar e testar modelos com base na compatibilidade do seu dispositivo. Após a seleção, o SDK do Foundry Local facilitará a integração do modelo na aplicação.
Windows ML: A base para a inferência eficiente
No coração desta estratégia continua o Windows ML, o runtime de inferência de IA integrado no Windows. Baseado no DirectML, o Windows ML simplifica e otimiza a implementação de modelos em hardware de diversos fabricantes, incluindo AMD, Intel, NVIDIA e Qualcomm. Uma grande vantagem para os programadores é que não terão de se preocupar com futuras atualizações de hardware, pois o Windows ML encarregar-se-á de manter todas as dependências necessárias atualizadas e adaptar-se-á automaticamente a novo silício.
Mais novidades: LoRA para Phi Silica e pesquisa semântica
A Microsoft anunciou ainda o suporte para LoRA (Low-Rank Adaptation) para o seu modelo Phi Silica. O LoRA permite um ajuste fino (fine-tuning) de um pequeno subconjunto dos parâmetros de um modelo utilizando dados personalizados. Este método de ajuste eficiente promete melhorar o desempenho em tipos específicos de tarefas. O LoRA já está disponível em pré-visualização pública com o Windows App SDK 1.8 Experimental 2 em NPUs da série Snapdragon X, chegando aos PCs Copilot+ da Intel e AMD nos próximos meses.
Por fim, foram reveladas novas APIs de Pesquisa Semântica (Semantic Search). Estas permitirão aos programadores criar experiências de pesquisa dentro das suas aplicações, tirando partido da IA para compreender a intenção por detrás das palavras. Esta pesquisa inteligente pode correr localmente e suporta RAG (Retrieval-Augmented Generation), uma técnica que melhora a qualidade das respostas de modelos de linguagem ao fornecer-lhes informação relevante de uma base de dados. As Semantic Search APIs estão disponíveis em pré-visualização privada em todos os PCs Copilot+.
Com o Windows AI Foundry e estas novidades adicionais, a Microsoft reforça a sua aposta em tornar o Windows uma plataforma cada vez mais poderosa e acessível para o desenvolvimento de experiências de IA inovadoras e locais.
Nenhum comentário
Seja o primeiro!