
A Google acaba de anunciar uma expansão significativa do seu portefólio MedGemma, com o lançamento de novos modelos de inteligência artificial de código aberto, desenhados especificamente para o setor da saúde. A grande novidade é que estes modelos são capazes de operar com apenas uma única placa gráfica (GPU), tornando a tecnologia mais acessível.
MedGemma 27B Multimodal: o novo cérebro para a saúde digital
O destaque desta nova gama é o MedGemma 27B Multimodal, um modelo que promete revolucionar a interpretação de dados de saúde. Com base nos seus antecessores, os modelos 4B Multimodal e 27B apenas de texto, esta nova versão oferece um suporte mais aprofundado para a análise de registos de saúde eletrónicos (RSE) longitudinais e multimodais, que são notoriamente complexos.
Isto significa que o modelo é capaz de processar e interpretar uma vasta gama de informações do paciente ao longo do tempo, desde notas de texto a outros tipos de dados, abrindo portas para uma análise clínica mais completa e integrada.
MedSigLIP: o especialista em imagiologia médica
A par do modelo principal, a Google introduziu também o MedSigLIP, um codificador de imagem e texto mais leve. Este modelo foi otimizado para tarefas de classificação, pesquisa e outras funções relacionadas no âmbito da imagiologia médica. O MedSigLIP partilha a mesma tecnologia de codificação de imagem que os modelos MedGemma 4B e 27B, o que garante a sua robustez.

Enquanto o MedGemma se posiciona como a ferramenta ideal para tarefas mais complexas, como a geração de relatórios ou a resposta a perguntas visuais sobre exames, o MedSigLIP foi pensado para se integrar em fluxos de trabalho de imagiologia que requerem resultados estruturados, como a classificação e a recuperação de imagens.
Acessibilidade e personalização para todos
Uma das grandes vantagens desta nova família de modelos é o seu foco na acessibilidade. Todos os modelos lançados foram desenhados para funcionar numa única GPU. Além disso, tanto o MedGemma 4B como o MedSigLIP podem ser adaptados para funcionar em ambientes de hardware móvel, como smartphones e tablets.
Estes modelos foram desenvolvidos através da otimização de um codificador de imagem para a área médica e do ajuste fino dos modelos base Gemma 3 com dados de saúde. Sendo de código aberto, a coleção MedGemma permite que programadores e investigadores descarreguem, personalizem e continuem a treinar os modelos para as suas necessidades específicas de investigação ou para o desenvolvimento de novos produtos. A informação foi avançada no blog da Google Research.











Nenhum comentário
Seja o primeiro!