1. TugaTech » Software » Noticias de Software » PyTorch Monarch: o novo framework que transforma a programação distribuída numa tarefa de um só PC
  Login     Registar    |                      
Siga-nos

Você não está conectado. Conecte-se ou registre-se

  

Opções



Mensagens anteriores

PyTorch Monarch: o novo framework que transforma a programação distribuída numa tarefa de um só PC em Sex 24 Out 2025 - 12:29

DJPRMF

PyTorch

Desenvolver modelos de machine learning em clusters de grande escala pode ser uma tarefa hercúlea, exigindo um conhecimento profundo de sistemas distribuídos que muitos programadores não possuem. A pensar nisso, o PyTorch lançou o Monarch, um novo framework de programação distribuída que promete simplificar radicalmente este processo. A novidade foi apresentada no blog oficial do PyTorch.

A grande promessa do Monarch é permitir que os programadores escrevam código para sistemas distribuídos como se estivessem a trabalhar numa única máquina. Esta abordagem visa democratizar o acesso à computação de alta performance, abstraindo grande parte da complexidade associada à gestão de múltiplos servidores e GPUs.

Uma ponte entre Python e a robustez do Rust

Para alcançar este objetivo, o Monarch combina o melhor de dois mundos: um frontend baseado em Python, garantindo uma integração perfeita com o ecossistema PyTorch existente, e um backend construído em Rust, conhecido pelo seu elevado desempenho e robustez.

O framework organiza os programas distribuídos numa malha multidimensional de processos, anfitriões e "atores" (unidades de computação). Através de APIs simplificadas, os utilizadores podem operar nesta malha complexa, enquanto o Monarch gere automaticamente toda a distribuição e paralelização das tarefas.

Velocidade máxima e uma abordagem pragmática a falhas

Em ambientes distribuídos, a comunicação entre diferentes nós é crucial. O Monarch otimiza este processo ao separar as mensagens do plano de controlo (instruções) das do plano de dados. Esta separação permite transferências diretas de memória entre GPUs e a gestão eficiente de tensores fragmentados, fazendo com que as operações em grandes clusters de GPUs decorram de forma transparente.

No que toca à tolerância a falhas, o Monarch adota uma abordagem "fail fast", parando todas as operações ao primeiro erro para facilitar a depuração. No entanto, oferece também aos utilizadores mais avançados a capacidade de implementar mecanismos de recuperação mais detalhados, garantindo a resiliência necessária para sistemas críticos.

Apesar de ser atualmente considerado experimental, o Monarch representa uma nova e promissora direção para a programação distribuída no ecossistema de Inteligência Artificial, tornando o desenvolvimento de modelos de grande escala mais acessível do que nunca.



  As mensagens apresentadas em cima não são actualizadas automaticamente pelo que se uma nova mensagem for colocada enquanto se encontra nesta página, não irá aparecer na lista em cima.


Aplicações do TugaTechAplicações TugaTechDiscord do TugaTechDiscord do TugaTechRSS TugaTechRSS do TugaTechSpeedtest TugaTechSpeedtest TugatechHost TugaTechHost TugaTech