1. TugaTech » Software » Noticias de Software
  Login     Registar    |                      
Siga-nos

PyTorch

 

Desenvolver modelos de machine learning em clusters de grande escala pode ser uma tarefa hercúlea, exigindo um conhecimento profundo de sistemas distribuídos que muitos programadores não possuem. A pensar nisso, o PyTorch lançou o Monarch, um novo framework de programação distribuída que promete simplificar radicalmente este processo. A novidade foi apresentada no blog oficial do PyTorch.

 

A grande promessa do Monarch é permitir que os programadores escrevam código para sistemas distribuídos como se estivessem a trabalhar numa única máquina. Esta abordagem visa democratizar o acesso à computação de alta performance, abstraindo grande parte da complexidade associada à gestão de múltiplos servidores e GPUs.

 

Uma ponte entre Python e a robustez do Rust

 

Para alcançar este objetivo, o Monarch combina o melhor de dois mundos: um frontend baseado em Python, garantindo uma integração perfeita com o ecossistema PyTorch existente, e um backend construído em Rust, conhecido pelo seu elevado desempenho e robustez.

 

O framework organiza os programas distribuídos numa malha multidimensional de processos, anfitriões e "atores" (unidades de computação). Através de APIs simplificadas, os utilizadores podem operar nesta malha complexa, enquanto o Monarch gere automaticamente toda a distribuição e paralelização das tarefas.

 

Velocidade máxima e uma abordagem pragmática a falhas

 

Em ambientes distribuídos, a comunicação entre diferentes nós é crucial. O Monarch otimiza este processo ao separar as mensagens do plano de controlo (instruções) das do plano de dados. Esta separação permite transferências diretas de memória entre GPUs e a gestão eficiente de tensores fragmentados, fazendo com que as operações em grandes clusters de GPUs decorram de forma transparente.

 

No que toca à tolerância a falhas, o Monarch adota uma abordagem "fail fast", parando todas as operações ao primeiro erro para facilitar a depuração. No entanto, oferece também aos utilizadores mais avançados a capacidade de implementar mecanismos de recuperação mais detalhados, garantindo a resiliência necessária para sistemas críticos.

 

Apesar de ser atualmente considerado experimental, o Monarch representa uma nova e promissora direção para a programação distribuída no ecossistema de Inteligência Artificial, tornando o desenvolvimento de modelos de grande escala mais acessível do que nunca.




Aplicações do TugaTechAplicações TugaTechDiscord do TugaTechDiscord do TugaTechRSS TugaTechRSS do TugaTechSpeedtest TugaTechSpeedtest TugatechHost TugaTechHost TugaTech