A Meta veio oficialmente revelar o novo Llama 3.1, o mais recente modelo LLM da empresa, disponível em formato open source para todos os interessados. Este modelo inclui o Llama 3.1 8B, Llama 3.1 70B e Llama 3.1 405B.
Estes modelos usam um contexto de 128K de tamanho total, permitindo assim melhorar consideravelmente a tarefa de processamento e das suas capacidades finais. A Meta afirma que terá realizado mais de 150 benchmarks ao seu modelo, além de vários testes humanos, de forma a garantir que o mesmo é adaptado para ser um dos mais avançados modelos open source atualmente disponíveis.
Ao mesmo tempo, a empresa pretende que o seu modelo tenha um uso no mundo real variado, e que se possa adaptar às mais diferentes situações.
O Llama 3.1 405B é colocado na linha como um modelo competitivo, que pode rivalizar com o GPT-4 e Claude 3.5 Sonnet. Este é descrito como um dos mais largos e capazes modelos atualmente disponíveis.
No entanto, existe ainda o Llama 3.1 8B e Llama 3.1 70B, que serão modelos mais pequenos, mas igualmente poderosos, que se podem adaptar a tarefas onde o processamento necessita de ser mais focado.
Embora o desenvolvimento destes modelos tenha custos avultados para a Meta, a empresa continua a manter a ideia de abrir o projeto, sendo que todos os modelos estão disponíveis em formato open source, e podem ser usados pelos interessados.
A Meta afirma que o seu modelo possui o potencial de ultrapassar as capacidades fornecidas por modelos de empresas fechadas, como a Microsoft, OpenAI e Google.
Nenhum comentário
Seja o primeiro!