1. TugaTech » Internet e Redes » Noticias da Internet e Mercados
Siga-nos

Meta com pirataria

 

Cada vez mais a IA encontra-se no dia a dia dos utilizadores, e com isto, existem cada vez mais modelos avançados, que são treinados numa infinidade de dados. O GPT da OpenAI é provavelmente um dos mais conhecidos, sendo usado no ChatGPT, mas de longe não é o único.

 

A Meta também entrou na corrida com o Llama, um modelo aberto para todos, que usa um conjunto de fontes para treino. No entanto, os dados usados para o treino dos modelos de IA não podem ser retirados de fontes sem autorização, e parece que a Meta encontra-se agora em alguns problemas derivado a isso.

 

Foi recentemente apresentado no tribunal da Califórnia uma queixa contra a Meta, onde a empresa é acusada de usar dados protegidos por direitos de autor para o treino dos seus modelos de IA, nomeadamente o Llama. A piorar, esta medida teria sido feita com total aprovação de Mark Zuckerberg.

 

Segundo a acusação, a Meta terá usado o LibGen, uma ferramenta que é conhecida por recolher links de várias fontes, para usar as mesmas como treino dos modelos da mesma. NMo entanto, por entre os dados estariam vários conteúdos que violam os direitos de autor, como livros disponíveis para download pela internet, e que foram usados igualmente para treinar os modelos da empresa.

 

Aparentemente, a Meta terá apresentado a justificação, o ano passado, que realmente usava o LibGen para a recolha de dados, e que este foi usado com a permissão de Zuckerberg. No entanto, a nova acusação vai ainda mais longe, indicando que a Meta terá recolhido os dados para treino sem autorização, e quando foram identificados, os materiais tiveram as suas referências removidas – de forma a que não fosse possível identificar a origem dos mesmos ou dos materiais de onde foram recolhidos.

 

A acusação no presente caso indica que a Meta terá usado ilegalmente o LibGen, para a recolha dos dados, e não foram aplicadas as medidas necessárias para prevenir que conteúdos em violação de direitos de autor fossem usados para o treino dos modelos.

 

Este caso não abona a favor da Meta, quando até mesmo Yann LeCun, chefe da divisão de IA da empresa, afirmou o ano passado que os autores deveriam colocar as suas publicações livremente disponíveis para serem usadas para treino de modelos de IA.

 

Até ao momento a Meta não deixou comentários sobre o caso.

Nenhum comentário

Seja o primeiro!





Aplicações do TugaTechAplicações TugaTechDiscord do TugaTechDiscord do TugaTechRSS TugaTechRSS do TugaTechSpeedtest TugaTechSpeedtest TugatechHost TugaTechHost TugaTech