1. TugaTech » Internet e Redes » Noticias da Internet e Mercados
  Login     Registar    |                      
Siga-nos

Adobe com mão robótica

Tal como a grande maioria das gigantes tecnológicas atuais, a Adobe mergulhou de cabeça no mundo da Inteligência Artificial nos últimos anos. Desde 2023, a empresa lançou vários serviços, com destaque para o Adobe Firefly, a sua suite de criação de media. No entanto, esta aposta agressiva na tecnologia pode ter esbarrado num obstáculo legal, com uma nova ação judicial a alegar que a empresa utilizou livros pirateados para treinar um dos seus modelos.

Segundo avançado pela Reuters, foi apresentada uma proposta de ação coletiva em nome de Elizabeth Lyon, uma autora do estado de Oregon, nos EUA. A acusação afirma que a Adobe utilizou versões pirateadas de inúmeros livros — incluindo obras da própria autora — para treinar o programa SlimLM.

A cadeia de dados problemáticos

A Adobe descreve o SlimLM como uma série de pequenos modelos de linguagem (Small Language Models) que podem ser otimizados para tarefas de assistência documental em dispositivos móveis. A empresa declara que o SlimLM foi pré-treinado no SlimPajama-627B, um conjunto de dados open-source lançado pela Cerebras em junho de 2023.

O cerne da questão legal reside na origem destes dados. O processo detalha que o conjunto de dados SlimPajama foi criado através da cópia e manipulação do conjunto RedPajama, que por sua vez inclui o controverso "Books3". Este último é uma coleção massiva de cerca de 191.000 livros que tem sido utilizada para treinar vários sistemas de IA generativa, muitas vezes sem o consentimento dos autores.

Elizabeth Lyon, conhecida pelos seus guias de escrita de não-ficção, argumenta que, como o SlimPajama é uma cópia derivada do RedPajama, este contém inevitavelmente o Books3 e, consequentemente, as suas obras protegidas por direitos de autor.

Uma tendência de litígios na indústria

Este caso não é isolado e reflete uma tendência crescente de desafios legais enfrentados pelas grandes tecnológicas. O conjunto de dados RedPajama e o Books3 têm sido citados em diversos processos. Recentemente, a Apple foi alvo de um processo em setembro, onde se alegava que a empresa utilizou material protegido para treinar os seus modelos de inteligência, sem crédito ou compensação. Também a Salesforce enfrentou acusações semelhantes em outubro.

Os riscos financeiros para as empresas são reais e elevados. Em setembro, a Anthropic concordou em pagar 1,5 mil milhões de dólares a um grupo de autores que a processou por usar versões pirateadas das suas obras para treinar o chatbot Claude. Este acordo foi visto como um ponto de viragem nas batalhas legais sobre direitos de autor e dados de treino de IA, sugerindo que a Adobe poderá ter um caminho difícil pela frente nos tribunais.




Aplicações do TugaTechAplicações TugaTechDiscord do TugaTechDiscord do TugaTechRSS TugaTechRSS do TugaTechSpeedtest TugaTechSpeedtest TugatechHost TugaTechHost TugaTech