A Inteligência Artificial encontra-se atualmente na linha da frente para o que muitos consideram ser o "futuro". No entanto, para construir esse futuro virtual, em parte é devido a milhares de conteúdos que foram partilhados pela Internet nos últimos anos.
Um recente estudo partilhado pelo Washington Post aponta que, atualmente, os dados que se encontram faz mais de 30 anos na internet estão a ser usados para treinar modelos de IA em larga escala.
Qualquer utilizador que tenham criado um site, um blog, uma publicação no Reddit ou qualquer outro formato de texto na internet, nos últimos 30 anos, possivelmente encontra-se com uma parte do seu conteúdo a ser usada para treino de modelos de IA atualmente.
Não existe um melhor local para recolha de expressões, ideias e conhecimentos que a Internet, e todos os sites que fazem parte da rede mundial de computadores usam exatamente isso fizeram-no durante anos a fio.
No entanto, todos esses conhecimentos estão agora a ser explorados para criar bases de dados gigantes com informação de praticamente toda uma internet ao longo dos últimos anos. Quer se queira, quer não, essa informação está disponível para qualquer um ver, e encontra-se na base de como muitos modelos de IA foram treinados – e continuam a ser – todos os dias.
Isto aplica-se não apenas a conteúdos de texto, mas também imagens, vídeos e sons. Estes conteúdos podem ser usados para criar IA dedicada para diferentes tarefas, seja apenas como chatbots diretos ou como substitutos em criações artísticas.
O tema, no entanto, levanta também as suas próprias questões, sendo que existem grupos que consideram também a legalidade desta recolha de informações e a própria criação de projetos e ideias com base nos mesmos, sem que sejam propriamente dadas fontes concretas para tais criações.
Nenhum comentário
Seja o primeiro!