1. TugaTech » Internet e Redes » Noticias da Internet e Mercados
  Login     Registar    |                      
Siga-nos

wikipédia com IA

Todos nós já sentimos aquele arrepio de desconfiança ao ler algo online: será que isto foi escrito por um ser humano ou gerado por um grande modelo de linguagem? Identificar a autoria de um texto tornou-se uma tarefa notavelmente difícil nos últimos tempos. Durante alguns meses do ano passado, houve quem se convencesse de que palavras específicas (como o infame "delve" em inglês) denunciavam imediatamente os modelos, mas as provas são escassas e, à medida que a tecnologia evolui, as "pistas" tornam-se cada vez mais difíceis de rastrear.

No entanto, parece que os editores da Wikipédia tornaram-se especialistas em sinalizar prosa escrita por inteligência artificial. O guia público do grupo sobre os sinais de escrita de IA é, possivelmente, um dos melhores recursos disponíveis para confirmar se as suas suspeitas têm fundamento.

Os detetives do "Project AI Cleanup"

Desde 2023, os editores da Wikipédia têm trabalhado arduamente para controlar as submissões geradas por IA, através de uma iniciativa denominada "Project AI Cleanup". Com milhões de edições a entrarem na plataforma diariamente, o grupo dispõe de material abundante para análise. No estilo clássico e meticuloso que caracteriza os editores da enciclopédia livre, produziram um guia de campo que é simultaneamente detalhado e fundamentado em evidências.

Para começar, o guia confirma algo que muitos já suspeitavam: as ferramentas automatizadas de deteção são, basicamente, inúteis. Em vez de depender de software, o guia foca-se em hábitos de escrita e expressões que são raras na Wikipédia, mas extremamente comuns na internet em geral (e, consequentemente, comuns nos dados de treino dos modelos).

Segundo o guia, as submissões de IA tendem a gastar muito tempo a enfatizar a razão pela qual um assunto é importante, recorrendo quase sempre a termos genéricos como "um momento crucial" ou "um movimento mais amplo". Além disso, os modelos também tendem a detalhar pequenas aparições na comunicação social para fazer com que o sujeito pareça notável — o tipo de linguagem que se esperaria de uma biografia pessoal ou promocional, mas não de uma fonte enciclopédica independente.

A gramática da Inteligência Artificial

O guia assinala uma peculiaridade particularmente interessante relacionada com orações finais que contêm afirmações vagas de importância. Os modelos têm tendência a dizer que determinado evento ou detalhe está "enfatizando o significado" de algo, ou "refletindo a relevância contínua" de uma ideia geral. Embora possa ser difícil de explicar isoladamente, uma vez que se aprende a reconhecer este padrão gramatical, começa-se a vê-lo em todo o lado.

Existe também uma forte tendência para a utilização de linguagem de marketing vaga. Paisagens são sempre descritas como "cénicas", as vistas são invariavelmente "de tirar o fôlego", e tudo é apresentado como "limpo e moderno". Como os editores descrevem, o texto acaba por soar "mais como a transcrição de um anúncio de televisão" do que como um artigo informativo.

Estes hábitos, agora sinalizados, estão profundamente enraizados na forma como os modelos de IA são treinados e implementados. Embora possam ser disfarçados com o tempo, será difícil eliminá-los completamente. À medida que o público em geral se torna mais perspicaz na identificação destes padrões, a forma como consumimos e confiamos no conteúdo online poderá sofrer alterações significativas.




Aplicações do TugaTechAplicações TugaTechDiscord do TugaTechDiscord do TugaTechRSS TugaTechRSS do TugaTechSpeedtest TugaTechSpeedtest TugatechHost TugaTechHost TugaTech