A plataforma da Cloudflare é uma das maiores na atualidade a fornecer serviços de proteção e otimização de sites na internet. Uma das ferramentas que a plataforma fornece é a capacidade de bloquear bots usados por sistemas de IA, que recolhem informação da internet.
Os clientes da Cloudflare, com sites configurados no mesmo, podem ativar a proteção para impedir que os bots possam recolher dados dos sites. No entanto, a empresa acaba de confirmar uma versão ligeiramente modificada deste sistema, que invés de bloquear, leva os bots para um “labirinto” de informação.
A empresa confirmou recentemente a sua nova funcionalidade “AI Labyrinth”, que basicamente leva os bots de IA a um labirinto de informação, que é criada de forma automática – curiosamente, usando IA – mas que não é relacionada com o site em questão.
A ideia será criar um sistema onde os bots possam navegar, mas ao mesmo tempo não recolham dados dos sites que estão a aceder. Quando os sistemas da Cloudflare identificam o acesso de um bot usado para a recolha de dados para treino de modelos LLM, os mesmos enviam o bot para um labirinto, que é automaticamente criado por IA.
Este labirinto consiste numa quantidade ilimitada de informação que é enviada para os bots invés da presente no site real, e que os confunde, levando a acabarem por gastar recursos de forma desnecessária sem recolher informação do site original.
O labirinto é composto por informação criada por IA, que embora seja considerada “lixo”, é baseada em factos científicos e reais. Ou seja, os bots continuam a recolher informação, não apenas a que se encontra verdadeiramente no site.
A Cloudflare acredita que este sistema será mais eficaz em evitar a recolha de dados massiva para treino de modelos LLM, invés de simplesmente bloquear os bots – que em alguns casos poderia ser facilmente contornado. Este sistema é mais conhecido no meio como “honeypot”, neste caso com foco para bots de IA.
No futuro, a Cloudflare pretende melhorar o sistema, para que além de informação direta, possa ainda fornecer links e outros conteúdos para diferentes plataformas, que vão levar a que confunda ainda mais o sistema de bots. Estes links seriam usados apenas para acesso dos bots, e não ficariam visíveis para humanos.
A funcionalidade encontra-se agora disponível para quem use a plataforma, mesmo para utilizadores de contas gratuitas que tenham optado por bloquear bots de IA. A funcionalidade não deve ser ativada por padrão, cabendo ainda aos utilizadores usarem ou não a mesma, conforme pretendam a recolha ou não dos dados para treino de modelos de IA.
Nenhum comentário
Seja o primeiro!