Jornal com Tecnologia

A Guerra dos Bots: como as empresas digitais buscam blindagem contra "vampiros" de conteúdo

Novos robôs rastreiam sites para alimentar chatbots como o ChatGPT

Com a ascensão da IA generativa, os novos robôs rastreiam sites para alimentar chatbots
Com a ascensão da IA generativa, os novos robôs rastreiam sites para alimentar chatbots Foto : PATRICIA DE MELO MOREIRA / AFP

Cada vez mais empresas digitais buscam métodos para resistir aos bots das companhias de Inteligência Artificial (IA) que, agindo como "vampiros", sugam os conteúdos da web para alimentar seus algoritmos. Esse processo não só gera saturação nas infraestruturas digitais, mas também está alterando drasticamente o modelo econômico fundamental da Internet.

Os indexadores (crawlers), que vasculham bilhões de sites para classificá-los nos motores de busca, existem há décadas e são essenciais para o funcionamento da web. Antes, a dinâmica era de troca: "o site que dava o acesso de seu conteúdo aos robôs recebia em troca leitores", ou seja, pessoas a quem se podia mostrar publicidade ou vender uma assinatura, explica Kurt Muehmel, da Dataiku.

Contudo, com a ascensão da IA generativa, os novos robôs rastreiam sites para alimentar chatbots como o ChatGPT (da OpenAI) e a função "prévia" do Google. Nesses casos, os conteúdos são reproduzidos sem que o usuário precise "ir ao site original", o que "rompe completamente a troca" que sustentava a economia da web. Um exemplo disso é a Wikipedia, que registrou uma queda de 8% no fluxo de internautas entre 2024 e 2025 devido à atividade constante desses bots.

Bloqueios e sanguessugas digitais

"O problema fundamental é que a nova economia da Internet baseada em IA não gera tráfego" humano, explica Matthew Prince, diretor-geral da Cloudflare. Com esses robôs – uma espécie de "sanguessugas digitais" que consultam o conteúdo de um site centenas de milhares de vezes por dia – os produtores de conteúdo, especialmente os meios de comunicação, registram a saturação de suas infraestruturas digitais e uma queda subsequente em suas receitas publicitárias.

Para combater esse fenômeno, a Cloudflare, que gerencia cerca de 20% do tráfego mundial da rede, implementou há alguns meses o bloqueio sistemático aos bots de IA.

"É como colocar uma placa de limite de velocidade ou uma placa de 'proibido passar'," afirma Prince. "Os bots ruins podem ignorar essa placa, mas nós os rastreamos (...) e, se necessário, podemos endurecer essas regras para que as empresas de IA não possam passar."

Essa medida, que se aplica a mais de dez milhões de sites, já "chamou a atenção dos gigantes da inteligência artificial", segundo o especialista.

O modelo de pedágio

Paralelamente, startups buscam monetizar esse tráfego de bots. A americana TollBit fornece aos editores de imprensa online ferramentas para deter, monitorar e monetizar o tráfego dos robôs de IA.

"A Internet é uma rodovia e nós fornecemos um pedágio" para esses bots, compara Toshit Panigrahi, diretor-geral da TollBit. A empresa, que colabora com mais de 5.600 sites (incluindo USA Today, Time e Associated Press), permite que seus clientes estabeleçam suas próprias tarifas de acesso. As ferramentas de análise são gratuitas para os editores, mas a TollBit "cobra das empresas de IA uma taxa por transação para cada conteúdo ao qual acessam".

Risco para a criação de conteúdo original

Apesar das soluções, Kurt Muehmel adverte que o problema dos indexadores de IA não pode ser resolvido apenas "com medidas parciais ou de uma única empresa". "Trata-se de uma evolução de toda a economia da Internet, que levará anos", adverte.

Matthew Prince corrobora o risco, prevendo que, se a situação não for resolvida, "desaparecerão todos os incentivos para a criação de conteúdos". Segundo ele, isso seria uma perda "não apenas para os seres humanos que querem consumir esses conteúdos, mas também para as empresas de IA que precisam de conteúdos originais para treinar seus sistemas".

Veja Também