Lar
Ai Bots raspando seus dados? Esta ferramenta gratuita dá a esses rastreadores irritantes

O surgimento de conteúdo gerado por IA, frequentemente referido como mídia sintética, trouxe vários desafios, incluindo a disseminação de desinformação, o uso não autorizado de trabalhos de artistas e uma queda na confiança em conteúdos online. No entanto, a Cloudflare potencialmente encontrou uma aplicação benéfica para a IA, com o objetivo de proteger o conteúdo original de ser explorado por empresas de IA.
Na quarta-feira, a Cloudflare apresentou o AI Labyrinth, uma ferramenta projetada para usar conteúdo gerado por IA para "desacelerar, confundir e desperdiçar os recursos" de rastreadores de IA não autorizados.
Estudos recentes mostraram que chatbots de IA, como ChatGPT e Perplexity, continuam acessando conteúdo de sites que bloquearam seus rastreadores. A Cloudflare destacou em seu anúncio que esses rastreadores geram mais de 50 bilhões de solicitações para sua rede diariamente, representando pouco menos de 1% de todas as solicitações web que observam. O método de bloqueio desses rastreadores é crucial.
A Cloudflare explicou que, embora possua várias ferramentas para identificar e bloquear rastreamentos de IA não autorizados, simplesmente bloquear esses bots pode alertar os atacantes, levando a um ciclo contínuo de táticas de evasão. Eles queriam desenvolver um novo método para deter esses bots indesejados sem sinalizar que foram detectados.
Quando a Cloudflare detecta uma solicitação de rastreamento não autorizada, o AI Labyrinth não apenas bloqueia o rastreador; em vez disso, ele vincula a várias páginas web geradas por IA que parecem autênticas o suficiente para enganar o rastreador, fazendo-o pensar que são legítimas. Dessa forma, o rastreador acredita erroneamente que obteve com sucesso o conteúdo desejado, enquanto os dados reais do site permanecem protegidos. Além disso, essa abordagem consome os recursos computacionais do rastreador, o que a Cloudflare considera uma vantagem.
O anúncio da Cloudflare detalhou que a ferramenta implanta automaticamente um conjunto de páginas vinculadas geradas por IA ao detectar atividade inadequada de bots, eliminando a necessidade de os clientes configurarem regras personalizadas.
Para criar essas páginas, a Cloudflare utilizou o Workers AI e um modelo de código aberto para produzir páginas sintéticas únicas, semelhantes às humanas, sobre vários tópicos com antecedência. Esse pipeline de pré-geração não apenas sanitiza o conteúdo para prevenir vulnerabilidades XSS, mas também o armazena em R2 para acesso mais rápido.
O AI Labyrinth exibe esses links apenas para rastreadores de IA, garantindo que o conteúdo permaneça oculto para visitantes humanos e não afete a estrutura, aparência ou SEO do site.
A Cloudflare enfatizou seu compromisso em não contribuir para a disseminação de desinformação, garantindo que o conteúdo gerado seja factual e relacionado a tópicos científicos, mas irrelevante para o site que está sendo rastreado.
Além disso, a Cloudflare vê o AI Labyrinth como um potencial honeypot para identificar novos rastreadores ilícitos. Eles observaram que visitantes humanos genuínos são improváveis de navegar por "um labirinto de nonsense gerado por IA", permitindo que a ferramenta detecte novos bots com base em padrões de cliques. Essa percepção ajudará o AI Labyrinth a identificar atores maliciosos de forma mais eficaz.
Como os bots se tornaram hábeis em detectar técnicas tradicionais de honeypot, a Cloudflare planeja evoluir o AI Labyrinth, criando redes de URLs vinculadas mais realistas, que são mais difíceis de serem identificadas por programas automatizados.
Para editores ou indivíduos preocupados com o uso de seu conteúdo para treinar IA ou com a má representação por chatbots, o AI Labyrinth pode ser uma ferramenta valiosa.
Todos os clientes da Cloudflare, incluindo aqueles no plano gratuito, podem ativar o AI Labyrinth hoje acessando seu painel da Cloudflare, navegando até a seção de gerenciamento de bots e ativando a opção AI Labyrinth.
[ttpp]
[yyxx]
Artigo relacionado
A Administração do Ciberespaço da China exige a identificação de vídeos curtos gerados por IA e de ficção
A Administração do Ciberespaço da China lançou um plano abrangente para padronizar a rotulagem de conteúdos de vídeos curtos, exigindo que as plataformas ofereçam seis rótulos obrigatórios — incluindo
O DeepL, conhecido pela tradução de textos, agora se volta para a tradução de voz
A DeepL, empresa de tradução mais conhecida por suas ferramentas baseadas em texto, lançou hoje um pacote de tradução de voz para voz voltado para cenários como reuniões, conversas em dispositivos móv
As anotações de reuniões da IA da Talat ficam armazenadas no seu dispositivo, e não na nuvem
O Granola, aplicativo de anotações com inteligência artificial avaliado em US$ 250 milhões, vem ganhando força entre fundadores de empresas de tecnologia e investidores de capital de risco. Mas um des
Recomendações de tópicos especiais relacionados
Comentários (27)
Wait, so we're giving AI bots a taste of their own medicine? That's pretty ironic and kind of satisfying, not gonna lie! Cloudflare stepping in like this is a clever idea, but I wonder how effective it really is long-term. 🤔 Makes me think we're just entering a new arms race between data protection and data scraping. The web feels like a wild west again!
Nützlich, aber ich frage mich, ob solche Tools Privatanwender auch einfach nutzen können, oder ob das eher für Unternehmen gedacht ist. Die Balance zwischen Datenschutz und Zugänglichkeit ist oft schwierig. Auf jeden Fall ein interessanter Ansatz von Cloudflare! 🤔
이 내용 너무 유용해요! 특히 크롤러를 미끼로 빙빙 돌게 만드는 아이디어 정말 기발하네요 🤩 AI가 데이터를 수집하는 게 걱정될 때 이런 무료 도구가 있다는 건 정말 다행이에요. Cloudflare, 잘 해내고 있는 것 같아요!
This Cloudflare tool sounds like a game-changer! 😎 I’m tired of AI bots snooping on my data. Gotta try this to keep those crawlers at bay!
This Cloudflare tool sounds like a game-changer! I’m tired of AI bots scraping my data without consent. Excited to try it out and give those crawlers a headache! 😎

O surgimento de conteúdo gerado por IA, frequentemente referido como mídia sintética, trouxe vários desafios, incluindo a disseminação de desinformação, o uso não autorizado de trabalhos de artistas e uma queda na confiança em conteúdos online. No entanto, a Cloudflare potencialmente encontrou uma aplicação benéfica para a IA, com o objetivo de proteger o conteúdo original de ser explorado por empresas de IA.
Na quarta-feira, a Cloudflare apresentou o AI Labyrinth, uma ferramenta projetada para usar conteúdo gerado por IA para "desacelerar, confundir e desperdiçar os recursos" de rastreadores de IA não autorizados.
Estudos recentes mostraram que chatbots de IA, como ChatGPT e Perplexity, continuam acessando conteúdo de sites que bloquearam seus rastreadores. A Cloudflare destacou em seu anúncio que esses rastreadores geram mais de 50 bilhões de solicitações para sua rede diariamente, representando pouco menos de 1% de todas as solicitações web que observam. O método de bloqueio desses rastreadores é crucial.
A Cloudflare explicou que, embora possua várias ferramentas para identificar e bloquear rastreamentos de IA não autorizados, simplesmente bloquear esses bots pode alertar os atacantes, levando a um ciclo contínuo de táticas de evasão. Eles queriam desenvolver um novo método para deter esses bots indesejados sem sinalizar que foram detectados.
Quando a Cloudflare detecta uma solicitação de rastreamento não autorizada, o AI Labyrinth não apenas bloqueia o rastreador; em vez disso, ele vincula a várias páginas web geradas por IA que parecem autênticas o suficiente para enganar o rastreador, fazendo-o pensar que são legítimas. Dessa forma, o rastreador acredita erroneamente que obteve com sucesso o conteúdo desejado, enquanto os dados reais do site permanecem protegidos. Além disso, essa abordagem consome os recursos computacionais do rastreador, o que a Cloudflare considera uma vantagem.
O anúncio da Cloudflare detalhou que a ferramenta implanta automaticamente um conjunto de páginas vinculadas geradas por IA ao detectar atividade inadequada de bots, eliminando a necessidade de os clientes configurarem regras personalizadas.
Para criar essas páginas, a Cloudflare utilizou o Workers AI e um modelo de código aberto para produzir páginas sintéticas únicas, semelhantes às humanas, sobre vários tópicos com antecedência. Esse pipeline de pré-geração não apenas sanitiza o conteúdo para prevenir vulnerabilidades XSS, mas também o armazena em R2 para acesso mais rápido.
O AI Labyrinth exibe esses links apenas para rastreadores de IA, garantindo que o conteúdo permaneça oculto para visitantes humanos e não afete a estrutura, aparência ou SEO do site.
A Cloudflare enfatizou seu compromisso em não contribuir para a disseminação de desinformação, garantindo que o conteúdo gerado seja factual e relacionado a tópicos científicos, mas irrelevante para o site que está sendo rastreado.
Além disso, a Cloudflare vê o AI Labyrinth como um potencial honeypot para identificar novos rastreadores ilícitos. Eles observaram que visitantes humanos genuínos são improváveis de navegar por "um labirinto de nonsense gerado por IA", permitindo que a ferramenta detecte novos bots com base em padrões de cliques. Essa percepção ajudará o AI Labyrinth a identificar atores maliciosos de forma mais eficaz.
Como os bots se tornaram hábeis em detectar técnicas tradicionais de honeypot, a Cloudflare planeja evoluir o AI Labyrinth, criando redes de URLs vinculadas mais realistas, que são mais difíceis de serem identificadas por programas automatizados.
Para editores ou indivíduos preocupados com o uso de seu conteúdo para treinar IA ou com a má representação por chatbots, o AI Labyrinth pode ser uma ferramenta valiosa.
Todos os clientes da Cloudflare, incluindo aqueles no plano gratuito, podem ativar o AI Labyrinth hoje acessando seu painel da Cloudflare, navegando até a seção de gerenciamento de bots e ativando a opção AI Labyrinth.
[ttpp]
[yyxx]
A Administração do Ciberespaço da China exige a identificação de vídeos curtos gerados por IA e de ficção
A Administração do Ciberespaço da China lançou um plano abrangente para padronizar a rotulagem de conteúdos de vídeos curtos, exigindo que as plataformas ofereçam seis rótulos obrigatórios — incluindo
O DeepL, conhecido pela tradução de textos, agora se volta para a tradução de voz
A DeepL, empresa de tradução mais conhecida por suas ferramentas baseadas em texto, lançou hoje um pacote de tradução de voz para voz voltado para cenários como reuniões, conversas em dispositivos móv
As anotações de reuniões da IA da Talat ficam armazenadas no seu dispositivo, e não na nuvem
O Granola, aplicativo de anotações com inteligência artificial avaliado em US$ 250 milhões, vem ganhando força entre fundadores de empresas de tecnologia e investidores de capital de risco. Mas um des
Wait, so we're giving AI bots a taste of their own medicine? That's pretty ironic and kind of satisfying, not gonna lie! Cloudflare stepping in like this is a clever idea, but I wonder how effective it really is long-term. 🤔 Makes me think we're just entering a new arms race between data protection and data scraping. The web feels like a wild west again!
Nützlich, aber ich frage mich, ob solche Tools Privatanwender auch einfach nutzen können, oder ob das eher für Unternehmen gedacht ist. Die Balance zwischen Datenschutz und Zugänglichkeit ist oft schwierig. Auf jeden Fall ein interessanter Ansatz von Cloudflare! 🤔
이 내용 너무 유용해요! 특히 크롤러를 미끼로 빙빙 돌게 만드는 아이디어 정말 기발하네요 🤩 AI가 데이터를 수집하는 게 걱정될 때 이런 무료 도구가 있다는 건 정말 다행이에요. Cloudflare, 잘 해내고 있는 것 같아요!
This Cloudflare tool sounds like a game-changer! 😎 I’m tired of AI bots snooping on my data. Gotta try this to keep those crawlers at bay!
This Cloudflare tool sounds like a game-changer! I’m tired of AI bots scraping my data without consent. Excited to try it out and give those crawlers a headache! 😎











