Hogar
¿AI bots raspando sus datos? Esta herramienta gratuita ofrece a esos molestos rastreadores la respuesta

El auge del contenido generado por IA, a menudo referido como medios sintéticos, ha traído consigo varios desafíos, incluyendo la propagación de desinformación, el uso no autorizado del trabajo de artistas y una disminución en la confianza en el contenido en línea. Sin embargo, Cloudflare ha encontrado potencialmente una aplicación beneficiosa para la IA, con el objetivo de proteger el contenido original de ser explotado por empresas de IA.
El miércoles, Cloudflare presentó AI Labyrinth, una herramienta diseñada para usar contenido generado por IA para "ralentizar, confundir y desperdiciar los recursos" de los rastreadores de IA no autorizados.
Estudios recientes han mostrado que los chatbots de IA, como ChatGPT y Perplexity, continúan accediendo al contenido de sitios web que han bloqueado sus rastreadores. Cloudflare destacó en su anuncio que estos rastreadores generan más de 50 mil millones de solicitudes a su red diariamente, representando justo por debajo del 1% de todas las solicitudes web que observan. El método para bloquear estos rastreadores es crucial.
Cloudflare explicó que, aunque tienen múltiples herramientas para identificar y bloquear el rastreo de IA no autorizado, simplemente bloquear estos bots puede alertar a los atacantes, lo que lleva a un ciclo continuo de tácticas de evasión. Querían idear un nuevo método para disuadir a estos bots no deseados sin señalar que han sido detectados.
Cuando Cloudflare detecta una solicitud de rastreo no autorizada, AI Labyrinth no solo bloquea al rastreador; en cambio, enlaza a varias páginas web generadas por IA que parecen lo suficientemente auténticas como para engañar al rastreador, haciéndole creer que son legítimas. De esta manera, el rastreador cree erróneamente que ha extraído con éxito el contenido deseado, mientras que los datos reales del sitio permanecen protegidos. Además, este enfoque consume los recursos computacionales del rastreador, lo que Cloudflare considera una ventaja.
El anuncio de Cloudflare detalló que la herramienta despliega automáticamente un conjunto de páginas enlazadas generadas por IA al detectar actividad de bots inapropiada, eliminando la necesidad de que los clientes configuren reglas personalizadas.
Para crear estas páginas, Cloudflare utilizó Workers AI y un modelo de código abierto para producir páginas sintéticas únicas, similares a las humanas, sobre diversos temas con antelación. Esta tubería de pregeneración no solo limpia el contenido para prevenir vulnerabilidades XSS, sino que también lo almacena en R2 para un acceso más rápido.
AI Labyrinth solo muestra estos enlaces a los rastreadores de IA, asegurando que el contenido permanezca oculto para los visitantes humanos y no afecte la estructura, apariencia o SEO del sitio.
Cloudflare enfatizó su compromiso de no contribuir a la propagación de desinformación, asegurando que el contenido generado es factual y relacionado con temas científicos, pero irrelevante para el sitio que está siendo rastreado.
Además, Cloudflare ve a AI Labyrinth como un posible honeypot para identificar nuevos rastreadores ilícitos. Notaron que los visitantes humanos genuinos son poco probables que naveguen a través de "un laberinto de contenido sin sentido generado por IA", lo que permite a la herramienta detectar nuevos bots basándose en patrones de clics. Esta información ayudará a AI Labyrinth a identificar más eficazmente a los actores maliciosos.
A medida que los bots se han vuelto hábiles para detectar técnicas tradicionales de honeypot, Cloudflare planea que AI Labyrinth evolucione, creando redes de URLs enlazadas más realistas que son más difíciles de identificar para los programas automatizados.
Para editores o individuos preocupados por que su contenido sea utilizado para entrenar IA o sea tergiversado por chatbots, AI Labyrinth podría ser una herramienta valiosa.
Todos los clientes de Cloudflare, incluidos aquellos en el nivel gratuito, pueden habilitar AI Labyrinth hoy accediendo a su panel de Cloudflare, navegando a la sección de gestión de bots y activando la opción de AI Labyrinth.
[ttpp]
[yyxx]
Artículo relacionado
La Administración del Ciberespacio de China exige el etiquetado de los vídeos cortos generados por IA y de ficción
La Administración del Ciberespacio de China ha puesto en marcha un plan integral para normalizar el etiquetado de los contenidos de vídeos cortos, exigiendo a las plataformas que incluyan seis etiquet
DeepL, conocida por la traducción de textos, se centra ahora en la traducción de voz
DeepL, una empresa de traducción conocida principalmente por sus herramientas de texto, ha lanzado hoy un paquete de traducción de voz a voz diseñado para situaciones como reuniones, conversaciones po
Las notas de las reuniones de Talat generadas por IA se guardan en tu dispositivo, no en la nube
Granola, la aplicación para tomar notas basada en IA valorada en 250 millones de dólares, ha ganado popularidad entre los fundadores de empresas tecnológicas y los inversores de capital riesgo. Sin em
Recomendaciones de temas especiales relacionados
comentario (27)
0/500
Wait, so we're giving AI bots a taste of their own medicine? That's pretty ironic and kind of satisfying, not gonna lie! Cloudflare stepping in like this is a clever idea, but I wonder how effective it really is long-term. 🤔 Makes me think we're just entering a new arms race between data protection and data scraping. The web feels like a wild west again!
Nützlich, aber ich frage mich, ob solche Tools Privatanwender auch einfach nutzen können, oder ob das eher für Unternehmen gedacht ist. Die Balance zwischen Datenschutz und Zugänglichkeit ist oft schwierig. Auf jeden Fall ein interessanter Ansatz von Cloudflare! 🤔
이 내용 너무 유용해요! 특히 크롤러를 미끼로 빙빙 돌게 만드는 아이디어 정말 기발하네요 🤩 AI가 데이터를 수집하는 게 걱정될 때 이런 무료 도구가 있다는 건 정말 다행이에요. Cloudflare, 잘 해내고 있는 것 같아요!
This Cloudflare tool sounds like a game-changer! 😎 I’m tired of AI bots snooping on my data. Gotta try this to keep those crawlers at bay!
This Cloudflare tool sounds like a game-changer! I’m tired of AI bots scraping my data without consent. Excited to try it out and give those crawlers a headache! 😎

El auge del contenido generado por IA, a menudo referido como medios sintéticos, ha traído consigo varios desafíos, incluyendo la propagación de desinformación, el uso no autorizado del trabajo de artistas y una disminución en la confianza en el contenido en línea. Sin embargo, Cloudflare ha encontrado potencialmente una aplicación beneficiosa para la IA, con el objetivo de proteger el contenido original de ser explotado por empresas de IA.
El miércoles, Cloudflare presentó AI Labyrinth, una herramienta diseñada para usar contenido generado por IA para "ralentizar, confundir y desperdiciar los recursos" de los rastreadores de IA no autorizados.
Estudios recientes han mostrado que los chatbots de IA, como ChatGPT y Perplexity, continúan accediendo al contenido de sitios web que han bloqueado sus rastreadores. Cloudflare destacó en su anuncio que estos rastreadores generan más de 50 mil millones de solicitudes a su red diariamente, representando justo por debajo del 1% de todas las solicitudes web que observan. El método para bloquear estos rastreadores es crucial.
Cloudflare explicó que, aunque tienen múltiples herramientas para identificar y bloquear el rastreo de IA no autorizado, simplemente bloquear estos bots puede alertar a los atacantes, lo que lleva a un ciclo continuo de tácticas de evasión. Querían idear un nuevo método para disuadir a estos bots no deseados sin señalar que han sido detectados.
Cuando Cloudflare detecta una solicitud de rastreo no autorizada, AI Labyrinth no solo bloquea al rastreador; en cambio, enlaza a varias páginas web generadas por IA que parecen lo suficientemente auténticas como para engañar al rastreador, haciéndole creer que son legítimas. De esta manera, el rastreador cree erróneamente que ha extraído con éxito el contenido deseado, mientras que los datos reales del sitio permanecen protegidos. Además, este enfoque consume los recursos computacionales del rastreador, lo que Cloudflare considera una ventaja.
El anuncio de Cloudflare detalló que la herramienta despliega automáticamente un conjunto de páginas enlazadas generadas por IA al detectar actividad de bots inapropiada, eliminando la necesidad de que los clientes configuren reglas personalizadas.
Para crear estas páginas, Cloudflare utilizó Workers AI y un modelo de código abierto para producir páginas sintéticas únicas, similares a las humanas, sobre diversos temas con antelación. Esta tubería de pregeneración no solo limpia el contenido para prevenir vulnerabilidades XSS, sino que también lo almacena en R2 para un acceso más rápido.
AI Labyrinth solo muestra estos enlaces a los rastreadores de IA, asegurando que el contenido permanezca oculto para los visitantes humanos y no afecte la estructura, apariencia o SEO del sitio.
Cloudflare enfatizó su compromiso de no contribuir a la propagación de desinformación, asegurando que el contenido generado es factual y relacionado con temas científicos, pero irrelevante para el sitio que está siendo rastreado.
Además, Cloudflare ve a AI Labyrinth como un posible honeypot para identificar nuevos rastreadores ilícitos. Notaron que los visitantes humanos genuinos son poco probables que naveguen a través de "un laberinto de contenido sin sentido generado por IA", lo que permite a la herramienta detectar nuevos bots basándose en patrones de clics. Esta información ayudará a AI Labyrinth a identificar más eficazmente a los actores maliciosos.
A medida que los bots se han vuelto hábiles para detectar técnicas tradicionales de honeypot, Cloudflare planea que AI Labyrinth evolucione, creando redes de URLs enlazadas más realistas que son más difíciles de identificar para los programas automatizados.
Para editores o individuos preocupados por que su contenido sea utilizado para entrenar IA o sea tergiversado por chatbots, AI Labyrinth podría ser una herramienta valiosa.
Todos los clientes de Cloudflare, incluidos aquellos en el nivel gratuito, pueden habilitar AI Labyrinth hoy accediendo a su panel de Cloudflare, navegando a la sección de gestión de bots y activando la opción de AI Labyrinth.
[ttpp]
[yyxx]
La Administración del Ciberespacio de China exige el etiquetado de los vídeos cortos generados por IA y de ficción
La Administración del Ciberespacio de China ha puesto en marcha un plan integral para normalizar el etiquetado de los contenidos de vídeos cortos, exigiendo a las plataformas que incluyan seis etiquet
DeepL, conocida por la traducción de textos, se centra ahora en la traducción de voz
DeepL, una empresa de traducción conocida principalmente por sus herramientas de texto, ha lanzado hoy un paquete de traducción de voz a voz diseñado para situaciones como reuniones, conversaciones po
Las notas de las reuniones de Talat generadas por IA se guardan en tu dispositivo, no en la nube
Granola, la aplicación para tomar notas basada en IA valorada en 250 millones de dólares, ha ganado popularidad entre los fundadores de empresas tecnológicas y los inversores de capital riesgo. Sin em
Wait, so we're giving AI bots a taste of their own medicine? That's pretty ironic and kind of satisfying, not gonna lie! Cloudflare stepping in like this is a clever idea, but I wonder how effective it really is long-term. 🤔 Makes me think we're just entering a new arms race between data protection and data scraping. The web feels like a wild west again!
Nützlich, aber ich frage mich, ob solche Tools Privatanwender auch einfach nutzen können, oder ob das eher für Unternehmen gedacht ist. Die Balance zwischen Datenschutz und Zugänglichkeit ist oft schwierig. Auf jeden Fall ein interessanter Ansatz von Cloudflare! 🤔
이 내용 너무 유용해요! 특히 크롤러를 미끼로 빙빙 돌게 만드는 아이디어 정말 기발하네요 🤩 AI가 데이터를 수집하는 게 걱정될 때 이런 무료 도구가 있다는 건 정말 다행이에요. Cloudflare, 잘 해내고 있는 것 같아요!
This Cloudflare tool sounds like a game-changer! 😎 I’m tired of AI bots snooping on my data. Gotta try this to keep those crawlers at bay!
This Cloudflare tool sounds like a game-changer! I’m tired of AI bots scraping my data without consent. Excited to try it out and give those crawlers a headache! 😎











