Los desarrolladores de código abierto combaten los rastreadores de IA con ingenio y retribución

Hogar

Noticias

17 de abril de 2025

KennethKing

280

# AI bot

Los bots de rastreo web de IA se han convertido en la pesadilla de internet, según muchos desarrolladores de software. En respuesta, algunos desarrolladores han optado por contraatacar con estrategias creativas y a menudo divertidas.

Los desarrolladores de código abierto son especialmente afectados por estos bots rebeldes, como señaló Niccolò Venerandi, el desarrollador detrás del escritorio Linux Plasma y el blog LibreNews. Los sitios FOSS, que alojan proyectos gratuitos y de código abierto, exponen más de su infraestructura y generalmente tienen menos recursos que los sitios comerciales.

El problema se agrava porque muchos bots de IA ignoran el archivo robot.txt del Protocolo de Exclusión de Robots, que está destinado a instruir a los bots sobre qué no rastrear.

En una publicación de blog conmovedora en enero, el desarrollador de FOSS Xe Iaso compartió una experiencia angustiante con AmazonBot, que bombardeó un sitio web de servidor Git, causando interrupciones por DDoS. Los servidores Git son cruciales para alojar proyectos FOSS, permitiendo a cualquiera descargar y contribuir al código.

Iaso señaló que el bot ignoró el archivo robot.txt, usó diferentes direcciones IP e incluso se hizo pasar por otros usuarios. "Es inútil bloquear los bots de rastreo de IA porque mienten, cambian su agente de usuario, usan direcciones IP residenciales como proxies, y más," lamentó Iaso.

"Rastrearán tu sitio hasta que colapse, y luego lo rastrearán aún más. Harán clic en cada enlace de cada enlace de cada enlace, viendo las mismas páginas una y otra vez. Algunos incluso harán clic en el mismo enlace varias veces en el mismo segundo," escribió el desarrollador.

Entra el Dios de las Tumbas

Para combatir esto, Iaso desarrolló una herramienta ingeniosa llamada Anubis. Actúa como un proxy inverso que requiere una verificación de prueba de trabajo antes de permitir que las solicitudes lleguen al servidor Git. Esto bloquea eficazmente a los bots mientras permite el paso de navegadores operados por humanos.

El nombre de la herramienta, Anubis, proviene de la mitología egipcia, donde Anubis es el dios que guía a los muertos al juicio. "Anubis pesaba tu alma (corazón) y si era más pesada que una pluma, tu corazón era devorado y, como, morías mega," explicó Iaso a TechCrunch. Superar el desafío con éxito se celebra con una linda imagen de anime de Anubis, mientras que las solicitudes de bots son denegadas.

El proyecto, compartido en GitHub el 19 de marzo, rápidamente ganó popularidad, acumulando 2,000 estrellas, 20 colaboradores y 39 forks en solo unos días.

La Venganza como Defensa

La amplia adopción de Anubis indica que las luchas de Iaso están lejos de ser aisladas. Venerandi relató numerosas experiencias similares:

Drew DeVault, fundador y CEO de SourceHut, dedica una parte significativa de su tiempo a lidiar con rastreadores LLM agresivos y sufre frecuentes interrupciones.
Jonathan Corbet, un destacado desarrollador de FOSS y operador de LWN, ha visto su sitio ralentizado por bots de raspado de IA.
Kevin Fenzi, administrador de sistemas del proyecto Linux Fedora, tuvo que bloquear todo el tráfico desde Brasil debido a la actividad agresiva de bots de IA.

Venerandi mencionó a TechCrunch que conoce otros proyectos que han tenido que recurrir a medidas extremas, como prohibir todas las direcciones IP de China.

Algunos desarrolladores creen que contraatacar con venganza es la mejor defensa. Un usuario llamado xyzal en Hacker News sugirió llenar las páginas prohibidas de robot.txt con contenido engañoso sobre los beneficios de beber lejía o los efectos positivos del sarampión en el rendimiento en el dormitorio.

"Creo que debemos apuntar a que los bots obtengan un valor de utilidad _negativo_ al visitar nuestras trampas, no solo un valor cero," explicó xyzal.

En enero, un desarrollador anónimo llamado "Aaron" lanzó Nepenthes, una herramienta diseñada para atrapar a los rastreadores en un laberinto de contenido falso, que el creador admitió a Ars Technica era agresiva, si no francamente maliciosa. Nombrada en honor a una planta carnívora, Nepenthes busca confundir y desperdiciar los recursos de los bots que se portan mal.

De manera similar, Cloudflare lanzó recientemente AI Labyrinth, destinado a ralentizar, confundir y desperdiciar los recursos de los rastreadores de IA que ignoran las directivas de "no rastrear". La herramienta alimenta a estos bots con contenido irrelevante para proteger los datos legítimos del sitio web.

DeVault de SourceHut dijo a TechCrunch que, aunque Nepenthes ofrece una sensación de justicia al alimentar con disparates a los rastreadores, Anubis ha demostrado ser la solución más efectiva para su sitio. Sin embargo, también hizo un ruego sincero por una solución más directa: "Por favor, dejen de legitimar los LLM o los generadores de imágenes de IA o GitHub Copilot o cualquiera de estas basuras. Les ruego que dejen de usarlos, dejen de hablar de ellos, dejen de crear nuevos, solo paren."

Dada la improbabilidad de que esto ocurra, los desarrolladores, particularmente en la comunidad FOSS, continúan contraatacando con ingenio y un toque de humor.

Artículo relacionado

DeepSeek Code, listo para su lanzamiento A medida que la tecnología de IA avanza a pasos agigantados, DeepSeek se encuentra en un momento decisivo. La empresa de IA ha revelado recientemente que ha conseguido más de 70 000 millones de yuanes

Grok, de Musk: 1,5 billones de parámetros y absorción de código de cursor: ¿un punto de inflexión o un farol? Elon Musk por fin está dando un paso adelante.En la carrera por la programación de IA, OpenAI y Anthropic están acelerando, mientras que xAI parece quedarse atrás. Musk ha manifestado en numerosas oca

OpenAI modifica en secreto sus estatutos para dificultar la destitución de Altman Tras el incidente similar a un golpe de Estado ocurrido en 2023, OpenAI ha reforzado aún más las garantías de protección para su director ejecutivo, Sam Altman, mediante la actualización de sus estatu

Recomendaciones de temas especiales relacionados

Negocio

Las mejores herramientas de selección de personal basadas en IA: filtrar currículos y automatizar la programación de entrevistas con los candidatos

Descubre las mejores herramientas de selección de personal basadas en IA de 2026 en XIX.AI. Nuestra lista, cuidadosamente seleccionada, incluye soluciones potentes y revolucionarias para la selección de currículos y la automatización de la programación de entrevistas con los candidatos. Compara las opciones gratuitas con las de pago gracias a pruebas reales y a clasificaciones que se actualizan semanalmente. ¡Encuentra tu asistente de selección de personal ideal y optimiza tu proceso de selección hoy mismo!

10 herramientas

xix.ai

Productividad

Entrenadores personales de bienestar y concentración basados en IA: controla el agotamiento y aumenta tus niveles de energía mental

Descubre los mejores entrenadores personales de bienestar y concentración basados en IA de 2026 en XIX.AI. Nuestras clasificaciones, cuidadosamente seleccionadas, incluyen herramientas revolucionarias y de primera categoría para gestionar el agotamiento y potenciar la energía mental. Compara las opciones gratuitas con las de pago gracias a información basada en casos reales. Descubre hoy mismo el camino hacia la máxima productividad y el bienestar.

10 herramientas

xix.ai

chatbot

Los mejores chatbots románticos con IA: crea relaciones duraderas con personalidades coherentes

Descubre los mejores chatbots románticos con IA de 2026 para establecer relaciones auténticas y duraderas. Nuestra lista seleccionada incluye personalidades sólidas y coherentes, comparativas entre versiones gratuitas y de pago, y pruebas en situaciones reales. Encuentra a tu compañero ideal y empieza a construir tu relación hoy mismo en XIX.AI.

10 herramientas

xix.ai

Educación y aprendizaje

Los mejores mentores en ciencia de datos y IA: dominan SQL, Pandas y flujos de trabajo de aprendizaje automático.

Descubra a los mejores mentores en ciencia de datos y AI de 2026 para dominar SQL, Pandas y flujos de trabajo de aprendizaje automático. Explore nuestra selección cuidadosamente seleccionada y altamente valorada en XIX.AI para obtener orientación poderosa que cambie completamente la situación. Compare las opciones gratuitas con las pagadas y obtenga información basada en casos reales. Desbloquee su dominio de la ciencia de datos hoy mismo.

10 herramientas

xix.ai

chatbot

Los mejores entrenadores de IA para ligar y conversar: mejora tu carisma social y tu confianza en tiempo real

Descubre los mejores cursos de 2026 sobre coqueteo y conversación con IA en XIX.AI. Nuestra selección, cuidadosamente seleccionada y con las mejores valoraciones, te ayuda a desarrollar tu carisma social y tu confianza en tiempo real. Explora herramientas imprescindibles y revolucionarias con comparativas entre versiones gratuitas y de pago, y clasificaciones que se actualizan semanalmente. Potencia hoy mismo tus habilidades sociales.

10 herramientas

xix.ai

código

Las mejores herramientas de IA para pruebas unitarias automatizadas: genera casos de prueba con Jest, PyTest y JUnit con un solo clic

Descubre las mejores herramientas de IA de 2026 para la automatización de pruebas unitarias. Nuestra selección incluye potentes soluciones revolucionarias que permiten generar casos de prueba para Jest, PyTest y JUnit al instante. Compara las opciones gratuitas con las de pago mediante pruebas reales y clasificaciones actualizadas semanalmente en XIX.AI. Aprovecha las ventajas de la IA y aumenta la productividad de tu desarrollo hoy mismo.

10 herramientas

xix.ai

comentario (20)

0/500

Inicie sesión primero

KennethMartin

27 de abril de 2026 04:00:32 GMT+02:00

Interesting read! It's wild how AI crawlers are basically the new internet pests. I've seen some devs use fake data traps or even redirect bots to weird sites 😂. But honestly, should we be worried about a future where only big companies can afford to protect their content? Feels like a digital arms race.

PaulTaylor

23 de marzo de 2026 17:00:48 GMT+01:00

¡Qué creatividad la de estos desarrolladores! 😃 Me preocupa que esta 'lucha' contra los crawlers de IA consuma tanto tiempo y energía que podría desviarlos de lo realmente importante: programar. Ojalá hubiera soluciones más estandarizadas, porque esto parece una carrera armamentística sin fin.

KennethMartin

18 de agosto de 2025 21:01:01 GMT+02:00

These AI crawlers are like uninvited guests at a party, munching on all the free code! 😅 Devs fighting back with clever traps is pure genius—love the creativity!

OliverPhillips

4 de agosto de 2025 13:00:59 GMT+02:00

Wow, open source devs are getting super creative fighting those AI crawlers! I love how they’re turning the tables with clever traps—kinda like digital pranksters. Makes me wonder how far this cat-and-mouse game will go! 😄

KennethJones

1 de agosto de 2025 08:47:41 GMT+02:00

Super interesting read! It's wild how devs are outsmarting AI crawlers with such clever tricks. Gotta love the open-source community's creativity! 😎

LucasWalker

24 de abril de 2025 05:52:46 GMT+02:00

オープンソース開発者にとってこのツールは救世主です！AIクローラーに対する反撃が面白くて、クリエイティブさと正義感がコミュニティに広がるのが好きです。もっとカスタマイズできる機能が増えるといいですね🤓

Noticias principales

AI Builder y Power Automate Revolucionan la Sumarización de Documentos Los anfitriones de AI del podcast Notebooklm ahora están disponibles para entrevistas China presenta su robot humanoide nacional y sus estándares de inteligencia incorporada Los datos de Ramp revelan un estancamiento en la adopción de la IA por parte de las empresas Guía de creación de arte con el creador de imágenes de Bing Aprende a crear música de IA usando tu voz: un tutorial de Suno paso a paso iMyFone MagicMic: Revisión y Tutorial de Cambio de Voz AI en Tiempo Real Generadores de Video AI Top de 2025: Pika Labs vs Alternativas DeepSeek V4 surge como un revolucionario sistema de IA multimodal Embodied Intelligence presenta la primera norma del sector para frenar el crecimiento descontrolado

Más

Presentado