option
Maison
Nouvelles
Les développeurs open source combattent des robats Crawlers avec de l'ingéniosité et des représailles

Les développeurs open source combattent des robats Crawlers avec de l'ingéniosité et des représailles

17 avril 2025
150

Selon de nombreux développeurs de logiciels. En réponse, certains développeurs ont pris la lutte contre les stratégies créatives et souvent amusantes.

Les développeurs open source sont particulièrement touchés par ces robots voyous, comme indiqué par Niccolò Venerandi, le développeur derrière le plasma de bureau Linux et le blog Liberews. Les sites FOSS, qui hébergent des projets gratuits et open source, exposent plus de leur infrastructure et ont généralement moins de ressources que les sites commerciaux.

Le problème est exacerbé car de nombreux bots AI ignorent le fichier robot.txt du protocole d'exclusion des robots, qui est destiné à instruire les robots sur ce qui ne rampe pas.

Dans un article de blog poignant en janvier, le développeur FOSS XE IASO a partagé une expérience pénible avec Amazonbot, qui a bombardé un site Web de serveur GIT, provoquant des pannes DDOS. Les serveurs GIT sont cruciaux pour héberger des projets FOSS, permettant à n'importe qui de télécharger et de contribuer au code.

IASO a souligné que le bot avait ignoré le fichier robot.txt, utilisé différentes adresses IP et même masquée comme autres utilisateurs. "Il est vain de bloquer les robots de robottes AI parce qu'ils mentent, changent leur agent utilisateur, utilisent les adresses IP résidentielles comme proxys, et plus encore", a déploré IASO.

"Ils gratteront votre site jusqu'à ce qu'il tombe, puis ils le gratteront un peu plus. Ils cliqueront sur chaque lien de chaque lien de chaque lien, affichant les mêmes pages encore et encore et encore.

Entrez le dieu des tombes

Pour lutter contre cela, IASO a développé un outil intelligent appelé Anubis. Il agit comme un proxy inversé qui nécessite une vérification de preuve de travail avant d'autoriser les demandes à atteindre le serveur GIT. Cela bloque efficacement les robots tout en permettant aux navigateurs à parts humains de passer.

Le nom de l'outil, Anubis, s'appuie sur la mythologie égyptienne, où Anubis est le Dieu qui mène les morts au jugement. "Anubis a pesé votre âme (cœur) et si elle était plus lourde qu'une plume, votre cœur a été mangé et vous, comme, Mega est mort", a expliqué Iaso à TechCrunch. Passer avec succès le défi est célébré avec une jolie photo d'anime d'Anubis, tandis que les demandes de bot sont refusées.

Le projet, partagé sur Github le 19 mars, a rapidement gagné du terrain, amassant 2 000 étoiles, 20 contributeurs et 39 fourchettes en quelques jours seulement.

Vengeance comme défense

L'adoption généralisée d'Anubis indique que les difficultés de l'IASO sont loin d'être isolées. Venerandi a raconté de nombreuses expériences similaires:

  • Drew DeVault, fondateur et PDG de Sourcehut, passe une partie importante de son temps à traiter avec des robots agressifs de LLM et souffre de pannes fréquentes.
  • Jonathan Corbet, un éminent développeur FOSS et opérateur de LWN, a vu son site ralenti par les robots de gratte-parole AI.
  • Kevin Fenzi, Sysadmin pour le projet Linux Fedora, a dû bloquer tout le trafic du Brésil en raison de l'activité agressive des bots AI.

Venerandi a mentionné à TechCrunch qu'il connaissait d'autres projets qui ont dû recourir à des mesures extrêmes, comme l'interdiction de toutes les adresses IP chinoises.

Certains développeurs croient que la lutte contre la vengeance est la meilleure défense. Un utilisateur nommé Xyzal sur Hacker News a suggéré de remplir Robot.txt Pages interdites avec un contenu trompeur sur les avantages de la consommation d'eau blanche ou les effets positifs de la rougeole sur les performances des chambres.

"Pensez que nous devons viser les bots pour obtenir la valeur d'utilité _negative_ en visitant nos pièges, pas seulement à une valeur nulle", a expliqué Xyzal.

En janvier, un développeur anonyme nommé "Aaron" a publié Nepenthes, un outil conçu pour piéger des robots de robinets dans un dédale de faux contenu, que le Créateur a admis à ARS Technica était agressif, sinon malveillant. Nommé d'après une usine carnivore, Nepenthes vise à confondre et à gaspiller les ressources des bots mal comportementaux.

De même, CloudFlare a récemment lancé AI Labyrinth, destiné à ralentir, confondre et gaspiller les ressources des robots de vitesses qui ignorent les directives "sans crawl". L'outil alimente ces robots un contenu non pertinent pour protéger les données de site Web légitimes.

Devault de Sourcehut a déclaré à TechCrunch que, bien que Nepenthes offre un sentiment de justice en nourrissant des absurdités aux Crawlers, Anubis s'est avéré être la solution la plus efficace pour son site. Cependant, il a également fait un plaidoyer sincère pour une solution plus directe: "Veuillez arrêter de légitimer LLMS ou Générateurs d'images ou Github Copilot ou l'un de ces ordures. Je vous supplie d'arrêter de les utiliser, d'arrêter d'en parler, d'arrêter d'en faire de nouveaux, arrêtez-vous."

Compte tenu de la moindre mobilisation que cela se produise, les développeurs, en particulier dans la communauté FOSS, continuent de riposter avec l'ingéniosité et un soupçon d'humour.

Article connexe
Bandes dessinées IA : Explorer l'avant-garde de la création Bandes dessinées IA : Explorer l'avant-garde de la création L'industrie de la bande dessinée connaît une transformation majeure grâce à l'intégration de l'intelligence artificielle. Fini le temps où l'IA n'était qu'un rêve lointain ; elle est désormais un outi
Viggle AI : Révolutionner les effets vidéo avec le mélange de mouvements AI Viggle AI : Révolutionner les effets vidéo avec le mélange de mouvements AI Révolutionner les effets vidéo avec Viggle AIViggle AI redéfinit le monde des effets vidéo, rendant les créations visuelles de pointe plus accessibles que jamais. Fini le temps des configurations comp
Impression à la demande avec l'art IA : Guide étape par étape pour Etsy Impression à la demande avec l'art IA : Guide étape par étape pour Etsy Vous envisagez de vous lancer dans le commerce électronique mais redoutez la gestion des stocks ou la création de produits ? L'impression à la demande (POD) combinée à la génération d'art par IA pourr
commentaires (15)
0/200
TerryGonzález
TerryGonzález 18 avril 2025 00:00:00 UTC

This tool is a lifesaver for open source devs! It's hilarious how it fights back against those annoying AI crawlers. I love the creativity and the sense of justice it brings to the community. Maybe add more ways to customize the retaliation? 🤓

LucasWalker
LucasWalker 24 avril 2025 00:00:00 UTC

オープンソース開発者にとってこのツールは救世主です!AIクローラーに対する反撃が面白くて、クリエイティブさと正義感がコミュニティに広がるのが好きです。もっとカスタマイズできる機能が増えるといいですね🤓

RogerPerez
RogerPerez 18 avril 2025 00:00:00 UTC

오픈 소스 개발자들에게 이 도구는 구세주예요! AI 크롤러에 대한 반격이 재미있고, 창의성과 정의감이 커뮤니티에 퍼지는 게 좋습니다. 커스터마이즈할 수 있는 기능이 더 늘어나면 좋겠어요🤓

HenryTurner
HenryTurner 21 avril 2025 00:00:00 UTC

Este ferramenta é um salva-vidas para desenvolvedores de código aberto! É hilário como ela luta contra esses irritantes rastreadores de AI. Adoro a criatividade e o senso de justiça que traz para a comunidade. Talvez adicionar mais maneiras de personalizar a retaliação? 🤓

MarkRoberts
MarkRoberts 23 avril 2025 00:00:00 UTC

¡Esta herramienta es un salvavidas para los desarrolladores de código abierto! Es hilarante cómo lucha contra esos molestos rastreadores de IA. Me encanta la creatividad y el sentido de justicia que trae a la comunidad. ¿Quizás añadir más formas de personalizar la retaliación? 🤓

FredGreen
FredGreen 17 avril 2025 00:00:00 UTC

This tool is a lifesaver for open source devs! It's hilarious how they're fighting back against those pesky AI crawlers. The creativity and retribution are top-notch, though sometimes the solutions can be a bit too complex for newbies. Still, it's a must-have for anyone in the field! 😂

Retour en haut
OR