Option
Heim
Nachricht
Open Source -Entwickler bekämpfen KI -Crawler mit Einfallsreichtum und Vergeltung

Open Source -Entwickler bekämpfen KI -Crawler mit Einfallsreichtum und Vergeltung

17. April 2025
150

KI-Web-Crawling-Bots sind laut vielen Softwareentwicklern zum Fluch des Internets geworden. Als Reaktion darauf haben sich einige Entwickler dazu gebracht, sich mit kreativen und oft amüsanten Strategien zu wehren.

Open Source -Entwickler werden von diesen Schurken -Bots besonders hart getroffen, wie von Niccolò Venerandi, dem Entwickler hinter dem Linux -Desktop -Plasma und den Blog -Librenews, festgestellt. Foss -Websites, auf denen kostenlose und Open -Source -Projekte stattfinden, enthüllen mehr ihrer Infrastruktur und verfügen im Allgemeinen weniger Ressourcen als kommerzielle Standorte.

Das Problem wird verschärft, da viele AI -Bots die Robot.txt -Datei des Roboter -Ausschlussprotokolls ignorieren, die Bots über das nicht kriechen soll.

In einem ergreifenden Blog -Beitrag im Januar teilte der FOSS -Entwickler XE IASO eine belastende Erfahrung mit Amazonbot mit, die eine Git -Server -Website bombardierte und DDOS -Ausfälle verursachte. Git -Server sind entscheidend für das Hosting von FOSS -Projekten und ermöglichen es jedem, den Code herunterzuladen und beizutragen.

IASO wies darauf hin, dass der Bot die Robot.txt -Datei ignorierte, verschiedene IP -Adressen verwendete und sich sogar als andere Benutzer tarnierte. "Es ist zwecklos, KI -Crawler -Bots zu blockieren, weil sie lügen, ihren Benutzeragenten ändern, IP -Adressen für Wohngebäude als Proxys verwenden und mehr", beklagte Iaso.

"Sie werden Ihre Website kratzen, bis sie umfällt, und dann werden sie mehr kratzen. Sie klicken auf jeden Link auf jedem Link auf jedem Link und sehen sich immer und immer wieder dieselben Seiten an. Einige von ihnen klicken sogar in derselben Sekunde sogar mehrmals auf denselben Link", schrieb der Entwickler.

Betreten Sie den Gott der Gräber

Um dies zu bekämpfen, entwickelte IASO ein cleveres Werkzeug namens Anubis. Es fungiert als Reverse-Proxy, für den eine Prüfung der Arbeit erforderlich ist, bevor Anforderungen zum Erreichen des Git-Servers ermöglicht werden. Dies blockiert Bots effektiv und ermöglicht es, durch Menschen betriebene Browser durchzugehen.

Der Name des Werkzeugs, Anubis, stammt aus der ägyptischen Mythologie, wo Anubis der Gott ist, der die Toten zum Gericht führt. "Anubis wog deine Seele (Herz) und wenn es schwerer war als eine Feder, wurde dein Herz gegessen und du starb wie Mega", erklärte Iaso TechCrunch. Das erfolgreiche Bestehen der Herausforderung wird mit einem niedlichen Anime -Bild von Anubis gefeiert, während Bot -Anfragen abgelehnt werden.

Das Projekt, das am 19. März auf Github geteilt wurde, erlangte schnell an Traktion und sammelte in wenigen Tagen 2.000 Sterne, 20 Mitwirkende und 39 Gabeln.

Rache als Verteidigung

Die weit verbreitete Einführung von Anubis weist darauf hin, dass die Kämpfe von IASO alles andere als isoliert sind. Venerandi erzählte zahlreiche ähnliche Erfahrungen:

  • Drew Devault, Gründer und CEO von SourceHut, verbringt einen erheblichen Teil seiner Zeit mit aggressiven LLM -Crawler und litt in häufigen Ausfällen.
  • Jonathan Corbet, ein prominenter Foss -Entwickler und Betreiber von LWN, hat gesehen, wie sein Standort durch KI -Schaberbots verlangsamt wurde.
  • Kevin Fenzi, Sysadmin für das Linux Fedora -Projekt, musste aufgrund der aggressiven AI -Bot -Aktivität den gesamten Verkehr aus Brasilien blockieren.

Venerandi erwähnte TechCrunch, dass er von anderen Projekten kenne, die auf extreme Maßnahmen zurückgreifen mussten, z. B. das Verbot aller chinesischen IP -Adressen.

Einige Entwickler glauben, dass es die beste Verteidigung ist, sich mit Rache zu wehren. Ein Benutzer namens XYZAL in Hacker News schlug vor, Roboter zu füllen.

"Denken Sie, wir müssen darauf abzielen, dass die Bots den Nutzwert von _negative_ vom Besuch unserer Fallen und nicht nur von Null erhalten", erklärte Xyzal.

Im Januar veröffentlichte ein anonymer Entwickler namens "Aaron" Nepenthes, ein Tool, das Crawler in einem Labyrinth gefälschter Inhalte fangen soll, von dem der Schöpfer in ARS Technica aggressiv, wenn nicht sogar unglaublich bösartig war. Nepenthes wurde nach einer fleischfressenden Anlage benannt und zielt darauf ab, die Ressourcen von Fehlbotten zu verwirren und zu verschwenden.

In ähnlicher Weise hat CloudFlare kürzlich AI Labyrinth gestartet, um die Ressourcen von KI -Crawlern zu verlangsamen, zu verwirren und zu verschwenden, die "No Crawl" -Richtlinien ignorieren. Das Tool füttert diese Bots irrelevante Inhalte, um legitime Website -Daten zu schützen.

Devault aus SourceHut sagte TechCrunch, dass Nepenthes zwar ein Gefühl der Gerechtigkeit bietet, indem er den Crawlern Unsinn ernährt, Anubis jedoch als effektivere Lösung für seine Website erwiesen hat. Er machte jedoch auch einen herzlichen Einspruch für eine direktere Lösung: "Bitte hören Sie auf, LLMs oder KI -Bildgeneratoren oder Github -Copilot oder einen dieser Müll zu legitimieren. Ich bittet Sie, aufzuhören, sie nicht mehr zu verwenden, nicht mehr über sie zu sprechen, aufzuhören, neue zu machen, einfach aufzuhören."

Angesichts der Unwahrscheinlichkeit, dass dies geschieht, kämpfen Entwickler, insbesondere in der Foss -Community, weiterhin mit Einfallsreichtum und einem Schuss Humor.

Verwandter Artikel
KI-Comics: Erforschung der Spitze der Kreativität KI-Comics: Erforschung der Spitze der Kreativität Die Comic-Industrie erlebt einen tiefgreifenden Wandel durch die Integration von künstlicher Intelligenz. Vorbei sind die Zeiten, in denen KI nur ein ferner Traum war; sie ist nun ein praktisches Werk
Viggle AI: Revolutionierung der Video-VFX mit AI-Bewegungsmischung Viggle AI: Revolutionierung der Video-VFX mit AI-Bewegungsmischung Revolutionierung von Videoeffekten mit Viggle AIViggle AI verändert die Welt der Videoeffekte und macht modernste visuelle Kreationen zugänglicher denn je. Vorbei sind die Zeiten komplexer Setups und
Print on Demand mit KI-Kunst: Eine Schritt-für-Schritt-Anleitung für Etsy Print on Demand mit KI-Kunst: Eine Schritt-für-Schritt-Anleitung für Etsy Überlegst du, in den E-Commerce einzusteigen, aber graust es dir vor der Lagerverwaltung oder dem Erstellen eigener Produkte? Print on Demand (POD) kombiniert mit KI-Kunstgenerierung könnte dein Weg z
Kommentare (15)
0/200
TerryGonzález
TerryGonzález 18. April 2025 00:00:00 GMT

This tool is a lifesaver for open source devs! It's hilarious how it fights back against those annoying AI crawlers. I love the creativity and the sense of justice it brings to the community. Maybe add more ways to customize the retaliation? 🤓

LucasWalker
LucasWalker 24. April 2025 00:00:00 GMT

オープンソース開発者にとってこのツールは救世主です!AIクローラーに対する反撃が面白くて、クリエイティブさと正義感がコミュニティに広がるのが好きです。もっとカスタマイズできる機能が増えるといいですね🤓

RogerPerez
RogerPerez 18. April 2025 00:00:00 GMT

오픈 소스 개발자들에게 이 도구는 구세주예요! AI 크롤러에 대한 반격이 재미있고, 창의성과 정의감이 커뮤니티에 퍼지는 게 좋습니다. 커스터마이즈할 수 있는 기능이 더 늘어나면 좋겠어요🤓

HenryTurner
HenryTurner 21. April 2025 00:00:00 GMT

Este ferramenta é um salva-vidas para desenvolvedores de código aberto! É hilário como ela luta contra esses irritantes rastreadores de AI. Adoro a criatividade e o senso de justiça que traz para a comunidade. Talvez adicionar mais maneiras de personalizar a retaliação? 🤓

MarkRoberts
MarkRoberts 23. April 2025 00:00:00 GMT

¡Esta herramienta es un salvavidas para los desarrolladores de código abierto! Es hilarante cómo lucha contra esos molestos rastreadores de IA. Me encanta la creatividad y el sentido de justicia que trae a la comunidad. ¿Quizás añadir más formas de personalizar la retaliación? 🤓

FredGreen
FredGreen 17. April 2025 00:00:00 GMT

This tool is a lifesaver for open source devs! It's hilarious how they're fighting back against those pesky AI crawlers. The creativity and retribution are top-notch, though sometimes the solutions can be a bit too complex for newbies. Still, it's a must-have for anyone in the field! 😂

Zurück nach oben
OR