Разработчики с открытым исходным кодом сражаются с ИИ с изобретательностью и возмездием

Дом

Новости

17 апреля 2025 г.

KennethKing

199

# AI bot

Боты для веб-сканирования, работающие на основе ИИ, стали настоящим бичом интернета, по мнению многих разработчиков программного обеспечения. В ответ некоторые разработчики начали бороться с ними, применяя креативные и зачастую забавные стратегии.

Разработчики открытого программного обеспечения особенно сильно страдают от этих неподконтрольных ботов, как отметил Никколо Венеранди, разработчик рабочего стола Linux Plasma и блога LibreNews. Сайты FOSS, на которых размещаются бесплатные проекты с открытым исходным кодом, раскрывают больше своей инфраструктуры и, как правило, имеют меньше ресурсов, чем коммерческие сайты.

Проблема усугубляется тем, что многие ИИ-боты игнорируют файл robot.txt протокола исключения для роботов, который должен указывать ботам, что не следует сканировать.

В трогательном посте в блоге в январе разработчик FOSS Ксе Иасо поделился неприятным опытом с AmazonBot, который атаковал веб-сайт Git-сервера, вызывая сбои из-за DDoS-атак. Git-серверы имеют решающее значение для размещения проектов FOSS, позволяя любому загружать и вносить вклад в код.

Иасо указал, что бот игнорировал файл robot.txt, использовал разные IP-адреса и даже маскировался под других пользователей. «Блокировать ИИ-ботов бесполезно, потому что они лгут, меняют свои пользовательские агенты, используют резидентные IP-адреса в качестве прокси и делают многое другое», — посетовал Иасо.

«Они будут сканировать ваш сайт, пока он не упадёт, а затем продолжат сканировать ещё больше. Они будут переходить по каждой ссылке на каждой ссылке на каждой ссылке, просматривая одни и те же страницы снова и снова. Некоторые из них даже будут кликать по одной и той же ссылке несколько раз в одну секунду», — написал разработчик.

Появление Бога могил

Для борьбы с этим Иасо разработал умный инструмент под названием Anubis. Он действует как обратный прокси, требующий проверки proof-of-work перед тем, как разрешить запросам достичь Git-сервера. Это эффективно блокирует ботов, позволяя браузерам, управляемым людьми, проходить проверку.

Название инструмента, Anubis, заимствовано из египетской мифологии, где Анубис — бог, который ведёт мёртвых к суду. «Анубис взвешивал вашу душу (сердце), и если она была тяжелее пера, ваше сердце пожиралось, и вы, как бы, мега-умирали», — объяснил Иасо в интервью TechCrunch. Успешное прохождение проверки отмечается милой аниме-картинкой Анубиса, в то время как запросы ботов отклоняются.

Проект, размещённый на GitHub 19 марта, быстро набрал популярность, собрав 2000 звёзд, 20 участников и 39 форков всего за несколько дней.

Месть как защита

Широкое распространение Anubis указывает на то, что проблемы Иасо далеко не единичны. Венеранди рассказал о множестве подобных случаев:

Дрю ДеВолт, основатель и генеральный директор SourceHut, тратит значительную часть своего времени на борьбу с агрессивными краулерами LLM и сталкивается с частыми сбоями.
Джонатан Корбет, известный разработчик FOSS и оператор LWN, заметил замедление работы своего сайта из-за ботов-скрейперов ИИ.
Кевин Фензи, системный администратор проекта Linux Fedora, был вынужден заблокировать весь трафик из Бразилии из-за агрессивной активности ИИ-ботов.

Венеранди упомянул в беседе с TechCrunch, что ему известно о других проектах, которым пришлось прибегнуть к крайним мерам, таким как блокировка всех китайских IP-адресов.

Некоторые разработчики считают, что месть — лучшая защита. Пользователь под ником xyzal на Hacker News предложил заполнять запрещённые файлом robot.txt страницы вводящим в заблуждение контентом о пользе употребления отбеливателя или положительном влиянии кори на интимную жизнь.

«Нам нужно стремиться к тому, чтобы боты получали _отрицательную_ полезность от посещения наших ловушек, а не просто нулевую», — объяснил xyzal.

В январе анонимный разработчик по имени «Аарон» выпустил Nepenthes, инструмент, предназначенный для заманивания краулеров в лабиринт фальшивого контента, что, как признался создатель в интервью Ars Technica, было агрессивным, если не откровенно злонамеренным. Названный в честь хищного растения, Nepenthes стремится запутать и истощить ресурсы непослушных ботов.

Аналогично, Cloudflare недавно запустила AI Labyrinth, предназначенный для замедления, запутывания и траты ресурсов ИИ-краулеров, игнорирующих директивы «не сканировать». Инструмент подает этим ботам нерелевантный контент, чтобы защитить законные данные веб-сайта.

ДеВолт из SourceHut рассказал TechCrunch, что, хотя Nepenthes даёт чувство справедливости, подавая бессмыслицу краулерам, Anubis оказался более эффективным решением для его сайта. Однако он также сделал искреннюю просьбу о более прямом решении: «Пожалуйста, перестаньте легитимизировать LLM, генераторы изображений ИИ, GitHub Copilot или любую другую ерунду. Я умоляю вас перестать использовать их, говорить о них, создавать новые, просто остановитесь».

Учитывая маловероятность этого, разработчики, особенно в сообществе FOSS, продолжают бороться с изобретательностью и долей юмора.

Связанная статья

"Графический ИИ преобразует бизнес-аналитику с помощью графиков знаний" Ключевые моментыГрафовый ИИ использует графы знаний для выявления скрытых связей в сложных массивах данных.Графы знаний визуализируют информацию в виде взаимосвязанных узлов и отношений.Выявление нере

Minecraft Villager AI переосмысливает музыку с помощью уникальной звуковой обложки Ландшафт музыкального производства продолжает трансформироваться, поскольку технологии искусственного интеллекта расширяют творческие границы неожиданными способами. Одна из особенно интересных разраб

Midjourney представляет передовой видеогенератор с искусственным интеллектом для креативного контента Прорыв Midjourney в создании видео с помощью искусственного интеллектаКомпания Midjourney представила свой первый инструмент для создания видео на основе искусственного интеллекта, что знаменует собой

Комментарии (18)

0/200

Представлять на рассмотрение

KennethMartin

18 августа 2025 г., 22:01:01 GMT+03:00

These AI crawlers are like uninvited guests at a party, munching on all the free code! 😅 Devs fighting back with clever traps is pure genius—love the creativity!

OliverPhillips

4 августа 2025 г., 14:00:59 GMT+03:00

Wow, open source devs are getting super creative fighting those AI crawlers! I love how they’re turning the tables with clever traps—kinda like digital pranksters. Makes me wonder how far this cat-and-mouse game will go! 😄

KennethJones

1 августа 2025 г., 9:47:41 GMT+03:00

Super interesting read! It's wild how devs are outsmarting AI crawlers with such clever tricks. Gotta love the open-source community's creativity! 😎

LucasWalker

24 апреля 2025 г., 6:52:46 GMT+03:00

オープンソース開発者にとってこのツールは救世主です！AIクローラーに対する反撃が面白くて、クリエイティブさと正義感がコミュニティに広がるのが好きです。もっとカスタマイズできる機能が増えるといいですね🤓

MarkRoberts

22 апреля 2025 г., 22:57:03 GMT+03:00

¡Esta herramienta es un salvavidas para los desarrolladores de código abierto! Es hilarante cómo lucha contra esos molestos rastreadores de IA. Me encanta la creatividad y el sentido de justicia que trae a la comunidad. ¿Quizás añadir más formas de personalizar la retaliación? 🤓

HenryTurner

20 апреля 2025 г., 22:08:40 GMT+03:00

Este ferramenta é um salva-vidas para desenvolvedores de código aberto! É hilário como ela luta contra esses irritantes rastreadores de AI. Adoro a criatividade e o senso de justiça que traz para a comunidade. Talvez adicionar mais maneiras de personalizar a retaliação? 🤓

Лучшие новости

Gemini 2.5 Pro в настоящее время неограничен и дешевле, чем Claude, GPT-4O Топовые генераторы видео на AI в 2025: Pika Labs по сравнению с альтернативами Озвучка с помощью ИИ: Ультимативное руководство по созданию реалистичных голосов ИИ ИИ Cambium превращает отходы в пиломатериалы OpenAI улучшает AI Voice Assistant для лучших чатов Как гарантировать, что ваши данные заслуживают доверия для интеграции искусственного интеллекта NoteBooklm расширяется во всем мире, добавляет слайды и расширенную проверку фактов Настройки для дата -центров США могут разблокировать 76 ГВт новой мощности. Google использует ИИ для приостановки более 39 миллионов счетов объявлений о подозрении на мошенничество Клонирование голоса с ИИ: Полное руководство по освоению конверсии голоса

Более

Показан