вариант
Дом
Новости
AI Crawlers Surge Wikimedia Commons пропускная способность на 50%

AI Crawlers Surge Wikimedia Commons пропускная способность на 50%

17 апреля 2025 г.
62

AI Crawlers Surge Wikimedia Commons пропускная способность на 50%

Фонд Викимедии, родительский орган, стоящий за Википедией и многочисленные другие платформы знаний, объявленных в среду, ошеломляющее увеличение использования полосы пропускания для мультимедийных загрузок с Wikimedia Commons с января 2024 года. Этот всплеск, как подробно описано в блоге во вторник, не стремится к тому, что он вырос в во вторник, не подлежащий обучению, но скорее побывает в области моделей.

«Наша инфраструктура предназначена для того, чтобы справиться с внезапными скачками трафика от людей во время основных событий, но объем трафика от Scraper Bots не имеет себе равных и представляет растущие риски и затраты», - объясняется пост.

Wikimedia Commons служит свободно доступным центром для изображений, видео и аудиофайлов, которые доступны по открытым лицензиям или в общественном доступе.

Делуя глубже, Викимедия показала, что колоссальные 65% наиболее ресурсоемкого трафика, измеряемого типом потребляемого контента, вылетают от ботов. Тем не менее, эти боты составляют всего 35% от общего просмотра страниц. Расхождение, согласно Wikimedia, связано с тем, как часто доступ к контенту кэшируется ближе к пользователям, в то время как менее популярный контент, который часто нацелены на боты, хранится в более дорогостоящем «основном центре обработки данных».

«В то время как человеческие читатели, как правило, сосредотачиваются на конкретных, часто похожих темах, гусеницы, как правило,« читать »более крупное количество страниц и посещать менее популярные», - отметил Викимедия. «Это приводит к тому, что эти запросы будут направлены в основной центр обработки данных, что значительно увеличивает затраты на потребление наших ресурсов».

В результате команда по надежности сайта Wikimedia Foundation посвящает существенное время и ресурсы блокировке этих сканеров для предотвращения сбоев для повседневных пользователей. Это даже не затрагивает эскалационные затраты на облако, с которыми сталкивается фундамент.

Этот сценарий является частью более широкой тенденции, которая ставит под угрозу открытый интернет. Только в прошлом месяце инженер-программист и адвокат с открытым исходным кодом Drew Devault посетили, что Clawlers AI явно игнорируют файлы «robots.txt», предназначенные для сдерживания автоматического трафика. Точно так же Гергели Орош, известный как «прагматический инженер», недавно выразил свое разочарование по поводу того, как скрещивания ИИ от таких компаний, как Meta, привели к его проектам.

Хотя инфраструктура с открытым исходным кодом особенно уязвима, разработчики реагируют с изобретательностью и определением. На прошлой неделе TechCrunch подчеркнул, что некоторые технологические компании активизируются. Например, Cloudflare представил AI Labyrinth, предназначенный для замедления Crawlers с помощью AI-сгенерированного контента.

Тем не менее, он остается постоянной игрой кошек и мыши, которая может подтолкнуть многих издателей отступить за логинами и платных стенами, что в конечном итоге наносит ущерб открытой природе Интернета, на которую мы все полагаемся.

Связанная статья
Создание комиксов с помощью ИИ: Руководство для начинающих Создание комиксов с помощью ИИ: Руководство для начинающих ИИ делает создание комиксов доступным и увлекательным. Это руководство предлагает четкий, пошаговый процесс для создания уникальных комиксов для личных проектов, подарков или коммерческого использован
Рен Чжэнфэй: Будущее ИИ в Китае и долгосрочная стратегия Huawei Рен Чжэнфэй: Будущее ИИ в Китае и долгосрочная стратегия Huawei json收起自动换行复制{"content": ",[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object
Революция агентного ИИ в инвестициях превосходит Уолл-стрит в 2025 году Революция агентного ИИ в инвестициях превосходит Уолл-стрит в 2025 году На протяжении многих лет фирмы Уолл-стрит доминировали на фондовом рынке, используя превосходные ресурсы для формирования прибыли. Теперь передовые технологии, особенно искусственный интеллект, уравни
Комментарии (10)
ThomasJones
ThomasJones 17 апреля 2025 г., 0:00:00 GMT+03:00

Wikimedia Commons bandwidth usage up by 50%? 😲 That's insane! I guess all those AI crawlers are hungry for our data. It's cool that Wikimedia is keeping us posted, but man, this is gonna slow things down. Hope they find a way to handle it without messing up our experience! 🤞

RaymondGreen
RaymondGreen 18 апреля 2025 г., 0:00:00 GMT+03:00

ウィキメディア・コモンズの帯域使用量が50%増えたって?😲 信じられない!AIクローラーがデータを欲しがってるんだね。ウィキメディアが情報を共有してくれるのはいいけど、これで遅くなるのは嫌だな。ユーザー体験を壊さずに対応できるといいね!🤞

RogerSanchez
RogerSanchez 17 апреля 2025 г., 0:00:00 GMT+03:00

위키미디어 커먼즈의 대역폭 사용량이 50% 증가했다고? 😲 믿기지 않아! AI 크롤러들이 우리 데이터를 원하는 거겠지. 위키미디어가 정보를 공유해주는 건 좋지만, 이 때문에 느려지면 곤란해. 사용자 경험을 망치지 않고 해결할 방법을 찾았으면 좋겠어! 🤞

CarlTaylor
CarlTaylor 17 апреля 2025 г., 0:00:00 GMT+03:00

O uso de banda do Wikimedia Commons aumentou 50%? 😲 Isso é loucura! Acho que esses rastreadores de IA estão famintos pelos nossos dados. É legal que o Wikimedia nos mantenha informados, mas cara, isso vai atrasar tudo. Espero que eles encontrem uma maneira de lidar com isso sem estragar nossa experiência! 🤞

AlbertLee
AlbertLee 18 апреля 2025 г., 0:00:00 GMT+03:00

¿El uso de ancho de banda de Wikimedia Commons aumentó un 50%? 😲 ¡Eso es una locura! Supongo que esos rastreadores de IA están hambrientos de nuestros datos. Es genial que Wikimedia nos mantenga informados, pero hombre, esto va a ralentizar todo. Espero que encuentren una manera de manejarlo sin arruinar nuestra experiencia. 🤞

ThomasHernández
ThomasHernández 17 апреля 2025 г., 0:00:00 GMT+03:00

The surge in bandwidth demand by AI crawlers on Wikimedia Commons is insane! It's cool to see AI being used so extensively, but it's also a bit worrying. Hope they find a way to manage it without affecting the user experience too much. 🤔

Вернуться к вершине
OR