옵션
소식
AI 크롤러 서지 Wikimedia Commons 대역폭 수요 50%

AI 크롤러 서지 Wikimedia Commons 대역폭 수요 50%

2025년 4월 17일
62

AI 크롤러 서지 Wikimedia Commons 대역폭 수요 50%

Wikipedia의 부모 기관인 Wikimedia Foundation은 2024 년 1 월 이후 Wikimedia Commons의 멀티미디어 다운로드에 대한 50%의 대역폭 사용에 대한 50% 증가한 50%의 증가를 발표했습니다. 화요일에 블로그 게시물에 자세히 설명 된이 서지는 인간의 인간 모델에 대한 untick에 의해 구동되는 것은 아니지만,이 서지는 인간의 인간적 인기를 얻지 못했습니다.

“우리의 인프라는 주요 행사 중에 인간의 갑작스런 트래픽이 급증하도록 설계되었지만 스크레이퍼 봇의 트래픽 양은 타의 추종을 불허하며 위험과 비용이 증가하고 있습니다.

Wikimedia Commons는 이미지, 비디오 및 오디오 파일을위한 자유롭게 액세스 할 수있는 허브 역할을하며 모든 공개 라이센스 또는 공개 도메인에서 사용할 수 있습니다.

Wikimedia는 더 깊이 파고 들었습니다. Wikimedia는 가장 자원 집약적 인 트래픽의 65% (소비 된 컨텐츠 유형에 따라 발생하는)가 봇에서 생성되는 것으로 밝혀졌습니다. 그러나이 봇은 전체 페이지 뷰의 35%에 불과합니다. Wikimedia에 따르면 불일치는 컨텐츠에 대한 자주 액세스가 사용자에게 가까워지는 방식에서 비롯된 반면, 봇이 자주 목표로하는 덜 인기있는 콘텐츠는 더 많은 비용이 많이 드는 "핵심 데이터 센터"에 저장됩니다.

Wikimedia는“인간 독자들은 구체적이고 종종 유사한 주제에 초점을 맞추는 경향이 있지만 크롤러 봇은 더 많은 수의 페이지를 읽고 덜 인기있는 페이지를 방문하는 경향이 있습니다. "이로 인해 이러한 요청이 핵심 데이터 센터로 전달되어 자원 소비 비용이 크게 증가합니다."

결과적으로 Wikimedia Foundation의 사이트 안정성 팀은 일상적인 사용자의 혼란을 방지하기 위해 이러한 크롤러를 차단하는 데 상당한 시간과 리소스를 바치고 있습니다. 이것은 기초가 대적하는 에스컬링 클라우드 비용에 대해서도 다루지 않습니다.

이 시나리오는 개방형 인터넷을 위험에 빠뜨리는 광범위한 트렌드의 일부입니다. 지난달 소프트웨어 엔지니어이자 오픈 소스 옹호자 인 Drew Devault는 AI Crawlers가 자동 트래픽을 방해하기위한 "robots.txt"파일을 무시하고 있다고 애도했습니다. 마찬가지로, "실용적인 엔지니어"로 알려진 Gergely Orosz는 최근 Meta와 같은 회사의 AI 스크레이퍼가 그의 프로젝트에 대한 대역폭 요구를 어떻게 급증했는지에 대한 좌절감을 표명했습니다.

오픈 소스 인프라는 특히 취약하지만 개발자는 독창성과 결단력으로 대응하고 있습니다. TechCrunch는 지난주에 일부 기술 회사가 강화되고 있다고 강조했습니다. 예를 들어, CloudFlare는 AI 생성 컨텐츠로 크롤러 속도를 늦추도록 설계된 AI Labyrinth를 소개했습니다.

그러나 그것은 고양이와 마우스의 끊임없는 게임으로 남아 있는데,이 게임은 많은 출판사들이 로그인과 페이 월 뒤에서 후퇴하도록 밀어내어 궁극적으로 우리 모두가 의존하는 웹의 열린 특성에 해를 끼칠 수 있습니다.

관련 기사
렌정페이: 중국의 AI 미래와 화웨이의 장기 전략 렌정페이: 중국의 AI 미래와 화웨이의 장기 전략 json收起自动换行复制{"content": ",[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object
에이전틱 AI가 2025년에 월스트리트를 능가하며 투자를 혁신하다 에이전틱 AI가 2025년에 월스트리트를 능가하며 투자를 혁신하다 수년간 월스트리트 기업들은 우수한 자원을 활용해 주식 시장을 지배하며 수익을 창출해 왔습니다. 이제 최첨단 기술, 특히 인공지능(AI)이 균형을 맞추고 있습니다. 에이전틱 AI는 개인 투자자들이 더 날카로운 데이터 기반 선택을 할 수 있도록 하여, 2025년에 월스트리트를 능가할 가능성을 제공합니다. 이 기사는 에이전틱 AI가 투자를 어떻게 변화시키는지 탐
Perplexity가 지난 달 7억 8천만 건의 쿼리를 처리했다고 CEO가 밝혔다 Perplexity가 지난 달 7억 8천만 건의 쿼리를 처리했다고 CEO가 밝혔다 json收起自动换行复制{"content": ",[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],,[object Object],— Aravind Srinivas (@AravSrin
의견 (10)
0/200
ThomasJones
ThomasJones 2025년 4월 17일 오전 12시 0분 0초 GMT+09:00

Wikimedia Commons bandwidth usage up by 50%? 😲 That's insane! I guess all those AI crawlers are hungry for our data. It's cool that Wikimedia is keeping us posted, but man, this is gonna slow things down. Hope they find a way to handle it without messing up our experience! 🤞

RaymondGreen
RaymondGreen 2025년 4월 18일 오전 12시 0분 0초 GMT+09:00

ウィキメディア・コモンズの帯域使用量が50%増えたって?😲 信じられない!AIクローラーがデータを欲しがってるんだね。ウィキメディアが情報を共有してくれるのはいいけど、これで遅くなるのは嫌だな。ユーザー体験を壊さずに対応できるといいね!🤞

RogerSanchez
RogerSanchez 2025년 4월 17일 오전 12시 0분 0초 GMT+09:00

위키미디어 커먼즈의 대역폭 사용량이 50% 증가했다고? 😲 믿기지 않아! AI 크롤러들이 우리 데이터를 원하는 거겠지. 위키미디어가 정보를 공유해주는 건 좋지만, 이 때문에 느려지면 곤란해. 사용자 경험을 망치지 않고 해결할 방법을 찾았으면 좋겠어! 🤞

CarlTaylor
CarlTaylor 2025년 4월 17일 오전 12시 0분 0초 GMT+09:00

O uso de banda do Wikimedia Commons aumentou 50%? 😲 Isso é loucura! Acho que esses rastreadores de IA estão famintos pelos nossos dados. É legal que o Wikimedia nos mantenha informados, mas cara, isso vai atrasar tudo. Espero que eles encontrem uma maneira de lidar com isso sem estragar nossa experiência! 🤞

AlbertLee
AlbertLee 2025년 4월 18일 오전 12시 0분 0초 GMT+09:00

¿El uso de ancho de banda de Wikimedia Commons aumentó un 50%? 😲 ¡Eso es una locura! Supongo que esos rastreadores de IA están hambrientos de nuestros datos. Es genial que Wikimedia nos mantenga informados, pero hombre, esto va a ralentizar todo. Espero que encuentren una manera de manejarlo sin arruinar nuestra experiencia. 🤞

ThomasHernández
ThomasHernández 2025년 4월 17일 오전 12시 0분 0초 GMT+09:00

The surge in bandwidth demand by AI crawlers on Wikimedia Commons is insane! It's cool to see AI being used so extensively, but it's also a bit worrying. Hope they find a way to manage it without affecting the user experience too much. 🤔

위로 돌아갑니다
OR