選項
首頁
新聞
AI爬行者湧現Wikimedia Commons帶寬需求50%

AI爬行者湧現Wikimedia Commons帶寬需求50%

2025-04-17
121

AI爬行者湧現Wikimedia Commons帶寬需求50%

維基媒體基金會,維基百科及眾多其他群眾外包知識平台的母體,於週三宣布,自2024年1月起,來自維基共享資源的多媒體下載頻寬使用量驚人地增長了50%。根據週二的一篇博客文章詳細說明,這一激增並非由於人類好奇心的增加,而是由於自動化爬蟲對數據的渴求,用於訓練AI模型。

“我們的基礎設施設計用於處理重大事件期間來自人類的突發流量激增,但來自爬蟲機器人的流量量無與倫比,且帶來日益增加的風險和成本,”該文章解釋道。

維基共享資源作為一個可自由訪問的圖像、視頻和音頻文件中心,所有內容均以開放許可證或公共領域形式提供。

深入探究,維基媒體透露,資源消耗最嚴重的流量中有高達65%來自機器人,這是以內容消耗類型衡量的。然而,這些機器人僅佔總頁面瀏覽量的35%。維基媒體表示,這一差異源於經常訪問的內容會被緩存在靠近用戶的地方,而機器人經常針對的較不受歡迎的內容則儲存在成本更高的“核心數據中心”。

“人類讀者傾向於專注於特定的、通常相似的話題,而爬蟲機器人則傾向於‘批量閱讀’更多頁面,並訪問較不受歡迎的頁面,”維基媒體指出。“這導致這些請求被轉發到核心數據中心,顯著增加了我們的資源消耗成本。”

因此,維基媒體基金會的網站可靠性團隊正在投入大量時間和資源來阻止這些爬蟲,以防止對日常用戶的干擾。這還未觸及基金會正應對的不斷上升的雲端成本。

這種情況是威脅開放互聯網的更廣泛趨勢的一部分。就在上個月,軟件工程師兼開源倡導者Drew DeVault哀嘆,AI爬蟲公然無視旨在阻止自動流量的“robots.txt”文件。同樣,被稱為“務實工程師”的Gergely Orosz最近也表達了他對來自Meta等公司的AI爬蟲如何使其項目頻寬需求激增的不滿。

雖然開源基礎設施尤其脆弱,但開發者們正以創造力和決心應對。TechCrunch上週報導,一些科技公司正在加緊行動。例如,Cloudflare推出了AI Labyrinth,旨在通過AI生成的內容減緩爬蟲速度。

然而,這仍然是一場持續的貓鼠遊戲,可能會迫使許多出版商退回到登錄和付費牆後,最終損害我們都依賴的網絡的開放性質。

相關文章
使用 PicLumen 釋放創意:免費 AI 圖片產生指南 使用 PicLumen 釋放創意:免費 AI 圖片產生指南 有了 AI 驅動的圖像製作工具,製作令人驚豔的視覺效果現在變得毫不費力。本教學探討 PicLumen,一個免費提供無限、高品質圖片製作的特殊平台。PicLumen 是藝術家、行銷人員或任何渴望運用 AI 藝術的人的理想選擇,它提供直覺的體驗與非凡的成果。讓我們點燃您的想像力!重點介紹PicLumen 提供免費的 AI 圖像產生功能。創造動漫、寫實、線條藝術和創意等多樣風格的視覺效果。使用 Goog
AI Powered University Scheduling:簡化學術時間表 AI Powered University Scheduling:簡化學術時間表 在現今多變的學術環境中,有效的時間安排對成功至關重要。專為 King Abdulaziz University 設計的 AI Schedule Maker 可將大學時間表自動化,解決課程重疊和行政效率低等問題。透過提供量身打造、無衝突的時間表,可提升學生和教師的體驗。重點介紹傳統的大學排程系統經常面臨時間表重疊和行政負荷過重的問題。AI Schedule Maker 可透過分析學生與教師的
Ai-Kon 2012:慶祝 Cosplay 創意與社群 Ai-Kon 2012:慶祝 Cosplay 創意與社群 Ai-Kon 是加拿大首屈一指的動漫展會,長久以來都是 Cosplay 愛好者的聚集地。本文重溫 2012 年的 Ai-Kon,強調讓人難忘的創意、工藝和充滿活力的社群。探索令人驚豔的服飾和動漫迷的熱情!重點介紹體驗 Ai-Kon 2012 cosplay 展示會的精彩片段。探索各式各樣的角色與服裝設計。欣賞傑出 Cosplay 背後的藝術與技巧。感受動漫展會的團結與熱情。了解對動漫
評論 (14)
0/200
KevinBrown
KevinBrown 2025-08-23 23:01:15

Incroyable, 50% d'augmentation de bande passante pour Wikimedia Commons ! Ça montre à quel point l'IA aspire tout sur son passage, non ? 😅 J’espère juste que ça ne va pas surcharger les serveurs ou freiner l’accès pour les utilisateurs classiques.

CharlesWhite
CharlesWhite 2025-08-13 21:00:59

Whoa, a 50% spike in Wikimedia Commons bandwidth? AI crawlers are eating up data like it’s an all-you-can-eat buffet! 😄 Makes me wonder how much of this is legit research vs. bots just hoarding images for some shady AI training. Anyone else curious about what’s driving this?

SamuelClark
SamuelClark 2025-07-31 19:35:39

Wow, a 50% spike in bandwidth for Wikimedia Commons? That’s wild! AI crawlers are probably gobbling up all those images for training. Kinda cool but also makes me wonder if this is pushing the limits of what open platforms can handle. 😅

KennethJohnson
KennethJohnson 2025-07-31 09:42:05

Wow, a 50% spike in bandwidth for Wikimedia Commons? That’s wild! AI crawlers are probably gobbling up all those images for training. Makes me wonder how much data these AI models are chugging through daily. 😳 Cool to see open knowledge fueling innovation, though!

WillieAnderson
WillieAnderson 2025-04-18 14:23:40

Wikimedia Commons에서 AI 크롤러로 인한 대역폭 수요 증가는 미쳤어요! AI가 이렇게 널리 사용되는 건 멋지지만, 조금 걱정되기도 해요. 사용자 경험에 큰 영향을 주지 않으면서 이를 관리할 방법을 찾았으면 좋겠어요. 🤔

RaymondGreen
RaymondGreen 2025-04-18 14:01:01

ウィキメディア・コモンズの帯域使用量が50%増えたって?😲 信じられない!AIクローラーがデータを欲しがってるんだね。ウィキメディアが情報を共有してくれるのはいいけど、これで遅くなるのは嫌だな。ユーザー体験を壊さずに対応できるといいね!🤞

回到頂部
OR