選項
首頁
新聞
AI爬行者湧現Wikimedia Commons帶寬需求50%

AI爬行者湧現Wikimedia Commons帶寬需求50%

2025-04-17
121

AI爬行者湧現Wikimedia Commons帶寬需求50%

維基媒體基金會,維基百科及眾多其他群眾外包知識平台的母體,於週三宣布,自2024年1月起,來自維基共享資源的多媒體下載頻寬使用量驚人地增長了50%。根據週二的一篇博客文章詳細說明,這一激增並非由於人類好奇心的增加,而是由於自動化爬蟲對數據的渴求,用於訓練AI模型。

“我們的基礎設施設計用於處理重大事件期間來自人類的突發流量激增,但來自爬蟲機器人的流量量無與倫比,且帶來日益增加的風險和成本,”該文章解釋道。

維基共享資源作為一個可自由訪問的圖像、視頻和音頻文件中心,所有內容均以開放許可證或公共領域形式提供。

深入探究,維基媒體透露,資源消耗最嚴重的流量中有高達65%來自機器人,這是以內容消耗類型衡量的。然而,這些機器人僅佔總頁面瀏覽量的35%。維基媒體表示,這一差異源於經常訪問的內容會被緩存在靠近用戶的地方,而機器人經常針對的較不受歡迎的內容則儲存在成本更高的“核心數據中心”。

“人類讀者傾向於專注於特定的、通常相似的話題,而爬蟲機器人則傾向於‘批量閱讀’更多頁面,並訪問較不受歡迎的頁面,”維基媒體指出。“這導致這些請求被轉發到核心數據中心,顯著增加了我們的資源消耗成本。”

因此,維基媒體基金會的網站可靠性團隊正在投入大量時間和資源來阻止這些爬蟲,以防止對日常用戶的干擾。這還未觸及基金會正應對的不斷上升的雲端成本。

這種情況是威脅開放互聯網的更廣泛趨勢的一部分。就在上個月,軟件工程師兼開源倡導者Drew DeVault哀嘆,AI爬蟲公然無視旨在阻止自動流量的“robots.txt”文件。同樣,被稱為“務實工程師”的Gergely Orosz最近也表達了他對來自Meta等公司的AI爬蟲如何使其項目頻寬需求激增的不滿。

雖然開源基礎設施尤其脆弱,但開發者們正以創造力和決心應對。TechCrunch上週報導,一些科技公司正在加緊行動。例如,Cloudflare推出了AI Labyrinth,旨在通過AI生成的內容減緩爬蟲速度。

然而,這仍然是一場持續的貓鼠遊戲,可能會迫使許多出版商退回到登錄和付費牆後,最終損害我們都依賴的網絡的開放性質。

相關文章
AI 以驚人的數位變身在 Metaverse 中重塑邁克爾傑克遜的形象 AI 以驚人的數位變身在 Metaverse 中重塑邁克爾傑克遜的形象 人工智慧正在從根本上重塑我們對創意、娛樂和文化遺產的理解。本書探討人工智慧對 Michael Jackson 的詮釋,揭示尖端科技如何為傳奇文化人物注入新生命。從超級英雄的化身到奇幻境界的戰士,這些突破性的變身展示了 AI 重塑流行天王的非凡能力,同時拓展了數位藝術和虛擬世界體驗的領域。主要觀點AI 透過充滿想像力的角色變身,重新定義 Michael Jackson戲劇性的可視化包括超級英雄、絕地
訓練會減緩人工智能引起的認知負載效應嗎? 訓練會減緩人工智能引起的認知負載效應嗎? Unite.ai 最近發表了一篇題為「ChatGPT Might Be Draining Your Brain:Cognitive Debt in the AI Era"(人工智能時代的認知債務),揭示了麻省理工學院的相關研究。記者 Alex McFarland 詳述了令人信服的證據,證明過度依賴 AI 會侵蝕基本的認知能力,尤其是批判性思考和判斷力。雖然這些發現與許多其他研究結果一致,但目前的迫
輕鬆產生由 AI 驅動的圖表和可視化,以獲得更好的資料洞察力 輕鬆產生由 AI 驅動的圖表和可視化,以獲得更好的資料洞察力 現代資料分析需要複雜資訊的直覺視覺化。人工智能驅動的圖表生成解決方案已成為不可或缺的資產,徹底改變了專業人員將原始資料轉換為引人入勝的視覺故事的方式。這些智慧型系統可省去手動製圖的工作,同時保留精確度,讓技術與非技術使用者都能透過自動化的可視化方式,發掘可行的洞察力。主要重點自動可視化:立即將結構化及非結構化資料轉換成專業級圖表。自然語言處理:透過會話指令產生可視化,無需編碼。全面的圖表支援:製作
評論 (14)
0/200
KevinBrown
KevinBrown 2025-08-23 23:01:15

Incroyable, 50% d'augmentation de bande passante pour Wikimedia Commons ! Ça montre à quel point l'IA aspire tout sur son passage, non ? 😅 J’espère juste que ça ne va pas surcharger les serveurs ou freiner l’accès pour les utilisateurs classiques.

CharlesWhite
CharlesWhite 2025-08-13 21:00:59

Whoa, a 50% spike in Wikimedia Commons bandwidth? AI crawlers are eating up data like it’s an all-you-can-eat buffet! 😄 Makes me wonder how much of this is legit research vs. bots just hoarding images for some shady AI training. Anyone else curious about what’s driving this?

SamuelClark
SamuelClark 2025-07-31 19:35:39

Wow, a 50% spike in bandwidth for Wikimedia Commons? That’s wild! AI crawlers are probably gobbling up all those images for training. Kinda cool but also makes me wonder if this is pushing the limits of what open platforms can handle. 😅

KennethJohnson
KennethJohnson 2025-07-31 09:42:05

Wow, a 50% spike in bandwidth for Wikimedia Commons? That’s wild! AI crawlers are probably gobbling up all those images for training. Makes me wonder how much data these AI models are chugging through daily. 😳 Cool to see open knowledge fueling innovation, though!

WillieAnderson
WillieAnderson 2025-04-18 14:23:40

Wikimedia Commons에서 AI 크롤러로 인한 대역폭 수요 증가는 미쳤어요! AI가 이렇게 널리 사용되는 건 멋지지만, 조금 걱정되기도 해요. 사용자 경험에 큰 영향을 주지 않으면서 이를 관리할 방법을 찾았으면 좋겠어요. 🤔

RaymondGreen
RaymondGreen 2025-04-18 14:01:01

ウィキメディア・コモンズの帯域使用量が50%増えたって?😲 信じられない!AIクローラーがデータを欲しがってるんだね。ウィキメディアが情報を共有してくれるのはいいけど、これで遅くなるのは嫌だな。ユーザー体験を壊さずに対応できるといいね!🤞

回到頂部
OR