選項
首頁
新聞
AI爬行者湧現Wikimedia Commons帶寬需求50%

AI爬行者湧現Wikimedia Commons帶寬需求50%

2025-04-17
186

AI爬行者湧現Wikimedia Commons帶寬需求50%

維基媒體基金會,維基百科及眾多其他群眾外包知識平台的母體,於週三宣布,自2024年1月起,來自維基共享資源的多媒體下載頻寬使用量驚人地增長了50%。根據週二的一篇博客文章詳細說明,這一激增並非由於人類好奇心的增加,而是由於自動化爬蟲對數據的渴求,用於訓練AI模型。

“我們的基礎設施設計用於處理重大事件期間來自人類的突發流量激增,但來自爬蟲機器人的流量量無與倫比,且帶來日益增加的風險和成本,”該文章解釋道。

維基共享資源作為一個可自由訪問的圖像、視頻和音頻文件中心,所有內容均以開放許可證或公共領域形式提供。

深入探究,維基媒體透露,資源消耗最嚴重的流量中有高達65%來自機器人,這是以內容消耗類型衡量的。然而,這些機器人僅佔總頁面瀏覽量的35%。維基媒體表示,這一差異源於經常訪問的內容會被緩存在靠近用戶的地方,而機器人經常針對的較不受歡迎的內容則儲存在成本更高的“核心數據中心”。

“人類讀者傾向於專注於特定的、通常相似的話題,而爬蟲機器人則傾向於‘批量閱讀’更多頁面,並訪問較不受歡迎的頁面,”維基媒體指出。“這導致這些請求被轉發到核心數據中心,顯著增加了我們的資源消耗成本。”

因此,維基媒體基金會的網站可靠性團隊正在投入大量時間和資源來阻止這些爬蟲,以防止對日常用戶的干擾。這還未觸及基金會正應對的不斷上升的雲端成本。

這種情況是威脅開放互聯網的更廣泛趨勢的一部分。就在上個月,軟件工程師兼開源倡導者Drew DeVault哀嘆,AI爬蟲公然無視旨在阻止自動流量的“robots.txt”文件。同樣,被稱為“務實工程師”的Gergely Orosz最近也表達了他對來自Meta等公司的AI爬蟲如何使其項目頻寬需求激增的不滿。

雖然開源基礎設施尤其脆弱,但開發者們正以創造力和決心應對。TechCrunch上週報導,一些科技公司正在加緊行動。例如,Cloudflare推出了AI Labyrinth,旨在通過AI生成的內容減緩爬蟲速度。

然而,這仍然是一場持續的貓鼠遊戲,可能會迫使許多出版商退回到登錄和付費牆後,最終損害我們都依賴的網絡的開放性質。

相關文章
桑德伯格與克萊格加入 Nscale 董事會,這家被譽為「挪威星際之門」的新創公司估值達 146 億美元 桑德伯格與克萊格加入 Nscale 董事會,這家被譽為「挪威星際之門」的新創公司估值達 146 億美元 隨著市場對能大規模提供 AI 運算能力的資料中心需求激增,由 Nvidia 支持的英國 AI 基礎設施公司 Nscale 估值已達 146 億美元。這使該公司與 Helsing 及 Mistral AI 並列,成為歐洲最新的「獨角獸」企業之一。Nscale 的策略核心在於垂直整合,涵蓋能源、資料中心、運算及調度軟體等領域。 此次估值是基於一輪20億美元的C輪融資,該公司稱此為「歐洲史上最大規模」,
Runway 53 億美元估值挑戰 Google,其影片 AI 技術已超越語言 AI Runway 53 億美元估值挑戰 Google,其影片 AI 技術已超越語言 AI 儘管多數人工智慧巨頭已投入數十億美元於語言模型,生成式人工智慧影片新創公司 Runway 卻正沿著截然不同的道路勇往直前。根據 TechCrunch 報導,這家由藝術學院畢業生創立的年輕公司,目前估值已達 53 億美元。近期財務數據顯示,Runway 在 2026 年第二季新增了 4,000 萬美元的年度經常性收入(ARR)。憑藉其新推出的 Gen-4.5 影片生成模型,該公司不僅鞏固了在好萊塢電
Google 將加大對 Anthropic 的投資,總額可能高達 400 億美元 Google 將加大對 Anthropic 的投資,總額可能高達 400 億美元 在節奏飛快的 AI 軍備競賽中,各大科技巨頭正採取越來越大膽的舉措。根據最新報導,Google 計劃向 AI 新創公司 Anthropic 投資高達 100 億美元——而這僅僅是個開始。根據其長期戰略,總投資額最終可能達到 400 億美元。這筆巨額交易將使Anthropic的估值推升至3,500億美元的新高。就在數月前,該公司才剛完成一輪300億美元的融資。亞馬遜此前已投資50億美元,並保留了額外
相關專題推薦
健康與養生 AI 孕期輔助系統:生成安全且按孕期分階段的運動與營養計畫
AI 孕期輔助系統:生成安全且按孕期分階段的運動與營養計畫

探索 2026 年最佳 AI 孕期輔助工具,為您量身打造安全且針對各孕期的運動與營養計畫。獲取精選的高評分推薦,包含免費與付費方案的比較,以及實用經驗分享。透過 XIX.AI 的專家指南,開啟您最健康的孕期旅程。立即探索。

10 個工具
xix.ai
寫作 最佳免費且無法被偵測的 AI 寫手:將機械化的草稿轉化為自然、類人化的散文
最佳免費且無法被偵測的 AI 寫手:將機械化的草稿轉化為自然、類人化的散文

立即前往 XIX.AI,探索 2026 年最頂尖的免費且難以被察覺的 AI 寫手。我們精心篩選的頂級清單,能協助您將生硬的草稿轉化為自然流暢、宛如人類撰寫的文字。透過實際測試與每週更新的排行榜,比較免費與付費選項的優劣。立即解鎖您的 AI 寫作優勢。

10 個工具
xix.ai
圖像編輯 用於短劇故事板的AI藝術生成工具:幻想與都市浪漫題材的角色設計
用於短劇故事板的AI藝術生成工具:幻想與都市浪漫題材的角色設計

2026最新推薦:探索最適合用於短劇故事板製作的AI藝術生成工具。我們精心挑選了眾多頂級工具,幫助您創作出引人入勝的幻想角色和都市浪漫角色。您可以對比免費與付費選項,檢視實際測試結果,從而找到最適合自己的創意工具。XIX.AI還會每週更新排名並提供專家分析,讓您立即開始將故事視覺化呈現吧!

10 個工具
xix.ai
寫作 最適合廣播和播客使用的AI指令碼編寫工具:幫助您創作引人入勝的音訊廣告
最適合廣播和播客使用的AI指令碼編寫工具:幫助您創作引人入勝的音訊廣告

在XIX.AI上,發現2026年最適合用於廣播和播客製作的AI指令碼工具。我們精心挑選的這些高評分工具能夠提供強大的功能,幫助您快速製作出引人入勝的音訊廣告。透過實際測試和每週更新的排名,您可以瞭解免費選項與付費選項之間的差異。今天就釋放您的創造力吧!

10 個工具
xix.ai
商業 最佳 AI 合約審查軟體:即時發現法律漏洞與合規風險
最佳 AI 合約審查軟體:即時發現法律漏洞與合規風險

立即在 XIX.AI 探索 2026 年最佳 AI 合約審查軟體。我們精心挑選的頂級清單收錄了多款強大工具,能即時偵測法律漏洞與合規風險。透過實際測試與每週更新的排行榜,比較免費與付費方案的差異。為您找到能徹底改變遊戲規則的解決方案,實現安全且高效的合約分析。立即探索這份權威指南。

10 個工具
xix.ai
動畫創作 專為東華設計的AI動漫生成器:可用於建立網路小說角色及漫畫頭像
專為東華設計的AI動漫生成器:可用於建立網路小說角色及漫畫頭像

探索2026年最適合製作中文動畫的人工智慧工具。我們精心挑選的頂級列表中包含了各種強大的工具,能夠幫助你建立出令人驚歎的網路小說角色和漫畫頭像。透過實際測試來對比免費選項和付費選項,找到最適合你的創作工具,今天就在XIX.AI上將你的故事變為現實吧。

10 個工具
xix.ai
評論 (15)
0/500
BruceAllen
BruceAllen 2026-05-22 16:00:15

這流量暴增也太誇張了吧!AI爬蟲把Wikimedia Commons的頻寬吃掉一半?難怪最近載圖變超慢...不過想想也合理,現在一堆AI模型都在狂抓訓練資料,但這樣搞下去會不會把非營利資源榨乾啊?有點擔心未來開放資源的永續性😅

KevinBrown
KevinBrown 2025-08-23 23:01:15

Incroyable, 50% d'augmentation de bande passante pour Wikimedia Commons ! Ça montre à quel point l'IA aspire tout sur son passage, non ? 😅 J’espère juste que ça ne va pas surcharger les serveurs ou freiner l’accès pour les utilisateurs classiques.

CharlesWhite
CharlesWhite 2025-08-13 21:00:59

Whoa, a 50% spike in Wikimedia Commons bandwidth? AI crawlers are eating up data like it’s an all-you-can-eat buffet! 😄 Makes me wonder how much of this is legit research vs. bots just hoarding images for some shady AI training. Anyone else curious about what’s driving this?

SamuelClark
SamuelClark 2025-07-31 19:35:39

Wow, a 50% spike in bandwidth for Wikimedia Commons? That’s wild! AI crawlers are probably gobbling up all those images for training. Kinda cool but also makes me wonder if this is pushing the limits of what open platforms can handle. 😅

KennethJohnson
KennethJohnson 2025-07-31 09:42:05

Wow, a 50% spike in bandwidth for Wikimedia Commons? That’s wild! AI crawlers are probably gobbling up all those images for training. Makes me wonder how much data these AI models are chugging through daily. 😳 Cool to see open knowledge fueling innovation, though!

WillieAnderson
WillieAnderson 2025-04-18 14:23:40

Wikimedia Commons에서 AI 크롤러로 인한 대역폭 수요 증가는 미쳤어요! AI가 이렇게 널리 사용되는 건 멋지지만, 조금 걱정되기도 해요. 사용자 경험에 큰 영향을 주지 않으면서 이를 관리할 방법을 찾았으면 좋겠어요. 🤔

OR