AI爬行者湧現Wikimedia Commons帶寬需求50％

首頁

新聞

2025-04-17

JamesMiller

186

AI爬行者湧現Wikimedia Commons帶寬需求50％

維基媒體基金會，維基百科及眾多其他群眾外包知識平台的母體，於週三宣布，自2024年1月起，來自維基共享資源的多媒體下載頻寬使用量驚人地增長了50%。根據週二的一篇博客文章詳細說明，這一激增並非由於人類好奇心的增加，而是由於自動化爬蟲對數據的渴求，用於訓練AI模型。

“我們的基礎設施設計用於處理重大事件期間來自人類的突發流量激增，但來自爬蟲機器人的流量量無與倫比，且帶來日益增加的風險和成本，”該文章解釋道。

維基共享資源作為一個可自由訪問的圖像、視頻和音頻文件中心，所有內容均以開放許可證或公共領域形式提供。

深入探究，維基媒體透露，資源消耗最嚴重的流量中有高達65%來自機器人，這是以內容消耗類型衡量的。然而，這些機器人僅佔總頁面瀏覽量的35%。維基媒體表示，這一差異源於經常訪問的內容會被緩存在靠近用戶的地方，而機器人經常針對的較不受歡迎的內容則儲存在成本更高的“核心數據中心”。

“人類讀者傾向於專注於特定的、通常相似的話題，而爬蟲機器人則傾向於‘批量閱讀’更多頁面，並訪問較不受歡迎的頁面，”維基媒體指出。“這導致這些請求被轉發到核心數據中心，顯著增加了我們的資源消耗成本。”

因此，維基媒體基金會的網站可靠性團隊正在投入大量時間和資源來阻止這些爬蟲，以防止對日常用戶的干擾。這還未觸及基金會正應對的不斷上升的雲端成本。

這種情況是威脅開放互聯網的更廣泛趨勢的一部分。就在上個月，軟件工程師兼開源倡導者Drew DeVault哀嘆，AI爬蟲公然無視旨在阻止自動流量的“robots.txt”文件。同樣，被稱為“務實工程師”的Gergely Orosz最近也表達了他對來自Meta等公司的AI爬蟲如何使其項目頻寬需求激增的不滿。

雖然開源基礎設施尤其脆弱，但開發者們正以創造力和決心應對。TechCrunch上週報導，一些科技公司正在加緊行動。例如，Cloudflare推出了AI Labyrinth，旨在通過AI生成的內容減緩爬蟲速度。

然而，這仍然是一場持續的貓鼠遊戲，可能會迫使許多出版商退回到登錄和付費牆後，最終損害我們都依賴的網絡的開放性質。

首個山東百度AI漫畫劇集創作基地在淄博正式啟動 4月27日，山東省在淄博師範學院正式啟動了該省首個「百度AI漫畫劇創作基地」，標誌著該省在數位文化創作領域邁出了重要一步。該基地開啟了校企合作的新篇章，旨在透過AI技術與文化創作教育的深度融合，探索培育數位文化創作人才的創新模式。在揭牌儀式上，校方代表強調，該基地將作為創新人才培育及深化政校企合作的重要平台。展望未來，該校計劃將真實的專案案例引入課堂，擺脫傳統教學方法，建立一個完整的專案式教學循

桑德伯格與克萊格加入 Nscale 董事會，這家被譽為「挪威星際之門」的新創公司估值達 146 億美元隨著市場對能大規模提供 AI 運算能力的資料中心需求激增，由 Nvidia 支持的英國 AI 基礎設施公司 Nscale 估值已達 146 億美元。這使該公司與 Helsing 及 Mistral AI 並列，成為歐洲最新的「獨角獸」企業之一。Nscale 的策略核心在於垂直整合，涵蓋能源、資料中心、運算及調度軟體等領域。此次估值是基於一輪20億美元的C輪融資，該公司稱此為「歐洲史上最大規模」，

Runway 53 億美元估值挑戰 Google，其影片 AI 技術已超越語言 AI 儘管多數人工智慧巨頭已投入數十億美元於語言模型，生成式人工智慧影片新創公司 Runway 卻正沿著截然不同的道路勇往直前。根據 TechCrunch 報導，這家由藝術學院畢業生創立的年輕公司，目前估值已達 53 億美元。近期財務數據顯示，Runway 在 2026 年第二季新增了 4,000 萬美元的年度經常性收入（ARR）。憑藉其新推出的 Gen-4.5 影片生成模型，該公司不僅鞏固了在好萊塢電

相關專題推薦

健康與養生

AI 孕期輔助系統：生成安全且按孕期分階段的運動與營養計畫

探索 2026 年最佳 AI 孕期輔助工具，為您量身打造安全且針對各孕期的運動與營養計畫。獲取精選的高評分推薦，包含免費與付費方案的比較，以及實用經驗分享。透過 XIX.AI 的專家指南，開啟您最健康的孕期旅程。立即探索。

10 個工具

xix.ai

寫作

最佳免費且無法被偵測的 AI 寫手：將機械化的草稿轉化為自然、類人化的散文

立即前往 XIX.AI，探索 2026 年最頂尖的免費且難以被察覺的 AI 寫手。我們精心篩選的頂級清單，能協助您將生硬的草稿轉化為自然流暢、宛如人類撰寫的文字。透過實際測試與每週更新的排行榜，比較免費與付費選項的優劣。立即解鎖您的 AI 寫作優勢。

10 個工具

xix.ai

圖像編輯

用於短劇故事板的AI藝術生成工具：幻想與都市浪漫題材的角色設計

2026最新推薦：探索最適合用於短劇故事板製作的AI藝術生成工具。我們精心挑選了眾多頂級工具，幫助您創作出引人入勝的幻想角色和都市浪漫角色。您可以對比免費與付費選項，檢視實際測試結果，從而找到最適合自己的創意工具。XIX.AI還會每週更新排名並提供專家分析，讓您立即開始將故事視覺化呈現吧！

10 個工具

xix.ai

寫作

最適合廣播和播客使用的AI指令碼編寫工具：幫助您創作引人入勝的音訊廣告

在XIX.AI上，發現2026年最適合用於廣播和播客製作的AI指令碼工具。我們精心挑選的這些高評分工具能夠提供強大的功能，幫助您快速製作出引人入勝的音訊廣告。透過實際測試和每週更新的排名，您可以瞭解免費選項與付費選項之間的差異。今天就釋放您的創造力吧！

10 個工具

xix.ai

商業

最佳 AI 合約審查軟體：即時發現法律漏洞與合規風險

立即在 XIX.AI 探索 2026 年最佳 AI 合約審查軟體。我們精心挑選的頂級清單收錄了多款強大工具，能即時偵測法律漏洞與合規風險。透過實際測試與每週更新的排行榜，比較免費與付費方案的差異。為您找到能徹底改變遊戲規則的解決方案，實現安全且高效的合約分析。立即探索這份權威指南。

10 個工具

xix.ai

動畫創作

專為東華設計的AI動漫生成器：可用於建立網路小說角色及漫畫頭像

探索2026年最適合製作中文動畫的人工智慧工具。我們精心挑選的頂級列表中包含了各種強大的工具，能夠幫助你建立出令人驚歎的網路小說角色和漫畫頭像。透過實際測試來對比免費選項和付費選項，找到最適合你的創作工具，今天就在XIX.AI上將你的故事變為現實吧。

10 個工具

xix.ai

評論 (15)

0/500

請登錄後再操作

BruceAllen

2026-05-22 16:00:15

這流量暴增也太誇張了吧！AI爬蟲把Wikimedia Commons的頻寬吃掉一半？難怪最近載圖變超慢...不過想想也合理，現在一堆AI模型都在狂抓訓練資料，但這樣搞下去會不會把非營利資源榨乾啊？有點擔心未來開放資源的永續性😅

KevinBrown

2025-08-23 23:01:15

Incroyable, 50% d'augmentation de bande passante pour Wikimedia Commons ! Ça montre à quel point l'IA aspire tout sur son passage, non ? 😅 J’espère juste que ça ne va pas surcharger les serveurs ou freiner l’accès pour les utilisateurs classiques.

CharlesWhite

2025-08-13 21:00:59

Whoa, a 50% spike in Wikimedia Commons bandwidth? AI crawlers are eating up data like it’s an all-you-can-eat buffet! 😄 Makes me wonder how much of this is legit research vs. bots just hoarding images for some shady AI training. Anyone else curious about what’s driving this?

SamuelClark

2025-07-31 19:35:39

Wow, a 50% spike in bandwidth for Wikimedia Commons? That’s wild! AI crawlers are probably gobbling up all those images for training. Kinda cool but also makes me wonder if this is pushing the limits of what open platforms can handle. 😅

KennethJohnson

2025-07-31 09:42:05

Wow, a 50% spike in bandwidth for Wikimedia Commons? That’s wild! AI crawlers are probably gobbling up all those images for training. Makes me wonder how much data these AI models are chugging through daily. 😳 Cool to see open knowledge fueling innovation, though!

WillieAnderson

2025-04-18 14:23:40

Wikimedia Commons에서 AI 크롤러로 인한 대역폭 수요 증가는 미쳤어요! AI가 이렇게 널리 사용되는 건 멋지지만, 조금 걱정되기도 해요. 사용자 경험에 큰 영향을 주지 않으면서 이를 관리할 방법을 찾았으면 좋겠어요. 🤔

頭號新聞

AI Builder和Power Automate革新文件摘要 AI寄主Notebooklm播客現已上中國發布國家級人形機器人與具身智能標準 Ramp 數據顯示，企業對 AI 的採納已進入停滯期 Bing圖像創作者教程：AI藝術生成指南學習使用您的聲音創建AI音樂：逐步Suno教程 iMyFone MagicMic：實時AI變聲器評測與教程 2025頂級AI影片生成器：Pika Labs與其他對比 Embodied Intelligence 公布首項業界標準，以遏止無序擴張 DeepSeek V4 崛起為多模態人工智慧的變革者

精選