歐洲數字主權路線圖中包含的開源LLM

首頁

新聞

歐洲數字主權路線圖中包含的開源LLM

2025-04-17

AnthonyMartinez

224

歐洲數字主權路線圖中包含的開源LLM

上週，歐洲的數位主權議程獲得重大推動，宣布了一項新計劃，旨在開發一系列完全開源的大型語言模型（LLMs），涵蓋所有歐盟語言。這項雄心勃勃的計劃，名為OpenEuroLLM，不僅針對24種歐盟官方語言，還擴展到正在談判加入歐盟的國家語言，如阿爾巴尼亞，強調未來導向。

OpenEuroLLM是一個由大約20個組織合作的項目，由布拉格查理大學的計算語言學家Jan Hajič和芬蘭AI實驗室Silo AI的首席執行官兼共同創辦人Peter Sarlin共同領導，該實驗室去年被AMD以6.65億美元收購。這項計劃與歐洲更廣泛的數位主權推動一致，旨在將關鍵基礎設施和工具保留在歐洲大陸。這一舉措呼應了主要雲端服務提供商和AI公司如OpenAI的行動，它們一直在投資本地基礎設施，以確保歐盟數據留在歐洲土地上。

此外，歐盟最近簽署了一項110億美元的協議，建立主權衛星星座，定位為與Elon Musk的Starlink競爭。OpenEuroLLM完美契合這一願景，專注於維護歐洲的技術自主。

資金與挑戰

儘管目標遠大，開發這些模型的預算為3740萬歐元，其中約2000萬歐元來自歐盟的數位歐洲計劃。與企業AI巨頭的投資相比，這筆金額顯得微不足道，儘管考慮到相關工作的資金後，總預算有所增加。費用中的重要部分是運算能力，OpenEuroLLM與西班牙、義大利、芬蘭和荷蘭的EuroHPC超級計算機中心合作，這些中心屬於總額70億歐元的EuroHPC項目。

參與者從學術界到企業的多樣性，引發了對項目可行性的質疑。LLM公司Pleias的共同創辦人Anastasia Stasenko對如此龐大的聯盟有效性表示懷疑，認為與更靈活、專注的私人AI公司如Mistral AI和LightOn相比，大型聯盟的反應速度較慢，她認為這些較小的團隊有更直接的責任感，能更快應對挑戰。

從頭開始還是利用現有成果？

OpenEuroLLM的起點有些模糊。自2022年起，Jan Hajič一直在協調高效能語言技術（HPLT）項目，該項目專注於使用高效能運算開發免費且可重複使用的數據集、模型和工作流程。該項目將於2025年底結束，與OpenEuroLLM共享許多合作夥伴，僅排除英國的參與者。

Hajič將HPLT視為OpenEuroLLM的前身，認為它在數據、專業知識、工具和運算經驗方面提供了堅實基礎。他預計OpenEuroLLM的首批版本將於2026年中發布，最終版本預計在2028年項目結束時完成。然而，項目的GitHub頁面仍顯空洞，顯示某些方面從頭開始。Hajič提到該項目於2024年2月1日正式啟動，經過一年的準備。

OpenEuroLLM聯盟包括來自捷克、荷蘭、德國、瑞典、芬蘭和挪威的組織，以及Silo AI、Aleph Alpha、Ellamind、Prompsit Language Engineering和LightOn等企業。值得注意的是，法國AI獨角獸Mistral未參與，儘管Hajič曾試圖與其對話。

目標與交付成果

該項目的主要目標是為歐洲打造透明AI的基礎模型系列，保留所有歐盟語言（當前和未來）的語言與文化多樣性。交付成果仍在最終確定中，但預計包括用於通用任務的核心多語言LLM，以及為高效邊緣應用設計的較小量化版本。

Hajič強調品質的重要性，表示鑑於高風險和公共資金的參與，項目旨在避免發布不成熟的解決方案。在數位資源有限的語言上實現同等熟練度仍是一個挑戰。項目計劃使用能準確代表這些語言和文化的基準。

HPLT項目的數據，包括來自網絡爬取的4.5拍字節數據集和超過200億份文件，將被使用，並補充來自Common Crawl的數據。

開源困境

關於AI中何為「開源」的爭論仍在繼續。開源促進會（OSI）已定義「開源AI」，但有些人認為這不僅應包括模型，還應包括數據集、預訓練模型和權重。OpenEuroLLM旨在「真正開源」，但Hajič承認，由於歐洲版權法和數據再分發限制，可能存在局限性。部分訓練數據可能需要保密，但根據歐盟AI法案可供審計。

與現有項目的重疊

OpenEuroLLM的推出與最近推出的EuroLLM相比，後者有相似目標且同樣由歐盟共同資助。EuroLLM於9月發布首個模型，12月發布後續模型，引發了關於冗餘和協作而非競爭的必要性討論。Unbabel研究負責人Andre Martins在社交媒體上強調了這些相似性，呼籲不同社群間的公開合作。

Hajič承認這種重疊令人遺憾，但表示希望合作，指出OpenEuroLLM的資金限制了與非歐盟實體（包括英國大學）的合作。

資金與期望

中國DeepSeek的出現，以其優越的成本效益比，引發了關於構建AI模型真實成本的疑問。OpenEuroLLM技術共同負責人Peter Sarlin表示，缺乏DeepSeek開發的詳細資訊，但他對OpenEuroLLM的資金充滿信心，主要涵蓋人員成本。運算費用預計由EuroHPC中心承擔。

Sarlin強調，OpenEuroLLM的目標不是打造消費或企業產品，而是為歐洲公司提供開源基礎模型作為AI基礎設施。他認為分配的預算是足夠的，基於他在Silo AI的經驗，該公司已開發支持多種歐洲語言的模型，並準備推出涵蓋所有歐洲語言的「Europa」模型。

數位主權與合作

儘管面臨挑戰和批評，Hajič對OpenEuroLLM這樣的合作項目潛力保持樂觀。他認為結合學術專業知識與企業焦點可能帶來創新成果。最終目標不是與科技巨頭或億美元AI初創公司競爭，而是通過開發由歐洲為歐洲打造的基礎LLM，增強歐洲的數位主權。

即使OpenEuroLLM未產生頂尖模型，Hajič認為擁有一個完全基於歐洲的「良好」模型，對大陸的技術自主仍有積極貢獻。

解讀新的 ETSI 人工智慧安全標準 ETSI EN 304 223 制定了人工智慧的基礎安全要求，各組織應將其納入其治理架構之中。隨著企業將機器學習整合至核心工作流程，這項歐洲標準針對保護 AI 模型與系統提供了具體規範。這是首項適用於全球的 AI 網路安全歐洲標準，並已獲各國國家標準組織正式批准，這進一步鞏固了其在國際市場上的公信力。作為《歐盟人工智慧法案》的補充性基準，本標準承認人工智慧系統存在獨特風險——包括資料中毒、模型混淆

Gmail 推出個人化 AI 收件匣、搜尋中的 AI 摘要等功能 Google 為 Gmail 推出了一款由 AI 驅動的新收件匣，能為您提供任務的個人化概覽，並讓您隨時掌握重要更新。此外，Gmail 還將在搜尋功能中推出 AI 概覽，並推出一款類似 Grammarly 的校對工具。先前僅限付費訂閱者使用的多項 AI 功能，現已開放給所有使用者使用。新的 AI 收件匣分頁包含兩個區塊：「建議待辦事項」與「待追蹤主題」。第一個區塊會顯示需要採取行動的高優先級電子

首個山東百度AI漫畫劇集創作基地在淄博正式啟動 4月27日，山東省在淄博師範學院正式啟動了該省首個「百度AI漫畫劇創作基地」，標誌著該省在數位文化創作領域邁出了重要一步。該基地開啟了校企合作的新篇章，旨在透過AI技術與文化創作教育的深度融合，探索培育數位文化創作人才的創新模式。在揭牌儀式上，校方代表強調，該基地將作為創新人才培育及深化政校企合作的重要平台。展望未來，該校計劃將真實的專案案例引入課堂，擺脫傳統教學方法，建立一個完整的專案式教學循

相關專題推薦

生產率

AI 架構設計師：運用自然語言建構可擴展的系統架構

立即在 XIX.AI 探索 2026 年最佳 AI 架構設計工具。我們精心挑選並廣受好評的清單，匯集了強大且具革命性的解決方案，讓您能透過自然語言建構可擴展的系統架構。透過實務見解，比較免費與付費選項的差異。立即釋放您的 AI 優勢，並簡化開發流程。

10 個工具

xix.ai

漫畫創作

AI角色建立工具：為漫畫主角生成詳細的背景故事及視覺參考資料

2026年最新最佳AI角色建立工具：發現那些備受好評的工具，它們能夠幫助你為漫畫角色生成詳細的背景故事和視覺素材。我們精心整理的這份每週更新的列表會根據實際測試結果，對比免費與付費選項的優劣。找到這些強大且能改變創作流程的工具，幫助你塑造引人入勝的角色，提升創作效率。立即訪問XIX.AI檢視排名，找到最適合你的故事創作助手吧。

10 個工具

xix.ai

健康與養生

AI 孕期輔助系統：生成安全且按孕期分階段的運動與營養計畫

探索 2026 年最佳 AI 孕期輔助工具，為您量身打造安全且針對各孕期的運動與營養計畫。獲取精選的高評分推薦，包含免費與付費方案的比較，以及實用經驗分享。透過 XIX.AI 的專家指南，開啟您最健康的孕期旅程。立即探索。

10 個工具

xix.ai

寫作

最佳免費且無法被偵測的 AI 寫手：將機械化的草稿轉化為自然、類人化的散文

立即前往 XIX.AI，探索 2026 年最頂尖的免費且難以被察覺的 AI 寫手。我們精心篩選的頂級清單，能協助您將生硬的草稿轉化為自然流暢、宛如人類撰寫的文字。透過實際測試與每週更新的排行榜，比較免費與付費選項的優劣。立即解鎖您的 AI 寫作優勢。

10 個工具

xix.ai

圖像編輯

用於短劇故事板的AI藝術生成工具：幻想與都市浪漫題材的角色設計

2026最新推薦：探索最適合用於短劇故事板製作的AI藝術生成工具。我們精心挑選了眾多頂級工具，幫助您創作出引人入勝的幻想角色和都市浪漫角色。您可以對比免費與付費選項，檢視實際測試結果，從而找到最適合自己的創意工具。XIX.AI還會每週更新排名並提供專家分析，讓您立即開始將故事視覺化呈現吧！

10 個工具

xix.ai

寫作

最適合廣播和播客使用的AI指令碼編寫工具：幫助您創作引人入勝的音訊廣告

在XIX.AI上，發現2026年最適合用於廣播和播客製作的AI指令碼工具。我們精心挑選的這些高評分工具能夠提供強大的功能，幫助您快速製作出引人入勝的音訊廣告。透過實際測試和每週更新的排名，您可以瞭解免費選項與付費選項之間的差異。今天就釋放您的創造力吧！

10 個工具

xix.ai

評論 (23)

0/500

請登錄後再操作

EdwardJackson

2026-03-25 16:00:43

A bold plan, but the practicality worries me. Training LLMs for dozens of languages with nuanced cultural contexts sounds massively resource-intensive. Can this truly compete with existing centralized models, or will it be more of a symbolic sovereignty project?

JosephWalker

2026-03-25 16:00:43

看到欧洲也要搞自己的开源大模型，有点意思！不过OpenEuroLLM真能做到覆盖所有欧盟语言吗？成本和技术难度想想都吓人，希望别最后成了个半吊子项目

AlbertThomas

2026-03-25 16:00:43

Iniciativa bacana, mas será que a Europa vai conseguir acompanhar o ritmo de IA quando o foco é espalhar os recursos por tantos idiomas? 🤔 Pode ficar defasado antes de ficar pronto...

RonaldWilliams

2026-02-04 20:00:27

欧洲在AI基础设施上的自主布局确实明智，开源大语言模型能降低对单一技术供应商的依赖，不过资金和人才招募可能会是现实挑战。希望这个OpenEuroLLM项目能真正考虑小语种使用者的需求，而不仅仅是英法德这些主流语言 🌍

JustinAnderson

2025-12-31 00:30:57

¡Vaya, esto sí es interesante! Un modelo de IA europeo y de código abierto... ¿Será la respuesta a la dependencia tecnológica que tenemos con EE.UU. y China? Me pregunto si realmente tendrá la misma potencia que los modelos cerrados de las grandes empresas. 🤔 Si logran cubrir todos los idiomas de la UE, sería un logro enorme para la diversidad cultural digital. ¡Ojalá vaya más allá de lo político y tenga un impacto real! 😊

StevenMartin

2025-08-17 01:00:59

Wow, OpenEuroLLM sounds like a game-changer for Europe's tech scene! Building LLMs for all EU languages is ambitious—imagine the boost for local AI startups. But can they keep up with the big players like OpenAI? 🤔

頭號新聞

AI Builder和Power Automate革新文件摘要 AI寄主Notebooklm播客現已上中國發布國家級人形機器人與具身智能標準 Ramp 數據顯示，企業對 AI 的採納已進入停滯期 Bing圖像創作者教程：AI藝術生成指南學習使用您的聲音創建AI音樂：逐步Suno教程 iMyFone MagicMic：實時AI變聲器評測與教程 2025頂級AI影片生成器：Pika Labs與其他對比 Embodied Intelligence 公布首項業界標準，以遏止無序擴張 DeepSeek V4 崛起為多模態人工智慧的變革者

精選