選項
首頁
新聞
歐洲數字主權路線圖中包含的開源LLM

歐洲數字主權路線圖中包含的開源LLM

2025-04-17
224

歐洲數字主權路線圖中包含的開源LLM

上週,歐洲的數位主權議程獲得重大推動,宣布了一項新計劃,旨在開發一系列完全開源的大型語言模型(LLMs),涵蓋所有歐盟語言。這項雄心勃勃的計劃,名為OpenEuroLLM,不僅針對24種歐盟官方語言,還擴展到正在談判加入歐盟的國家語言,如阿爾巴尼亞,強調未來導向。

OpenEuroLLM是一個由大約20個組織合作的項目,由布拉格查理大學的計算語言學家Jan Hajič和芬蘭AI實驗室Silo AI的首席執行官兼共同創辦人Peter Sarlin共同領導,該實驗室去年被AMD以6.65億美元收購。這項計劃與歐洲更廣泛的數位主權推動一致,旨在將關鍵基礎設施和工具保留在歐洲大陸。這一舉措呼應了主要雲端服務提供商和AI公司如OpenAI的行動,它們一直在投資本地基礎設施,以確保歐盟數據留在歐洲土地上。

此外,歐盟最近簽署了一項110億美元的協議,建立主權衛星星座,定位為與Elon Musk的Starlink競爭。OpenEuroLLM完美契合這一願景,專注於維護歐洲的技術自主。

資金與挑戰

儘管目標遠大,開發這些模型的預算為3740萬歐元,其中約2000萬歐元來自歐盟的數位歐洲計劃。與企業AI巨頭的投資相比,這筆金額顯得微不足道,儘管考慮到相關工作的資金後,總預算有所增加。費用中的重要部分是運算能力,OpenEuroLLM與西班牙、義大利、芬蘭和荷蘭的EuroHPC超級計算機中心合作,這些中心屬於總額70億歐元的EuroHPC項目。

參與者從學術界到企業的多樣性,引發了對項目可行性的質疑。LLM公司Pleias的共同創辦人Anastasia Stasenko對如此龐大的聯盟有效性表示懷疑,認為與更靈活、專注的私人AI公司如Mistral AI和LightOn相比,大型聯盟的反應速度較慢,她認為這些較小的團隊有更直接的責任感,能更快應對挑戰。

從頭開始還是利用現有成果?

OpenEuroLLM的起點有些模糊。自2022年起,Jan Hajič一直在協調高效能語言技術(HPLT)項目,該項目專注於使用高效能運算開發免費且可重複使用的數據集、模型和工作流程。該項目將於2025年底結束,與OpenEuroLLM共享許多合作夥伴,僅排除英國的參與者。

Hajič將HPLT視為OpenEuroLLM的前身,認為它在數據、專業知識、工具和運算經驗方面提供了堅實基礎。他預計OpenEuroLLM的首批版本將於2026年中發布,最終版本預計在2028年項目結束時完成。然而,項目的GitHub頁面仍顯空洞,顯示某些方面從頭開始。Hajič提到該項目於2024年2月1日正式啟動,經過一年的準備。

OpenEuroLLM聯盟包括來自捷克、荷蘭、德國、瑞典、芬蘭和挪威的組織,以及Silo AI、Aleph Alpha、Ellamind、Prompsit Language Engineering和LightOn等企業。值得注意的是,法國AI獨角獸Mistral未參與,儘管Hajič曾試圖與其對話。

目標與交付成果

該項目的主要目標是為歐洲打造透明AI的基礎模型系列,保留所有歐盟語言(當前和未來)的語言與文化多樣性。交付成果仍在最終確定中,但預計包括用於通用任務的核心多語言LLM,以及為高效邊緣應用設計的較小量化版本。

Hajič強調品質的重要性,表示鑑於高風險和公共資金的參與,項目旨在避免發布不成熟的解決方案。在數位資源有限的語言上實現同等熟練度仍是一個挑戰。項目計劃使用能準確代表這些語言和文化的基準。

HPLT項目的數據,包括來自網絡爬取的4.5拍字節數據集和超過200億份文件,將被使用,並補充來自Common Crawl的數據。

開源困境

關於AI中何為「開源」的爭論仍在繼續。開源促進會(OSI)已定義「開源AI」,但有些人認為這不僅應包括模型,還應包括數據集、預訓練模型和權重。OpenEuroLLM旨在「真正開源」,但Hajič承認,由於歐洲版權法和數據再分發限制,可能存在局限性。部分訓練數據可能需要保密,但根據歐盟AI法案可供審計。

與現有項目的重疊

OpenEuroLLM的推出與最近推出的EuroLLM相比,後者有相似目標且同樣由歐盟共同資助。EuroLLM於9月發布首個模型,12月發布後續模型,引發了關於冗餘和協作而非競爭的必要性討論。Unbabel研究負責人Andre Martins在社交媒體上強調了這些相似性,呼籲不同社群間的公開合作。

Hajič承認這種重疊令人遺憾,但表示希望合作,指出OpenEuroLLM的資金限制了與非歐盟實體(包括英國大學)的合作。

資金與期望

中國DeepSeek的出現,以其優越的成本效益比,引發了關於構建AI模型真實成本的疑問。OpenEuroLLM技術共同負責人Peter Sarlin表示,缺乏DeepSeek開發的詳細資訊,但他對OpenEuroLLM的資金充滿信心,主要涵蓋人員成本。運算費用預計由EuroHPC中心承擔。

Sarlin強調,OpenEuroLLM的目標不是打造消費或企業產品,而是為歐洲公司提供開源基礎模型作為AI基礎設施。他認為分配的預算是足夠的,基於他在Silo AI的經驗,該公司已開發支持多種歐洲語言的模型,並準備推出涵蓋所有歐洲語言的「Europa」模型。

數位主權與合作

儘管面臨挑戰和批評,Hajič對OpenEuroLLM這樣的合作項目潛力保持樂觀。他認為結合學術專業知識與企業焦點可能帶來創新成果。最終目標不是與科技巨頭或億美元AI初創公司競爭,而是通過開發由歐洲為歐洲打造的基礎LLM,增強歐洲的數位主權。

即使OpenEuroLLM未產生頂尖模型,Hajič認為擁有一個完全基於歐洲的「良好」模型,對大陸的技術自主仍有積極貢獻。

相關文章
解讀新的 ETSI 人工智慧安全標準 解讀新的 ETSI 人工智慧安全標準 ETSI EN 304 223 制定了人工智慧的基礎安全要求,各組織應將其納入其治理架構之中。隨著企業將機器學習整合至核心工作流程,這項歐洲標準針對保護 AI 模型與系統提供了具體規範。這是首項適用於全球的 AI 網路安全歐洲標準,並已獲各國國家標準組織正式批准,這進一步鞏固了其在國際市場上的公信力。作為《歐盟人工智慧法案》的補充性基準,本標準承認人工智慧系統存在獨特風險——包括資料中毒、模型混淆
Gmail 推出個人化 AI 收件匣、搜尋中的 AI 摘要等功能 Gmail 推出個人化 AI 收件匣、搜尋中的 AI 摘要等功能 Google 為 Gmail 推出了一款由 AI 驅動的新收件匣,能為您提供任務的個人化概覽,並讓您隨時掌握重要更新。此外,Gmail 還將在搜尋功能中推出 AI 概覽,並推出一款類似 Grammarly 的校對工具。先前僅限付費訂閱者使用的多項 AI 功能,現已開放給所有使用者使用。新的 AI 收件匣分頁包含兩個區塊:「建議待辦事項」與「待追蹤主題」。 第一個區塊會顯示需要採取行動的高優先級電子
首個山東百度AI漫畫劇集創作基地在淄博正式啟動 首個山東百度AI漫畫劇集創作基地在淄博正式啟動 4月27日,山東省在淄博師範學院正式啟動了該省首個「百度AI漫畫劇創作基地」,標誌著該省在數位文化創作領域邁出了重要一步。該基地開啟了校企合作的新篇章,旨在透過AI技術與文化創作教育的深度融合,探索培育數位文化創作人才的創新模式。在揭牌儀式上,校方代表強調,該基地將作為創新人才培育及深化政校企合作的重要平台。 展望未來,該校計劃將真實的專案案例引入課堂,擺脫傳統教學方法,建立一個完整的專案式教學循
相關專題推薦
生產率 AI 架構設計師:運用自然語言建構可擴展的系統架構
AI 架構設計師:運用自然語言建構可擴展的系統架構

立即在 XIX.AI 探索 2026 年最佳 AI 架構設計工具。我們精心挑選並廣受好評的清單,匯集了強大且具革命性的解決方案,讓您能透過自然語言建構可擴展的系統架構。透過實務見解,比較免費與付費選項的差異。立即釋放您的 AI 優勢,並簡化開發流程。

10 個工具
xix.ai
漫畫創作 AI角色建立工具:為漫畫主角生成詳細的背景故事及視覺參考資料
AI角色建立工具:為漫畫主角生成詳細的背景故事及視覺參考資料

2026年最新最佳AI角色建立工具:發現那些備受好評的工具,它們能夠幫助你為漫畫角色生成詳細的背景故事和視覺素材。我們精心整理的這份每週更新的列表會根據實際測試結果,對比免費與付費選項的優劣。找到這些強大且能改變創作流程的工具,幫助你塑造引人入勝的角色,提升創作效率。立即訪問XIX.AI檢視排名,找到最適合你的故事創作助手吧。

10 個工具
xix.ai
健康與養生 AI 孕期輔助系統:生成安全且按孕期分階段的運動與營養計畫
AI 孕期輔助系統:生成安全且按孕期分階段的運動與營養計畫

探索 2026 年最佳 AI 孕期輔助工具,為您量身打造安全且針對各孕期的運動與營養計畫。獲取精選的高評分推薦,包含免費與付費方案的比較,以及實用經驗分享。透過 XIX.AI 的專家指南,開啟您最健康的孕期旅程。立即探索。

10 個工具
xix.ai
寫作 最佳免費且無法被偵測的 AI 寫手:將機械化的草稿轉化為自然、類人化的散文
最佳免費且無法被偵測的 AI 寫手:將機械化的草稿轉化為自然、類人化的散文

立即前往 XIX.AI,探索 2026 年最頂尖的免費且難以被察覺的 AI 寫手。我們精心篩選的頂級清單,能協助您將生硬的草稿轉化為自然流暢、宛如人類撰寫的文字。透過實際測試與每週更新的排行榜,比較免費與付費選項的優劣。立即解鎖您的 AI 寫作優勢。

10 個工具
xix.ai
圖像編輯 用於短劇故事板的AI藝術生成工具:幻想與都市浪漫題材的角色設計
用於短劇故事板的AI藝術生成工具:幻想與都市浪漫題材的角色設計

2026最新推薦:探索最適合用於短劇故事板製作的AI藝術生成工具。我們精心挑選了眾多頂級工具,幫助您創作出引人入勝的幻想角色和都市浪漫角色。您可以對比免費與付費選項,檢視實際測試結果,從而找到最適合自己的創意工具。XIX.AI還會每週更新排名並提供專家分析,讓您立即開始將故事視覺化呈現吧!

10 個工具
xix.ai
寫作 最適合廣播和播客使用的AI指令碼編寫工具:幫助您創作引人入勝的音訊廣告
最適合廣播和播客使用的AI指令碼編寫工具:幫助您創作引人入勝的音訊廣告

在XIX.AI上,發現2026年最適合用於廣播和播客製作的AI指令碼工具。我們精心挑選的這些高評分工具能夠提供強大的功能,幫助您快速製作出引人入勝的音訊廣告。透過實際測試和每週更新的排名,您可以瞭解免費選項與付費選項之間的差異。今天就釋放您的創造力吧!

10 個工具
xix.ai
評論 (23)
0/500
EdwardJackson
EdwardJackson 2026-03-25 16:00:43

A bold plan, but the practicality worries me. Training LLMs for dozens of languages with nuanced cultural contexts sounds massively resource-intensive. Can this truly compete with existing centralized models, or will it be more of a symbolic sovereignty project?

JosephWalker
JosephWalker 2026-03-25 16:00:43

看到欧洲也要搞自己的开源大模型,有点意思!不过OpenEuroLLM真能做到覆盖所有欧盟语言吗?成本和技术难度想想都吓人,希望别最后成了个半吊子项目

AlbertThomas
AlbertThomas 2026-03-25 16:00:43

Iniciativa bacana, mas será que a Europa vai conseguir acompanhar o ritmo de IA quando o foco é espalhar os recursos por tantos idiomas? 🤔 Pode ficar defasado antes de ficar pronto...

RonaldWilliams
RonaldWilliams 2026-02-04 20:00:27

欧洲在AI基础设施上的自主布局确实明智,开源大语言模型能降低对单一技术供应商的依赖,不过资金和人才招募可能会是现实挑战。希望这个OpenEuroLLM项目能真正考虑小语种使用者的需求,而不仅仅是英法德这些主流语言 🌍

JustinAnderson
JustinAnderson 2025-12-31 00:30:57

¡Vaya, esto sí es interesante! Un modelo de IA europeo y de código abierto... ¿Será la respuesta a la dependencia tecnológica que tenemos con EE.UU. y China? Me pregunto si realmente tendrá la misma potencia que los modelos cerrados de las grandes empresas. 🤔 Si logran cubrir todos los idiomas de la UE, sería un logro enorme para la diversidad cultural digital. ¡Ojalá vaya más allá de lo político y tenga un impacto real! 😊

StevenMartin
StevenMartin 2025-08-17 01:00:59

Wow, OpenEuroLLM sounds like a game-changer for Europe's tech scene! Building LLMs for all EU languages is ambitious—imagine the boost for local AI startups. But can they keep up with the big players like OpenAI? 🤔

OR