選項
首頁
新聞
歐洲數字主權路線圖中包含的開源LLM

歐洲數字主權路線圖中包含的開源LLM

2025-04-17
116

歐洲數字主權路線圖中包含的開源LLM

上週,歐洲的數位主權議程獲得重大推動,宣布了一項新計劃,旨在開發一系列完全開源的大型語言模型(LLMs),涵蓋所有歐盟語言。這項雄心勃勃的計劃,名為OpenEuroLLM,不僅針對24種歐盟官方語言,還擴展到正在談判加入歐盟的國家語言,如阿爾巴尼亞,強調未來導向。

OpenEuroLLM是一個由大約20個組織合作的項目,由布拉格查理大學的計算語言學家Jan Hajič和芬蘭AI實驗室Silo AI的首席執行官兼共同創辦人Peter Sarlin共同領導,該實驗室去年被AMD以6.65億美元收購。這項計劃與歐洲更廣泛的數位主權推動一致,旨在將關鍵基礎設施和工具保留在歐洲大陸。這一舉措呼應了主要雲端服務提供商和AI公司如OpenAI的行動,它們一直在投資本地基礎設施,以確保歐盟數據留在歐洲土地上。

此外,歐盟最近簽署了一項110億美元的協議,建立主權衛星星座,定位為與Elon Musk的Starlink競爭。OpenEuroLLM完美契合這一願景,專注於維護歐洲的技術自主。

資金與挑戰

儘管目標遠大,開發這些模型的預算為3740萬歐元,其中約2000萬歐元來自歐盟的數位歐洲計劃。與企業AI巨頭的投資相比,這筆金額顯得微不足道,儘管考慮到相關工作的資金後,總預算有所增加。費用中的重要部分是運算能力,OpenEuroLLM與西班牙、義大利、芬蘭和荷蘭的EuroHPC超級計算機中心合作,這些中心屬於總額70億歐元的EuroHPC項目。

參與者從學術界到企業的多樣性,引發了對項目可行性的質疑。LLM公司Pleias的共同創辦人Anastasia Stasenko對如此龐大的聯盟有效性表示懷疑,認為與更靈活、專注的私人AI公司如Mistral AI和LightOn相比,大型聯盟的反應速度較慢,她認為這些較小的團隊有更直接的責任感,能更快應對挑戰。

從頭開始還是利用現有成果?

OpenEuroLLM的起點有些模糊。自2022年起,Jan Hajič一直在協調高效能語言技術(HPLT)項目,該項目專注於使用高效能運算開發免費且可重複使用的數據集、模型和工作流程。該項目將於2025年底結束,與OpenEuroLLM共享許多合作夥伴,僅排除英國的參與者。

Hajič將HPLT視為OpenEuroLLM的前身,認為它在數據、專業知識、工具和運算經驗方面提供了堅實基礎。他預計OpenEuroLLM的首批版本將於2026年中發布,最終版本預計在2028年項目結束時完成。然而,項目的GitHub頁面仍顯空洞,顯示某些方面從頭開始。Hajič提到該項目於2024年2月1日正式啟動,經過一年的準備。

OpenEuroLLM聯盟包括來自捷克、荷蘭、德國、瑞典、芬蘭和挪威的組織,以及Silo AI、Aleph Alpha、Ellamind、Prompsit Language Engineering和LightOn等企業。值得注意的是,法國AI獨角獸Mistral未參與,儘管Hajič曾試圖與其對話。

目標與交付成果

該項目的主要目標是為歐洲打造透明AI的基礎模型系列,保留所有歐盟語言(當前和未來)的語言與文化多樣性。交付成果仍在最終確定中,但預計包括用於通用任務的核心多語言LLM,以及為高效邊緣應用設計的較小量化版本。

Hajič強調品質的重要性,表示鑑於高風險和公共資金的參與,項目旨在避免發布不成熟的解決方案。在數位資源有限的語言上實現同等熟練度仍是一個挑戰。項目計劃使用能準確代表這些語言和文化的基準。

HPLT項目的數據,包括來自網絡爬取的4.5拍字節數據集和超過200億份文件,將被使用,並補充來自Common Crawl的數據。

開源困境

關於AI中何為「開源」的爭論仍在繼續。開源促進會(OSI)已定義「開源AI」,但有些人認為這不僅應包括模型,還應包括數據集、預訓練模型和權重。OpenEuroLLM旨在「真正開源」,但Hajič承認,由於歐洲版權法和數據再分發限制,可能存在局限性。部分訓練數據可能需要保密,但根據歐盟AI法案可供審計。

與現有項目的重疊

OpenEuroLLM的推出與最近推出的EuroLLM相比,後者有相似目標且同樣由歐盟共同資助。EuroLLM於9月發布首個模型,12月發布後續模型,引發了關於冗餘和協作而非競爭的必要性討論。Unbabel研究負責人Andre Martins在社交媒體上強調了這些相似性,呼籲不同社群間的公開合作。

Hajič承認這種重疊令人遺憾,但表示希望合作,指出OpenEuroLLM的資金限制了與非歐盟實體(包括英國大學)的合作。

資金與期望

中國DeepSeek的出現,以其優越的成本效益比,引發了關於構建AI模型真實成本的疑問。OpenEuroLLM技術共同負責人Peter Sarlin表示,缺乏DeepSeek開發的詳細資訊,但他對OpenEuroLLM的資金充滿信心,主要涵蓋人員成本。運算費用預計由EuroHPC中心承擔。

Sarlin強調,OpenEuroLLM的目標不是打造消費或企業產品,而是為歐洲公司提供開源基礎模型作為AI基礎設施。他認為分配的預算是足夠的,基於他在Silo AI的經驗,該公司已開發支持多種歐洲語言的模型,並準備推出涵蓋所有歐洲語言的「Europa」模型。

數位主權與合作

儘管面臨挑戰和批評,Hajič對OpenEuroLLM這樣的合作項目潛力保持樂觀。他認為結合學術專業知識與企業焦點可能帶來創新成果。最終目標不是與科技巨頭或億美元AI初創公司競爭,而是通過開發由歐洲為歐洲打造的基礎LLM,增強歐洲的數位主權。

即使OpenEuroLLM未產生頂尖模型,Hajič認為擁有一個完全基於歐洲的「良好」模型,對大陸的技術自主仍有積極貢獻。

相關文章
Qodo與Google Cloud合作為開發者提供免費AI程式碼審查工具 Qodo與Google Cloud合作為開發者提供免費AI程式碼審查工具 Qodo,一家專注於程式碼品質的以色列AI編碼新創公司,與Google Cloud合作推出夥伴關係,以提升AI生成軟體的完整性。隨著企業越來越依賴AI進行編碼,對強大監督和品質保證工具的需求日益增長。Qodo執行長Itamar Friedman指出,AI生成程式碼現已成為現代開發的核心。「想像一個未來,AI撰寫所有程式碼;人類無法全部審查,」Friedman說。「我們需要系統確保程式碼符合預期價值
DeepMind的AI在2025年數學奧林匹克奪金 DeepMind的AI在2025年數學奧林匹克奪金 DeepMind的AI在數學推理上實現驚人突破,在2025年國際數學奧林匹克(IMO)奪得金牌,僅一年後即從2024年的銀牌躍升。此突破凸顯AI在解決需要人類創意的複雜抽象問題上的成長實力。本文探討DeepMind的轉型歷程、關鍵技術進展及此里程碑的廣泛影響。國際數學奧林匹克的重要性自1959年起,國際數學奧林匹克一直是全球頂尖的高中生數學競賽。它以代數、幾何、數論及組合數學的六道複雜題目挑戰參賽
AI驅動的視差製作工具:打造動態2.5D動畫 AI驅動的視差製作工具:打造動態2.5D動畫 將靜態圖像轉化為引人入勝的2.5D動畫,使用Parallax Maker。此開源工具賦予藝術家和遊戲開發者為其作品注入深度與動態的能力。透過利用Stability AI API,Parallax Maker確保即使在普通硬體上也能實現流暢的工作流程。探索此工具的功能以及如何提升您的創意項目。主要亮點Parallax Maker是一個用於製作2.5D動畫的開源解決方案。它將圖像轉化為與Blender
評論 (18)
0/200
StevenMartin
StevenMartin 2025-08-17 01:00:59

Wow, OpenEuroLLM sounds like a game-changer for Europe's tech scene! Building LLMs for all EU languages is ambitious—imagine the boost for local AI startups. But can they keep up with the big players like OpenAI? 🤔

PaulHill
PaulHill 2025-08-08 02:01:06

Super cool to see Europe pushing for open-source LLMs! Can't wait to see how OpenEuroLLM handles all those languages. 🌍

ElijahCollins
ElijahCollins 2025-07-23 12:59:29

Wow, OpenEuroLLM sounds like a game-changer for Europe’s tech scene! Building open-source LLMs for all EU languages is ambitious—imagine the possibilities for local businesses and multilingual AI apps. But I wonder, will they keep up with the pace of global AI giants? 🤔

PeterYoung
PeterYoung 2025-04-22 11:11:01

OpenEuroLLM sounds like a game-changer for Europe! Finally, we're getting open-source LLMs that cover all EU languages. It's about time we took control of our digital future. Can't wait to see how this develops! 🚀

CharlesThomas
CharlesThomas 2025-04-22 08:18:24

オープンソースのLLMがEU全言語に対応するなんて素晴らしい!これでデジタルの未来を自分たちでコントロールできるようになるね。どう発展していくか楽しみだよ!🌟

MatthewGonzalez
MatthewGonzalez 2025-04-22 08:16:04

OpenEuroLLM parece ser uma grande mudança para a Europa! Finalmente, LLMs de código aberto que cobrem todos os idiomas da UE. Está na hora de assumirmos o controle do nosso futuro digital. Mal posso esperar para ver como isso vai se desenvolver! 🚀

回到頂部
OR