欧洲数字主权路线图中包含的开源LLM

首页

新闻

欧洲数字主权路线图中包含的开源LLM

2025-04-17

AnthonyMartinez

224

欧洲数字主权路线图中包含的开源LLM

上周，欧洲的数字主权议程因一项新举措的宣布而获得显著推动，该举措旨在开发一系列完全开源的大型语言模型（LLM），覆盖所有欧盟语言。这一雄心勃勃的项目，名为OpenEuroLLM，不仅针对24种欧盟官方语言，还扩展到正在谈判加入欧盟的国家（如阿尔巴尼亚）的语言，强调未来保障。

OpenEuroLLM是一个由大约20个组织协作的项目，由布拉格查理大学的计算语言学家Jan Hajič和芬兰AI实验室Silo AI的首席执行官兼联合创始人Peter Sarlin共同领导，Silo AI去年被AMD以6.65亿美元收购。该举措与欧洲推动数字主权的更广泛目标一致，旨在将关键基础设施和工具保留在欧洲大陆。这一行动与主要云提供商和AI公司（如OpenAI）的举措相呼应，这些公司一直在投资本地基础设施，以确保欧盟数据留在欧洲土壤上。

此外，欧盟最近签署了一项110亿美元的协议，建立主权卫星星座，定位为埃隆·马斯克的Starlink的竞争者。OpenEuroLLM完美契合这一叙事，专注于维护欧洲的技术自主权。

资金与挑战

尽管目标雄心勃勃，用于开发模型的预算为3740万欧元，其中约2000万欧元来自欧盟的数字欧洲计划。这一金额与企业AI巨头的投资相比显得微不足道，尽管考虑相关工作的资金后总预算有所增加。计算能力是一项重大开支，OpenEuroLLM与西班牙、意大利、芬兰和荷兰的EuroHPC超级计算机中心合作，这些中心是70亿欧元更广泛EuroHPC项目的一部分。

参与者群体多样，从学术界到企业，引发了关于项目可行性的疑问。LLM公司Pleias的联合创始人Anastasia Stasenko对如此大型联合体的有效性表示怀疑，认为相比之下，Mistral AI和LightOn等更敏捷、专注的私人AI公司具有更直接的责任感，能更快应对挑战。

从零开始还是利用现有成果？

OpenEuroLLM的起点有些模糊。自2022年以来，Jan Hajič一直在协调高性能语言技术（HPLT）项目，专注于使用高性能计算开发免费且可重复使用的数据集、模型和工作流程。该项目将于2025年底结束，与OpenEuroLLM共享许多合作伙伴，英国的除外。

Hajič将HPLT视为OpenEuroLLM的前身，认为它在数据、专业知识、工具和计算经验方面提供了坚实基础。他预计到2026年中发布OpenEuroLLM的首个版本，项目预计于2028年结束时发布最终版本。然而，项目的GitHub页面仍然内容稀疏，表明在某些方面是从零开始。Hajič提到，项目于2024年2月1日正式启动，此前准备了一年。

OpenEuroLLM联合体包括来自捷克、荷兰、德国、瑞典、芬兰和挪威的组织，以及Silo AI、Aleph Alpha、Ellamind、Prompsit Language Engineering和LightOn等企业实体。值得注意的是，尽管Hajič试图与法国AI独角兽Mistral进行讨论，但Mistral并未参与。

目标与交付成果

项目的主要目标是为欧洲的透明AI创建一系列基础模型，保留所有欧盟语言（当前和未来）的语言和文化多样性。交付成果仍在最终确定中，但预计包括用于通用任务的核心多语言LLM，以及为边缘应用优化的更小、量化版本，效率是关键。

Hajič强调了质量的重要性，表示鉴于高风险和公共资金的参与，项目旨在避免发布不成熟的解决方案。在数字资源有限的语言上实现同等熟练度仍是一个挑战。项目计划使用能准确代表这些语言和文化的基准。

来自HPLT项目的数据，包括从网络爬取的4.5拍字节数据集和超过200亿份文档，将被使用，并补充来自Common Crawl的数据。

开源困境

关于AI中“开源”定义的争论仍在继续。开源倡议（OSI）已定义了“开源AI”，但一些人认为它不仅应包括模型，还应包括数据集、预训练模型和权重。OpenEuroLLM旨在实现“真正开源”，但Hajič承认，由于欧洲版权法和数据重新分发的限制，可能存在局限性。一些训练数据可能需要保密，但根据欧盟AI法案可供审计。

与现有项目的重叠

OpenEuroLLM的推出引发了与最近推出的EuroLLM的比较，后者目标相似，也由欧盟共同资助。EuroLLM在9月发布了首个模型，12月发布了后续模型，引发了关于冗余和协作而非竞争的必要性的担忧。Unbabel研究负责人Andre Martins在社交媒体上强调了这些相似之处，呼吁不同社区之间进行开放协作。

Hajič承认这种重叠令人遗憾，但表示希望合作，指出OpenEuroLLM的资金限制了与非欧盟实体（包括英国大学）的合作。

资金与期望

中国DeepSeek的出现以其出色的性价比引发了关于构建AI模型真实成本的疑问。OpenEuroLLM的技术联合负责人Peter Sarlin指出，DeepSeek的开发细节信息不足，但他对OpenEuroLLM的资金充满信心，主要用于人员成本。计算费用预计由EuroHPC中心承担。

Sarlin强调，OpenEuroLLM的目标不是创建消费者或企业产品，而是为欧洲公司提供开源基础模型作为AI基础设施。他认为分配的预算足以实现这一目标，基于他在Silo AI的经验，该公司已开发支持多种欧洲语言的模型，并准备推出覆盖所有欧洲语言的“Europa”模型。

数字主权与协作

尽管面临挑战和批评，Hajič对OpenEuroLLM等协作项目的潜力保持乐观。他认为，结合学术专长和企业专注可能带来创新成果。最终目标不是与大型科技公司或数十亿美元的AI初创公司竞争，而是通过开发由欧洲为欧洲构建的基础LLM来增强欧洲的数字主权。

即使OpenEuroLLM未产生性能最佳的模型，Hajič认为拥有一个完全基于欧洲的“良好”模型仍有价值，为欧洲大陆的技术自主权作出积极贡献。

解读新的ETSI人工智能安全标准 ETSI EN 304 223 确立了人工智能的基础安全要求，各组织应将其纳入其治理架构中。随着企业将机器学习融入核心工作流程，该欧洲标准为保护人工智能模型和系统提供了具体规定。这是首个适用于全球的人工智能网络安全欧洲标准，已获得各国国家标准化机构的正式批准，从而增强了其在国际市场上的公信力。作为《欧盟人工智能法案》的补充基准，该标准承认人工智能系统存在独特风险——包括数据中毒、模型混淆和间接提示

Gmail 推出个性化 AI 收件箱、搜索中的 AI 概览等功能谷歌为Gmail推出了一款全新的AI智能收件箱，它能为您提供个性化的任务概览，并让您及时掌握重要更新。此外，Gmail还在搜索功能中推出了AI概览，并新增了一款类似Grammarly的校对工具。此前仅限付费用户使用的多项AI功能，现已向所有用户开放。新的“AI收件箱”标签页包含两个部分：“建议待办事项”和“待跟进主题”。第一个部分显示需要采取行动的高优先级邮件摘要——例如，关于明天到期的账单提醒

首家百度AI影视剧创作基地在山东淄博正式启动 4月27日，山东省在数字文化创作领域迈出了重要一步，其首个百度AI漫画剧创作基地在淄博师范学院正式揭牌。该基地标志着校企合作开启了新篇章，旨在通过人工智能技术与文化创作教育的深度融合，探索培养数字文化创作人才的创新模式。在揭牌仪式上，校方代表强调，该基地将成为创新人才培养及深化政校企合作的重要平台。展望未来，该校计划将真实项目案例引入课堂，摒弃传统教学方法，构建一个完整的项目化教学闭环，将“作业

相关专题推荐

漫画创作

AI角色创建工具：为漫画主角生成详细的背景故事及视觉参考资料

2026年最新最佳AI角色创建工具：发现那些备受好评的工具，它们能够帮助你为漫画角色生成详细的背景故事和视觉素材。我们精心整理的这份每周更新的列表会根据实际测试结果，对比免费与付费选项的优劣。找到这些强大且能改变创作流程的工具，帮助你塑造引人入胜的角色，提升创作效率。立即访问XIX.AI查看排名，找到最适合你的故事创作助手吧。

10 个工具

xix.ai

健康养生

AI孕期伴侣：生成安全可靠的各孕期运动与营养计划

探索2026年最佳AI孕期伴侣，获取安全、个性化的各孕期运动与营养计划。获取经过精心筛选的高评分推荐，包含免费与付费版本的对比分析及真实用户反馈。借助XIX.AI的专家指南，开启您最健康的孕期之旅。立即探索。

10 个工具

xix.ai

写作

最佳免费且无法被识别的AI写作工具：将生硬的草稿转化为自然流畅、宛如人类撰写的文字

在 XIX.AI 探索 2026 年最佳免费且难以被察觉的 AI 写作工具。我们精心筛选的顶级推荐清单，助您将生硬的草稿转化为自然流畅、宛如人类撰写的文字。通过实际测试和每周更新的排行榜，对比免费与付费选项。立即解锁您的 AI 写作优势。

10 个工具

xix.ai

图像编辑

用于短剧故事板的AI艺术生成工具：幻想与都市浪漫题材的角色设计

2026最新推荐：探索最适合用于短剧故事板制作的AI艺术生成工具。我们精心挑选了众多顶级工具，帮助您创作出引人入胜的幻想角色和都市浪漫角色。您可以对比免费与付费选项，查看实际测试结果，从而找到最适合自己的创意工具。XIX.AI还会每周更新排名并提供专家分析，让您立即开始将故事可视化呈现吧！

10 个工具

xix.ai

写作

最适合广播和播客使用的AI脚本编写工具：帮助您创作引人入胜的音频广告

在XIX.AI上，发现2026年最适合用于广播和播客制作的AI脚本工具。我们精心挑选的这些高评分工具能够提供强大的功能，帮助您快速制作出引人入胜的音频广告。通过实际测试和每周更新的排名，您可以了解免费选项与付费选项之间的差异。今天就释放您的创造力吧！

10 个工具

xix.ai

商业

最佳 AI 合同审查软件：即时发现法律漏洞与合规风险

在 XIX.AI 上探索 2026 年最佳 AI 合同审查软件。我们精心筛选的顶级榜单汇集了功能强大的工具，能够即时发现法律漏洞和合规风险。通过实际测试和每周更新的排名，对比免费与付费选项。找到能彻底改变游戏规则的解决方案，实现安全、高效的合同分析。立即探索这本权威指南。

10 个工具

xix.ai

0/500

请登录后再操作

EdwardJackson

2026-03-25 16:00:43

A bold plan, but the practicality worries me. Training LLMs for dozens of languages with nuanced cultural contexts sounds massively resource-intensive. Can this truly compete with existing centralized models, or will it be more of a symbolic sovereignty project?

JosephWalker

2026-03-25 16:00:43

看到欧洲也要搞自己的开源大模型，有点意思！不过OpenEuroLLM真能做到覆盖所有欧盟语言吗？成本和技术难度想想都吓人，希望别最后成了个半吊子项目

AlbertThomas

2026-03-25 16:00:43

Iniciativa bacana, mas será que a Europa vai conseguir acompanhar o ritmo de IA quando o foco é espalhar os recursos por tantos idiomas? 🤔 Pode ficar defasado antes de ficar pronto...

RonaldWilliams

2026-02-04 20:00:27

欧洲在AI基础设施上的自主布局确实明智，开源大语言模型能降低对单一技术供应商的依赖，不过资金和人才招募可能会是现实挑战。希望这个OpenEuroLLM项目能真正考虑小语种使用者的需求，而不仅仅是英法德这些主流语言 🌍

JustinAnderson

2025-12-31 00:30:57

¡Vaya, esto sí es interesante! Un modelo de IA europeo y de código abierto... ¿Será la respuesta a la dependencia tecnológica que tenemos con EE.UU. y China? Me pregunto si realmente tendrá la misma potencia que los modelos cerrados de las grandes empresas. 🤔 Si logran cubrir todos los idiomas de la UE, sería un logro enorme para la diversidad cultural digital. ¡Ojalá vaya más allá de lo político y tenga un impacto real! 😊

StevenMartin

2025-08-17 01:00:59

Wow, OpenEuroLLM sounds like a game-changer for Europe's tech scene! Building LLMs for all EU languages is ambitious—imagine the boost for local AI startups. But can they keep up with the big players like OpenAI? 🤔

头条新闻

AI Builder和Power Automate革新文档摘要 AI寄主Notebooklm播客现已上中国发布人形机器人及具身智能国家标准 Ramp 数据显示企业人工智能应用趋于平稳 Bing图像创建者教程：AI艺术生成指南学习使用您的声音创建AI音乐：逐步Suno教程 iMyFone MagicMic：实时AI变声器评测与教程 2025顶级AI视频生成器：Pika Labs与其他对比 Embodied Intelligence 发布首个行业标准，旨在遏制无序增长 DeepSeek V4 作为多模态人工智能变革者横空出世

精选