オプション
ニュース
ヨーロッパのデジタル主権ロードマップに含まれるオープンソースLLM

ヨーロッパのデジタル主権ロードマップに含まれるオープンソースLLM

2025年4月17日
116

ヨーロッパのデジタル主権ロードマップに含まれるオープンソースLLM

先週、ヨーロッパのデジタル主権アジェンダは、欧州連合のすべての言語に対応する完全にオープンソースの大規模言語モデル(LLM)シリーズの開発を目指す新たなイニシアチブの発表により、大きな後押しを受けました。この野心的なプロジェクトは、OpenEuroLLMと名付けられ、EUの24の公式言語だけでなく、アルバニアのようなEU加盟交渉中の国の言語にも対応し、将来を見据えた取り組みを強調しています。

OpenEuroLLMは、約20の組織が参加する共同プロジェクトで、プラハのチャールズ大学の計算言語学者であるヤン・ハイチと、昨年AMDに6億6500万ドルで買収されたフィンランドのAIラボSilo AIのCEO兼共同創業者であるペーター・サルリンによって共同で主導されています。このイニシアチブは、ヨーロッパのデジタル主権に向けた広範な推進と一致し、重要なインフラやツールを大陸内に維持することを目指しています。この動きは、OpenAIのような主要なクラウドプロバイダーやAI企業が、EUのデータがヨーロッパの土壌に留まるようにローカルインフラに投資してきた行動を反映しています。

さらに、EUは最近、110億ドルの契約を結び、エロン・マスクのStarlinkの競争相手として位置づけられる主権衛星コンステレーションを確立しました。OpenEuroLLMは、ヨーロッパの技術的自治を維持することに焦点を当て、この物語に完全に適合します。

資金と課題

その野心的な目標にもかかわらず、モデルの開発に割り当てられた予算は3740万ユーロで、そのうち約2000万ユーロがEUのDigital Europe Programmeから拠出されています。この金額は、企業AI大手による投資に比べると見劣りしますが、関連する作業のための資金を考慮すると総予算は増加します。費用の大きな部分は計算能力で、OpenEuroLLMはスペイン、イタリア、フィンランド、オランダのEuroHPCスーパーコンピュータセンターと提携しており、これらは70億ユーロの広範なEuroHPCプロジェクトの一部です。

学術界から企業まで多様な参加者グループは、プロジェクトの実現可能性について疑問を投げかけています。LLM企業Pleiasの共同創業者であるアナスタシア・スタセンコは、Mistral AIやLightOnのようなより機敏で集中した民間AI企業と比較して、こうした大規模なコンソーシアムの効果に懐疑的な見方を示しました。彼女は、小規模なチームの方が責任が明確で、課題に対して迅速に対応できると主張しています。

ゼロから始めるか、既存の成果を活用するか?

OpenEuroLLMの出発点は若干曖昧です。2022年以来、ヤン・ハイチは高性能コンピューティングを使用して無料で再利用可能なデータセット、モデル、ワークフローを開発することに焦点を当てたHigh Performance Language Technologies(HPLT)プロジェクトを調整してきました。このプロジェクトは2025年後半に終了予定で、OpenEuroLLMと多くのパートナーを共有していますが、英国のパートナーは除外されています。

ハイチはHPLTをOpenEuroLLMの前身と見ており、データ、専門知識、ツール、計算経験の強固な基盤を提供すると考えています。彼は2026年半ばまでにOpenEuroLLMの初版をリリースし、2028年のプロジェクト終了までに最終版をリリースする予定です。しかし、プロジェクトのGitHubプロフィールはまだ内容が少なく、一部の面ではゼロから始めることを示しています。ハイチは、プロジェクトが2024年2月1日に正式に開始され、1年間の準備期間を経たと述べました。

OpenEuroLLMコンソーシアムには、チェコ、オランダ、ドイツ、スウェーデン、フィンランド、ノルウェーの組織や、Silo AI、Aleph Alpha、Ellamind、Prompsit Language Engineering、LightOnなどの企業が含まれています。注目すべきは、ハイチが参加を求めたにもかかわらず、フランスのAIユニコーンであるMistralが含まれていないことです。

目標と成果物

プロジェクトの主な目的は、現在のそして将来のすべてのEU言語の言語的および文化的多様性を保持し、ヨーロッパでの透明なAIのための基礎モデルのシリーズを作成することです。成果物はまだ最終化されていませんが、汎用タスクのためのコア多言語LLMと、効率が重要なエッジアプリケーション向けの小型で量子化されたバージョンが含まれる予定です。

ハイチは品質の重要性を強調し、プロジェクトが高額な公的資金が関与しているため、中途半端なソリューションをリリースすることを避けることを目指していると述べました。デジタルリソースが限られた言語での同等の熟練度を達成することは課題であり、プロジェクトはこれらの言語と文化を正確に反映するベンチマークを使用する予定です。

HPLTプロジェクトのデータ、ウェブクロールからの4.5ペタバイトのデータセットや200億以上のドキュメントを含むデータが利用され、Common Crawlからのデータで補完されます。

オープンソースのジレンマ

AIにおける「オープンソース」の定義についての議論は続いています。Open Source Initiative(OSI)は「オープンソースAI」を定義しましたが、一部はモデルだけでなく、データセット、事前学習済みモデル、ウェイトも含めるべきだと主張しています。OpenEuroLLMは「真にオープン」であることを目指していますが、ハイチはヨーロッパの著作権法やデータ再配布の制限による潜在的な制約を認めています。一部のトレーニングデータは、EU AI法に基づいて監査のために利用可能であるが、機密保持が必要な場合があります。

既存プロジェクトとの重複

OpenEuroLLMの開始は、類似の目標を持ち、EUが共同出資する最近開始されたEuroLLMと比較されています。EuroLLMは9月に初モデルをリリースし、12月に続編をリリースし、冗長性や競争ではなく協力の必要性についての懸念を引き起こしました。Unbabelの研究責任者であるアンドレ・マルティンスは、ソーシャルメディアでこれらの類似性を指摘し、異なるコミュニティ間でのオープンな協力を求めました。

ハイチはこの不幸な重複を認めましたが、協力への希望を表明し、OpenEuroLLMの資金制限により英国の大学を含む非EU団体との協力が制限されていると述べました。

資金と期待

中国のDeepSeekの有望なコストパフォーマンス比の出現は、AIモデル構築の真のコストについて疑問を投げかけています。OpenEuroLLMの技術共同リーダーであるペーター・サルリンは、DeepSeekの開発に関する詳細な情報の不足を指摘しましたが、OpenEuroLLMの資金、主に人件費をカバーするものに自信を持っています。計算費用はEuroHPCセンターによってカバーされる予定です。

サルリンは、OpenEuroLLMが消費者向けや企業向けの製品を作成することを目指しておらず、ヨーロッパの企業向けのAIインフラとしてオープンソースの基礎モデルを提供することを強調しました。彼は、割り当てられた予算がこの目的に十分であると考え、Silo AIでの経験を引用し、すでにいくつかのヨーロッパ言語をサポートするモデルを開発し、すべてのヨーロッパ言語をカバーする「Europa」モデルの立ち上げを準備しています。

デジタル主権と協力

課題や批判にもかかわらず、ハイチはOpenEuroLLMのような共同プロジェクトの可能性に楽観的です。彼は、学術的専門知識と企業の焦点を組み合わせることで、革新的な成果が得られると信じています。最終的な目標は、ビッグテックや数十億ドルのAIスタートアップと競争することではなく、ヨーロッパによる、ヨーロッパのための基礎LLMを開発することで、ヨーロッパのデジタル主権を強化することです。

OpenEuroLLMが最高性能のモデルを生み出さなかったとしても、ハイチは完全にヨーロッパに拠点を置く「良い」モデルを持つことの価値を見出し、大陸の技術的自治に積極的に貢献します。

関連記事
AI駆動の音楽作成:楽曲とビデオを簡単に制作 AI駆動の音楽作成:楽曲とビデオを簡単に制作 音楽作成は時間、資源、専門知識を必要とする複雑なプロセスです。人工知能はこのプロセスを変革し、シンプルで誰でも利用できるものにしました。このガイドでは、AIがどのようにして誰でも無料でユニークな楽曲やビジュアルを制作できるようにするか、新たな創造的可能性を解き放つ方法を紹介します。直感的で使いやすいインターフェースと先進的なAIを備えたプラットフォームを探索し、音楽のアイデアを高コストなしで現実に
AI駆動の塗り絵ブック作成:包括的ガイド AI駆動の塗り絵ブック作成:包括的ガイド 塗り絵ブックのデザインは、芸術的表現とユーザーのリラックス体験を組み合わせた報われる追求です。しかし、そのプロセスは労働集約的です。幸い、AIツールは高品質で均一な塗り絵ページを簡単に作成できます。このガイドは、AIを使用して一貫したスタイルと最適な効率に焦点を当てた塗り絵ブック作成のステップごとのアプローチを提供します。主なポイントAIプロンプトツールを使用して、詳細で構造化された塗り絵ページの
QodoがGoogle Cloudと提携し、開発者向け無料AIコードレビューを提供 QodoがGoogle Cloudと提携し、開発者向け無料AIコードレビューを提供 Qodo、イスラエル拠点のAIコーディングスタートアップは、コード品質に焦点を当て、Google Cloudと提携し、AI生成ソフトウェアの完全性を強化。企業がコーディングにAIをますます活用する中、堅牢な監視と品質保証ツールの需要が増加。QodoのCEOイタマール・フリードマンは、AI生成コードが現代の開発の中心であると指摘。「AIがすべてのコードを書く未来を想像してください。人間がすべてをレビ
コメント (18)
0/200
StevenMartin
StevenMartin 2025年8月17日 2:00:59 JST

Wow, OpenEuroLLM sounds like a game-changer for Europe's tech scene! Building LLMs for all EU languages is ambitious—imagine the boost for local AI startups. But can they keep up with the big players like OpenAI? 🤔

PaulHill
PaulHill 2025年8月8日 3:01:06 JST

Super cool to see Europe pushing for open-source LLMs! Can't wait to see how OpenEuroLLM handles all those languages. 🌍

ElijahCollins
ElijahCollins 2025年7月23日 13:59:29 JST

Wow, OpenEuroLLM sounds like a game-changer for Europe’s tech scene! Building open-source LLMs for all EU languages is ambitious—imagine the possibilities for local businesses and multilingual AI apps. But I wonder, will they keep up with the pace of global AI giants? 🤔

PeterYoung
PeterYoung 2025年4月22日 12:11:01 JST

OpenEuroLLM sounds like a game-changer for Europe! Finally, we're getting open-source LLMs that cover all EU languages. It's about time we took control of our digital future. Can't wait to see how this develops! 🚀

CharlesThomas
CharlesThomas 2025年4月22日 9:18:24 JST

オープンソースのLLMがEU全言語に対応するなんて素晴らしい!これでデジタルの未来を自分たちでコントロールできるようになるね。どう発展していくか楽しみだよ!🌟

MatthewGonzalez
MatthewGonzalez 2025年4月22日 9:16:04 JST

OpenEuroLLM parece ser uma grande mudança para a Europa! Finalmente, LLMs de código aberto que cobrem todos os idiomas da UE. Está na hora de assumirmos o controle do nosso futuro digital. Mal posso esperar para ver como isso vai se desenvolver! 🚀

トップに戻ります
OR