유럽의 디지털 주권 로드맵에 포함 된 오픈 소스 LLM

지난주, 유럽의 디지털 주권 의제가 유럽 연합의 모든 언어를 지원하는 완전 오픈소스 대규모 언어 모델(LLM) 시리즈 개발을 목표로 하는 새로운 이니셔티브 발표로 큰 진전을 이루었다. OpenEuroLLM이라 불리는 이 야심찬 프로젝트는 24개 공식 EU 언어뿐만 아니라 알바니아와 같이 EU 가입을 협상 중인 국가들의 언어도 포함하여 미래 지향적인 접근을 강조한다.
OpenEuroLLM은 약 20개 조직이 참여하는 협력 프로젝트로, 프라하의 찰스 대학교의 계산 언어학자인 얀 하이치(Jan Hajič)와 지난 해 AMD가 6억 6,500만 달러에 인수한 핀란드 AI 연구소 Silo AI의 CEO이자 공동 설립자인 페터 사를린(Peter Sarlin)이 공동으로 이끌고 있다. 이 이니셔티브는 중요한 인프라와 도구를 유럽 내에 유지하려는 유럽의 광범위한 디지털 주권 추진과 일치한다. 이는 OpenAI와 같은 주요 클라우드 제공업체 및 AI 기업들이 EU 데이터가 유럽 토양에 남아 있도록 지역 인프라에 투자해온 행동을 반영한다.
또한, EU는 최근 110억 달러 규모의 주권 위성 군집을 구축하는 계약을 체결하며 일론 머스크의 Starlink와 경쟁자로 자리 잡았다. OpenEuroLLM은 유럽의 기술 자율성을 유지하는 데 초점을 맞추며 이 내러티브에 완벽히 부합한다.
자금과 도전 과제
야심찬 목표에도 불구하고, 모델 개발에 할당된 예산은 3,740만 유로로, 이 중 약 2,000만 유로는 EU의 디지털 유럽 프로그램에서 나온다. 이 금액은 기업 AI 거대 기업들의 투자에 비하면 미미하지만, 관련 작업에 대한 자금 지원을 고려하면 전체 예산은 증가한다. 비용의 상당 부분은 컴퓨팅 파워에 사용되며, OpenEuroLLM은 스페인, 이탈리아, 핀란드, 네덜란드에 있는 EuroHPC 슈퍼컴퓨터 센터와 파트너십을 맺고 있으며, 이는 70억 유로 규모의 EuroHPC 프로젝트의 일부이다.
학계에서 기업에 이르는 다양한 참여자 그룹은 프로젝트의 실행 가능성에 대한 의문을 제기한다. LLM 회사 Pleias의 공동 설립자인 아나스타시아 스타센코(Anastasia Stasenko)는 Mistral AI나 LightOn과 같은 더 민첩하고 집중적인 민간 AI 기업에 비해 대규모 컨소시엄의 효율성에 대해 회의적인 입장을 표명했다. 그녀는 소규모 팀이 더 직접적인 책임을 지고 도전 과제에 더 신속히 대응할 수 있다고 주장한다.
처음부터 시작인가, 기존 작업 활용인가?
OpenEuroLLM의 출발점은 다소 모호하다. 2022년부터 얀 하이치(Jan Hajič)는 고성능 컴퓨팅을 사용해 자유롭고 재사용 가능한 데이터셋, 모델, 워크플로우를 개발하는 고성능 언어 기술(HPLT) 프로젝트를 조정해왔다. 2025년 말에 종료될 예정인 이 프로젝트는 영국을 제외한 OpenEuroLLM의 많은 파트너를 공유한다.
하이치는 HPLT를 OpenEuroLLM의 전신으로 보고, 데이터, 전문성, 도구, 컴퓨팅 경험에서 견고한 기반을 제공한다고 언급했다. 그는 2026년 중반까지 OpenEuroLLM의 첫 번째 버전을 출시하고, 2028년 프로젝트 종료 시 최종 버전을 기대한다. 그러나 프로젝트의 GitHub 프로필은 여전히 빈약하여 일부 측면에서 처음부터 시작하는 것임을 나타낸다. 하이치는 프로젝트가 1년간의 준비 끝에 2024년 2월 1일에 공식적으로 시작되었다고 언급했다.
OpenEuroLLM 컨소시엄에는 체코, 네덜란드, 독일, 스웨�, 핀란드, 노르웨이의 조직과 Silo AI, Aleph Alpha, Ellamind, Prompsit Language Engineering, LightOn과 같은 기업이 포함된다. 프랑스의 AI 유니콘 Mistral은 하이치가 논의에 참여시키려 했음에도 불구하고 눈에 띄게 제외되었다.
목표와 결과물
프로젝트의 주요 목표는 유럽의 투명한 AI를 위한 일련의 기반 모델을 만들어 현재와 미래의 모든 EU 언어의 언어적, 문화적 다양성을 보존하는 것이다. 결과물은 아직 최종 확정 중이지만, 범용 작업을 위한 핵심 다국어 LLM과 효율성이 중요한 엣지 애플리케이션을 위한 더 작은 양자화 버전이 포함될 것으로 예상된다.
하이치는 품질의 중요성을 강조하며, 높은 이해관계와 공공 자금이 투입된 만큼 미완성 솔루션을 출시하지 않으려 한다고 밝혔다. 디지털 자원이 제한된 언어에서도 동등한 숙련도를 달성하는 것은 여전히 도전 과제다. 프로젝트는 이러한 언어와 문화를 정확히 반영하는 벤치마크를 사용할 계획이다.
HPLT 프로젝트의 데이터, 웹 크롤링에서 얻은 4.5페타바이트 데이터셋과 200억 개 이상의 문서를 포함하여 Common Crawl의 데이터를 보완하여 사용할 예정이다.
오픈소스 딜레마
AI에서 "오픈소스"가 무엇을 의미하는지에 대한 논쟁은 계속되고 있다. 오픈소스 이니셔티브(OSI)는 "오픈소스 AI"를 정의했지만, 일부는 모델뿐만 아니라 데이터셋, 사전 훈련된 모델, 가중치도 포함해야 한다고 주장한다. OpenEuroLLM은 "진정한 오픈소스"를 목표로 하지만, 하이치는 유럽 저작권법과 데이터 재배포 제한으로 인해 잠재적 한계가 있을 수 있다고 인정했다. 일부 훈련 데이터는 EU AI법에 따라 감사용으로만 제공되며 기밀로 유지되어야 할 수 있다.
기존 프로젝트와의 중복
OpenEuroLLM의 출시는 비슷한 목표를 공유하고 EU가 공동 자금을 지원하는 EuroLLM의 최근 출시와 비교되었다. EuroLLM은 9월에 첫 번째 모델을, 12월에 후속 모델을 출시하며 중복과 협력 필요성에 대한 우려를 불러일으켰다. Unbabel의 연구 책임자인 안드레 마르틴스(Andre Martins)는 소셜 미디어에서 이러한 유사성을 강조하며, 서로 다른 커뮤니티 간의 공개 협력을 촉구했다.
하이치는 불행한 중복을 인정했지만, OpenEuroLLM의 자금 제한으로 인해 영국 대학을 포함한 비EU 단체와의 협력이 제한된다고 언급하며 협력에 대한 희망을 표명했다.
자금과 기대
중국의 DeepSeek의 유망한 비용 대비 성능 비율의 등장으로 AI 모델 구축의 실제 비용에 대한 질문이 제기되었다. OpenEuroLLM의 기술 공동 책임자인 페터 사를린은 DeepSeek의 개발에 대한 세부 정보가 부족하지만, 주로 인건비를 충당하는 OpenEuroLLM의 자금에 대해 자신감을 표했다. 컴퓨팅 비용은 EuroHPC 센터에서 충당될 것으로 예상된다.
사를린은 OpenEuroLLM이 소비자나 기업 제품을 만드는 것을 목표로 하지 않고, 유럽 기업을 위한 AI 인프라로 오픈소스 기반 모델을 제공하려 한다고 강조했다. 그는 이미 여러 유럽 언어를 지원하는 모델을 개발하고 모든 유럽 언어를 포괄하는 "Europa" 모델을 출시할 준비를 하고 있는 Silo AI의 경험을 바탕으로 할당된 예산이 이 목적에 충분하다고 믿는다.
디지털 주권과 협력
도전과 비판에도 불구하고, 하이치는 OpenEuroLLM과 같은 협력 프로젝트의 잠재력에 대해 낙관적이다. 그는 학계의 전문성과 기업의 집중력을 결합하면 혁신적인 결과를 낳을 수 있다고 믿는다. 궁극적인 목표는 빅테크나 수십억 달러 규모의 AI 스타트업과 경쟁하는 것이 아니라, 유럽이 유럽을 위해 구축한 기반 LLM을 개발함으로써 유럽의 디지털 주권을 강화하는 것이다.
OpenEuroLLM이 최고 성능의 모델을 만들어내지 못하더라도, 하이치는 유럽에 완전히 기반을 둔 "좋은" 모델을 갖는 것이 대륙의 기술 자율성에 긍정적으로 기여할 가치가 있다고 본다.
관련 기사
Qodo, Google Cloud와 협력하여 개발자를 위한 무료 AI 코드 리뷰 도구 제공
코드 품질에 초점을 맞춘 이스라엘 기반 AI 코딩 스타트업 Qodo가 Google Cloud와 파트너십을 시작하여 AI로 생성된 소프트웨어의 무결성을 강화했습니다.기업들이 코딩에 AI를 점점 더 많이 의존함에 따라, 강력한 감독 및 품질 보증 도구에 대한 수요가 증가하고 있습니다.Qodo의 CEO Itamar Friedman은 AI로 생성된 코드가 현대 개
DeepMind의 AI가 2025 수학 올림피아드에서 금메달 획득
DeepMind의 AI는 수학적 추론에서 놀라운 도약을 이루어, 2024년에 은메달을 획득한 지 불과 1년 만에 2025 국제수학올림피아드(IMO)에서 금메달을 차지했습니다. 이 돌파구는 인간과 같은 창의력이 요구되는 복잡하고 추상적인 문제를 해결하는 AI의 성장하는 능력을 강조합니다. 이 기사에서는 DeepMind의 변혁적 여정, 주요 기술적 발전, 그리
AI로 구동되는 패럴랙스 메이커: 역동적인 2.5D 애니메이션 제작
정적인 이미지를 매혹적인 2.5D 애니메이션으로 변환하세요. 이 오픈 소스 도구는 아티스트와 게임 개발자가 자신의 작업에 깊이와 움직임을 더할 수 있도록 지원합니다. Stability AI API를 활용하여 Parallax Maker는 저사양 하드웨어에서도 원활한 워크플로우를 보장합니다. 이 도구의 기능과 창의적인 프로젝트를 어떻게 향상시킬 수 있는지 알아
의견 (18)
0/200
StevenMartin
2025년 8월 17일 오전 2시 0분 59초 GMT+09:00
Wow, OpenEuroLLM sounds like a game-changer for Europe's tech scene! Building LLMs for all EU languages is ambitious—imagine the boost for local AI startups. But can they keep up with the big players like OpenAI? 🤔
0
PaulHill
2025년 8월 8일 오전 3시 1분 6초 GMT+09:00
Super cool to see Europe pushing for open-source LLMs! Can't wait to see how OpenEuroLLM handles all those languages. 🌍
0
ElijahCollins
2025년 7월 23일 오후 1시 59분 29초 GMT+09:00
Wow, OpenEuroLLM sounds like a game-changer for Europe’s tech scene! Building open-source LLMs for all EU languages is ambitious—imagine the possibilities for local businesses and multilingual AI apps. But I wonder, will they keep up with the pace of global AI giants? 🤔
0
PeterYoung
2025년 4월 22일 오후 12시 11분 1초 GMT+09:00
OpenEuroLLM sounds like a game-changer for Europe! Finally, we're getting open-source LLMs that cover all EU languages. It's about time we took control of our digital future. Can't wait to see how this develops! 🚀
0
CharlesThomas
2025년 4월 22일 오전 9시 18분 24초 GMT+09:00
オープンソースのLLMがEU全言語に対応するなんて素晴らしい!これでデジタルの未来を自分たちでコントロールできるようになるね。どう発展していくか楽しみだよ!🌟
0
MatthewGonzalez
2025년 4월 22일 오전 9시 16분 4초 GMT+09:00
OpenEuroLLM parece ser uma grande mudança para a Europa! Finalmente, LLMs de código aberto que cobrem todos os idiomas da UE. Está na hora de assumirmos o controle do nosso futuro digital. Mal posso esperar para ver como isso vai se desenvolver! 🚀
0
지난주, 유럽의 디지털 주권 의제가 유럽 연합의 모든 언어를 지원하는 완전 오픈소스 대규모 언어 모델(LLM) 시리즈 개발을 목표로 하는 새로운 이니셔티브 발표로 큰 진전을 이루었다. OpenEuroLLM이라 불리는 이 야심찬 프로젝트는 24개 공식 EU 언어뿐만 아니라 알바니아와 같이 EU 가입을 협상 중인 국가들의 언어도 포함하여 미래 지향적인 접근을 강조한다.
OpenEuroLLM은 약 20개 조직이 참여하는 협력 프로젝트로, 프라하의 찰스 대학교의 계산 언어학자인 얀 하이치(Jan Hajič)와 지난 해 AMD가 6억 6,500만 달러에 인수한 핀란드 AI 연구소 Silo AI의 CEO이자 공동 설립자인 페터 사를린(Peter Sarlin)이 공동으로 이끌고 있다. 이 이니셔티브는 중요한 인프라와 도구를 유럽 내에 유지하려는 유럽의 광범위한 디지털 주권 추진과 일치한다. 이는 OpenAI와 같은 주요 클라우드 제공업체 및 AI 기업들이 EU 데이터가 유럽 토양에 남아 있도록 지역 인프라에 투자해온 행동을 반영한다.
또한, EU는 최근 110억 달러 규모의 주권 위성 군집을 구축하는 계약을 체결하며 일론 머스크의 Starlink와 경쟁자로 자리 잡았다. OpenEuroLLM은 유럽의 기술 자율성을 유지하는 데 초점을 맞추며 이 내러티브에 완벽히 부합한다.
자금과 도전 과제
야심찬 목표에도 불구하고, 모델 개발에 할당된 예산은 3,740만 유로로, 이 중 약 2,000만 유로는 EU의 디지털 유럽 프로그램에서 나온다. 이 금액은 기업 AI 거대 기업들의 투자에 비하면 미미하지만, 관련 작업에 대한 자금 지원을 고려하면 전체 예산은 증가한다. 비용의 상당 부분은 컴퓨팅 파워에 사용되며, OpenEuroLLM은 스페인, 이탈리아, 핀란드, 네덜란드에 있는 EuroHPC 슈퍼컴퓨터 센터와 파트너십을 맺고 있으며, 이는 70억 유로 규모의 EuroHPC 프로젝트의 일부이다.
학계에서 기업에 이르는 다양한 참여자 그룹은 프로젝트의 실행 가능성에 대한 의문을 제기한다. LLM 회사 Pleias의 공동 설립자인 아나스타시아 스타센코(Anastasia Stasenko)는 Mistral AI나 LightOn과 같은 더 민첩하고 집중적인 민간 AI 기업에 비해 대규모 컨소시엄의 효율성에 대해 회의적인 입장을 표명했다. 그녀는 소규모 팀이 더 직접적인 책임을 지고 도전 과제에 더 신속히 대응할 수 있다고 주장한다.
처음부터 시작인가, 기존 작업 활용인가?
OpenEuroLLM의 출발점은 다소 모호하다. 2022년부터 얀 하이치(Jan Hajič)는 고성능 컴퓨팅을 사용해 자유롭고 재사용 가능한 데이터셋, 모델, 워크플로우를 개발하는 고성능 언어 기술(HPLT) 프로젝트를 조정해왔다. 2025년 말에 종료될 예정인 이 프로젝트는 영국을 제외한 OpenEuroLLM의 많은 파트너를 공유한다.
하이치는 HPLT를 OpenEuroLLM의 전신으로 보고, 데이터, 전문성, 도구, 컴퓨팅 경험에서 견고한 기반을 제공한다고 언급했다. 그는 2026년 중반까지 OpenEuroLLM의 첫 번째 버전을 출시하고, 2028년 프로젝트 종료 시 최종 버전을 기대한다. 그러나 프로젝트의 GitHub 프로필은 여전히 빈약하여 일부 측면에서 처음부터 시작하는 것임을 나타낸다. 하이치는 프로젝트가 1년간의 준비 끝에 2024년 2월 1일에 공식적으로 시작되었다고 언급했다.
OpenEuroLLM 컨소시엄에는 체코, 네덜란드, 독일, 스웨�, 핀란드, 노르웨이의 조직과 Silo AI, Aleph Alpha, Ellamind, Prompsit Language Engineering, LightOn과 같은 기업이 포함된다. 프랑스의 AI 유니콘 Mistral은 하이치가 논의에 참여시키려 했음에도 불구하고 눈에 띄게 제외되었다.
목표와 결과물
프로젝트의 주요 목표는 유럽의 투명한 AI를 위한 일련의 기반 모델을 만들어 현재와 미래의 모든 EU 언어의 언어적, 문화적 다양성을 보존하는 것이다. 결과물은 아직 최종 확정 중이지만, 범용 작업을 위한 핵심 다국어 LLM과 효율성이 중요한 엣지 애플리케이션을 위한 더 작은 양자화 버전이 포함될 것으로 예상된다.
하이치는 품질의 중요성을 강조하며, 높은 이해관계와 공공 자금이 투입된 만큼 미완성 솔루션을 출시하지 않으려 한다고 밝혔다. 디지털 자원이 제한된 언어에서도 동등한 숙련도를 달성하는 것은 여전히 도전 과제다. 프로젝트는 이러한 언어와 문화를 정확히 반영하는 벤치마크를 사용할 계획이다.
HPLT 프로젝트의 데이터, 웹 크롤링에서 얻은 4.5페타바이트 데이터셋과 200억 개 이상의 문서를 포함하여 Common Crawl의 데이터를 보완하여 사용할 예정이다.
오픈소스 딜레마
AI에서 "오픈소스"가 무엇을 의미하는지에 대한 논쟁은 계속되고 있다. 오픈소스 이니셔티브(OSI)는 "오픈소스 AI"를 정의했지만, 일부는 모델뿐만 아니라 데이터셋, 사전 훈련된 모델, 가중치도 포함해야 한다고 주장한다. OpenEuroLLM은 "진정한 오픈소스"를 목표로 하지만, 하이치는 유럽 저작권법과 데이터 재배포 제한으로 인해 잠재적 한계가 있을 수 있다고 인정했다. 일부 훈련 데이터는 EU AI법에 따라 감사용으로만 제공되며 기밀로 유지되어야 할 수 있다.
기존 프로젝트와의 중복
OpenEuroLLM의 출시는 비슷한 목표를 공유하고 EU가 공동 자금을 지원하는 EuroLLM의 최근 출시와 비교되었다. EuroLLM은 9월에 첫 번째 모델을, 12월에 후속 모델을 출시하며 중복과 협력 필요성에 대한 우려를 불러일으켰다. Unbabel의 연구 책임자인 안드레 마르틴스(Andre Martins)는 소셜 미디어에서 이러한 유사성을 강조하며, 서로 다른 커뮤니티 간의 공개 협력을 촉구했다.
하이치는 불행한 중복을 인정했지만, OpenEuroLLM의 자금 제한으로 인해 영국 대학을 포함한 비EU 단체와의 협력이 제한된다고 언급하며 협력에 대한 희망을 표명했다.
자금과 기대
중국의 DeepSeek의 유망한 비용 대비 성능 비율의 등장으로 AI 모델 구축의 실제 비용에 대한 질문이 제기되었다. OpenEuroLLM의 기술 공동 책임자인 페터 사를린은 DeepSeek의 개발에 대한 세부 정보가 부족하지만, 주로 인건비를 충당하는 OpenEuroLLM의 자금에 대해 자신감을 표했다. 컴퓨팅 비용은 EuroHPC 센터에서 충당될 것으로 예상된다.
사를린은 OpenEuroLLM이 소비자나 기업 제품을 만드는 것을 목표로 하지 않고, 유럽 기업을 위한 AI 인프라로 오픈소스 기반 모델을 제공하려 한다고 강조했다. 그는 이미 여러 유럽 언어를 지원하는 모델을 개발하고 모든 유럽 언어를 포괄하는 "Europa" 모델을 출시할 준비를 하고 있는 Silo AI의 경험을 바탕으로 할당된 예산이 이 목적에 충분하다고 믿는다.
디지털 주권과 협력
도전과 비판에도 불구하고, 하이치는 OpenEuroLLM과 같은 협력 프로젝트의 잠재력에 대해 낙관적이다. 그는 학계의 전문성과 기업의 집중력을 결합하면 혁신적인 결과를 낳을 수 있다고 믿는다. 궁극적인 목표는 빅테크나 수십억 달러 규모의 AI 스타트업과 경쟁하는 것이 아니라, 유럽이 유럽을 위해 구축한 기반 LLM을 개발함으로써 유럽의 디지털 주권을 강화하는 것이다.
OpenEuroLLM이 최고 성능의 모델을 만들어내지 못하더라도, 하이치는 유럽에 완전히 기반을 둔 "좋은" 모델을 갖는 것이 대륙의 기술 자율성에 긍정적으로 기여할 가치가 있다고 본다.



Wow, OpenEuroLLM sounds like a game-changer for Europe's tech scene! Building LLMs for all EU languages is ambitious—imagine the boost for local AI startups. But can they keep up with the big players like OpenAI? 🤔




Super cool to see Europe pushing for open-source LLMs! Can't wait to see how OpenEuroLLM handles all those languages. 🌍




Wow, OpenEuroLLM sounds like a game-changer for Europe’s tech scene! Building open-source LLMs for all EU languages is ambitious—imagine the possibilities for local businesses and multilingual AI apps. But I wonder, will they keep up with the pace of global AI giants? 🤔




OpenEuroLLM sounds like a game-changer for Europe! Finally, we're getting open-source LLMs that cover all EU languages. It's about time we took control of our digital future. Can't wait to see how this develops! 🚀




オープンソースのLLMがEU全言語に対応するなんて素晴らしい!これでデジタルの未来を自分たちでコントロールできるようになるね。どう発展していくか楽しみだよ!🌟




OpenEuroLLM parece ser uma grande mudança para a Europa! Finalmente, LLMs de código aberto que cobrem todos os idiomas da UE. Está na hora de assumirmos o controle do nosso futuro digital. Mal posso esperar para ver como isso vai se desenvolver! 🚀












