유럽의 디지털 주권 로드맵에 포함 된 오픈 소스 LLM

지난주, 유럽의 디지털 주권 의제가 유럽 연합의 모든 언어를 지원하는 완전 오픈소스 대규모 언어 모델(LLM) 시리즈 개발을 목표로 하는 새로운 이니셔티브 발표로 큰 진전을 이루었다. OpenEuroLLM이라 불리는 이 야심찬 프로젝트는 24개 공식 EU 언어뿐만 아니라 알바니아와 같이 EU 가입을 협상 중인 국가들의 언어도 포함하여 미래 지향적인 접근을 강조한다.
OpenEuroLLM은 약 20개 조직이 참여하는 협력 프로젝트로, 프라하의 찰스 대학교의 계산 언어학자인 얀 하이치(Jan Hajič)와 지난 해 AMD가 6억 6,500만 달러에 인수한 핀란드 AI 연구소 Silo AI의 CEO이자 공동 설립자인 페터 사를린(Peter Sarlin)이 공동으로 이끌고 있다. 이 이니셔티브는 중요한 인프라와 도구를 유럽 내에 유지하려는 유럽의 광범위한 디지털 주권 추진과 일치한다. 이는 OpenAI와 같은 주요 클라우드 제공업체 및 AI 기업들이 EU 데이터가 유럽 토양에 남아 있도록 지역 인프라에 투자해온 행동을 반영한다.
또한, EU는 최근 110억 달러 규모의 주권 위성 군집을 구축하는 계약을 체결하며 일론 머스크의 Starlink와 경쟁자로 자리 잡았다. OpenEuroLLM은 유럽의 기술 자율성을 유지하는 데 초점을 맞추며 이 내러티브에 완벽히 부합한다.
자금과 도전 과제
야심찬 목표에도 불구하고, 모델 개발에 할당된 예산은 3,740만 유로로, 이 중 약 2,000만 유로는 EU의 디지털 유럽 프로그램에서 나온다. 이 금액은 기업 AI 거대 기업들의 투자에 비하면 미미하지만, 관련 작업에 대한 자금 지원을 고려하면 전체 예산은 증가한다. 비용의 상당 부분은 컴퓨팅 파워에 사용되며, OpenEuroLLM은 스페인, 이탈리아, 핀란드, 네덜란드에 있는 EuroHPC 슈퍼컴퓨터 센터와 파트너십을 맺고 있으며, 이는 70억 유로 규모의 EuroHPC 프로젝트의 일부이다.
학계에서 기업에 이르는 다양한 참여자 그룹은 프로젝트의 실행 가능성에 대한 의문을 제기한다. LLM 회사 Pleias의 공동 설립자인 아나스타시아 스타센코(Anastasia Stasenko)는 Mistral AI나 LightOn과 같은 더 민첩하고 집중적인 민간 AI 기업에 비해 대규모 컨소시엄의 효율성에 대해 회의적인 입장을 표명했다. 그녀는 소규모 팀이 더 직접적인 책임을 지고 도전 과제에 더 신속히 대응할 수 있다고 주장한다.
처음부터 시작인가, 기존 작업 활용인가?
OpenEuroLLM의 출발점은 다소 모호하다. 2022년부터 얀 하이치(Jan Hajič)는 고성능 컴퓨팅을 사용해 자유롭고 재사용 가능한 데이터셋, 모델, 워크플로우를 개발하는 고성능 언어 기술(HPLT) 프로젝트를 조정해왔다. 2025년 말에 종료될 예정인 이 프로젝트는 영국을 제외한 OpenEuroLLM의 많은 파트너를 공유한다.
하이치는 HPLT를 OpenEuroLLM의 전신으로 보고, 데이터, 전문성, 도구, 컴퓨팅 경험에서 견고한 기반을 제공한다고 언급했다. 그는 2026년 중반까지 OpenEuroLLM의 첫 번째 버전을 출시하고, 2028년 프로젝트 종료 시 최종 버전을 기대한다. 그러나 프로젝트의 GitHub 프로필은 여전히 빈약하여 일부 측면에서 처음부터 시작하는 것임을 나타낸다. 하이치는 프로젝트가 1년간의 준비 끝에 2024년 2월 1일에 공식적으로 시작되었다고 언급했다.
OpenEuroLLM 컨소시엄에는 체코, 네덜란드, 독일, 스웨�, 핀란드, 노르웨이의 조직과 Silo AI, Aleph Alpha, Ellamind, Prompsit Language Engineering, LightOn과 같은 기업이 포함된다. 프랑스의 AI 유니콘 Mistral은 하이치가 논의에 참여시키려 했음에도 불구하고 눈에 띄게 제외되었다.
목표와 결과물
프로젝트의 주요 목표는 유럽의 투명한 AI를 위한 일련의 기반 모델을 만들어 현재와 미래의 모든 EU 언어의 언어적, 문화적 다양성을 보존하는 것이다. 결과물은 아직 최종 확정 중이지만, 범용 작업을 위한 핵심 다국어 LLM과 효율성이 중요한 엣지 애플리케이션을 위한 더 작은 양자화 버전이 포함될 것으로 예상된다.
하이치는 품질의 중요성을 강조하며, 높은 이해관계와 공공 자금이 투입된 만큼 미완성 솔루션을 출시하지 않으려 한다고 밝혔다. 디지털 자원이 제한된 언어에서도 동등한 숙련도를 달성하는 것은 여전히 도전 과제다. 프로젝트는 이러한 언어와 문화를 정확히 반영하는 벤치마크를 사용할 계획이다.
HPLT 프로젝트의 데이터, 웹 크롤링에서 얻은 4.5페타바이트 데이터셋과 200억 개 이상의 문서를 포함하여 Common Crawl의 데이터를 보완하여 사용할 예정이다.
오픈소스 딜레마
AI에서 "오픈소스"가 무엇을 의미하는지에 대한 논쟁은 계속되고 있다. 오픈소스 이니셔티브(OSI)는 "오픈소스 AI"를 정의했지만, 일부는 모델뿐만 아니라 데이터셋, 사전 훈련된 모델, 가중치도 포함해야 한다고 주장한다. OpenEuroLLM은 "진정한 오픈소스"를 목표로 하지만, 하이치는 유럽 저작권법과 데이터 재배포 제한으로 인해 잠재적 한계가 있을 수 있다고 인정했다. 일부 훈련 데이터는 EU AI법에 따라 감사용으로만 제공되며 기밀로 유지되어야 할 수 있다.
기존 프로젝트와의 중복
OpenEuroLLM의 출시는 비슷한 목표를 공유하고 EU가 공동 자금을 지원하는 EuroLLM의 최근 출시와 비교되었다. EuroLLM은 9월에 첫 번째 모델을, 12월에 후속 모델을 출시하며 중복과 협력 필요성에 대한 우려를 불러일으켰다. Unbabel의 연구 책임자인 안드레 마르틴스(Andre Martins)는 소셜 미디어에서 이러한 유사성을 강조하며, 서로 다른 커뮤니티 간의 공개 협력을 촉구했다.
하이치는 불행한 중복을 인정했지만, OpenEuroLLM의 자금 제한으로 인해 영국 대학을 포함한 비EU 단체와의 협력이 제한된다고 언급하며 협력에 대한 희망을 표명했다.
자금과 기대
중국의 DeepSeek의 유망한 비용 대비 성능 비율의 등장으로 AI 모델 구축의 실제 비용에 대한 질문이 제기되었다. OpenEuroLLM의 기술 공동 책임자인 페터 사를린은 DeepSeek의 개발에 대한 세부 정보가 부족하지만, 주로 인건비를 충당하는 OpenEuroLLM의 자금에 대해 자신감을 표했다. 컴퓨팅 비용은 EuroHPC 센터에서 충당될 것으로 예상된다.
사를린은 OpenEuroLLM이 소비자나 기업 제품을 만드는 것을 목표로 하지 않고, 유럽 기업을 위한 AI 인프라로 오픈소스 기반 모델을 제공하려 한다고 강조했다. 그는 이미 여러 유럽 언어를 지원하는 모델을 개발하고 모든 유럽 언어를 포괄하는 "Europa" 모델을 출시할 준비를 하고 있는 Silo AI의 경험을 바탕으로 할당된 예산이 이 목적에 충분하다고 믿는다.
디지털 주권과 협력
도전과 비판에도 불구하고, 하이치는 OpenEuroLLM과 같은 협력 프로젝트의 잠재력에 대해 낙관적이다. 그는 학계의 전문성과 기업의 집중력을 결합하면 혁신적인 결과를 낳을 수 있다고 믿는다. 궁극적인 목표는 빅테크나 수십억 달러 규모의 AI 스타트업과 경쟁하는 것이 아니라, 유럽이 유럽을 위해 구축한 기반 LLM을 개발함으로써 유럽의 디지털 주권을 강화하는 것이다.
OpenEuroLLM이 최고 성능의 모델을 만들어내지 못하더라도, 하이치는 유럽에 완전히 기반을 둔 "좋은" 모델을 갖는 것이 대륙의 기술 자율성에 긍정적으로 기여할 가치가 있다고 본다.
관련 기사
더 나은 데이터 인사이트를 위한 AI 기반 그래프 및 시각화를 쉽게 생성하기
최신 데이터 분석에는 복잡한 정보를 직관적으로 시각화할 수 있어야 합니다. AI 기반 그래프 생성 솔루션은 전문가들이 원시 데이터를 매력적인 시각적 스토리로 변환하는 방법에 혁신을 일으키며 필수적인 자산으로 부상했습니다. 이러한 지능형 시스템은 정밀도를 유지하면서 수동 차트 생성을 제거하여 기술 및 비기술 사용자 모두 자동화된 시각화를 통해 실행 가능한 인
영업 전략을 혁신하세요: Vapi 기반의 AI 콜드 콜 기술
현대의 비즈니스는 빠른 속도로 운영되며 경쟁력을 유지하기 위해 혁신적인 솔루션을 요구합니다. 연중무휴 24시간 자율적으로 운영되는 AI 기반 콜드 콜 시스템을 통해 수십 명의 잠재 고객과 동시에 소통하며 대행사의 홍보 활동을 혁신하는 모습을 상상해 보세요. Vapi와 같은 플랫폼은 이러한 혁신을 가능하게 하여 자연스러운 대화를 수행하는 맞춤형 다이얼러를 구
교육용 인포그래픽 제작을 위한 최고의 AI 도구 - 디자인 팁 및 기술
오늘날의 디지털 중심 교육 환경에서 인포그래픽은 복잡한 정보를 시각적으로 매력적이고 이해하기 쉬운 형식으로 변환하는 혁신적인 커뮤니케이션 매체로 부상했습니다. AI 기술은 교육자가 이러한 시각적 학습 보조 자료를 제작하는 방식을 혁신하여 누구나 전문가 수준의 디자인을 이용할 수 있게 하는 동시에 제작 시간을 획기적으로 단축하고 있습니다. 이 탐구에서는 간소
의견 (18)
0/200
StevenMartin
2025년 8월 17일 오전 2시 0분 59초 GMT+09:00
Wow, OpenEuroLLM sounds like a game-changer for Europe's tech scene! Building LLMs for all EU languages is ambitious—imagine the boost for local AI startups. But can they keep up with the big players like OpenAI? 🤔
0
PaulHill
2025년 8월 8일 오전 3시 1분 6초 GMT+09:00
Super cool to see Europe pushing for open-source LLMs! Can't wait to see how OpenEuroLLM handles all those languages. 🌍
0
ElijahCollins
2025년 7월 23일 오후 1시 59분 29초 GMT+09:00
Wow, OpenEuroLLM sounds like a game-changer for Europe’s tech scene! Building open-source LLMs for all EU languages is ambitious—imagine the possibilities for local businesses and multilingual AI apps. But I wonder, will they keep up with the pace of global AI giants? 🤔
0
PeterYoung
2025년 4월 22일 오후 12시 11분 1초 GMT+09:00
OpenEuroLLM sounds like a game-changer for Europe! Finally, we're getting open-source LLMs that cover all EU languages. It's about time we took control of our digital future. Can't wait to see how this develops! 🚀
0
CharlesThomas
2025년 4월 22일 오전 9시 18분 24초 GMT+09:00
オープンソースのLLMがEU全言語に対応するなんて素晴らしい!これでデジタルの未来を自分たちでコントロールできるようになるね。どう発展していくか楽しみだよ!🌟
0
MatthewGonzalez
2025년 4월 22일 오전 9시 16분 4초 GMT+09:00
OpenEuroLLM parece ser uma grande mudança para a Europa! Finalmente, LLMs de código aberto que cobrem todos os idiomas da UE. Está na hora de assumirmos o controle do nosso futuro digital. Mal posso esperar para ver como isso vai se desenvolver! 🚀
0
지난주, 유럽의 디지털 주권 의제가 유럽 연합의 모든 언어를 지원하는 완전 오픈소스 대규모 언어 모델(LLM) 시리즈 개발을 목표로 하는 새로운 이니셔티브 발표로 큰 진전을 이루었다. OpenEuroLLM이라 불리는 이 야심찬 프로젝트는 24개 공식 EU 언어뿐만 아니라 알바니아와 같이 EU 가입을 협상 중인 국가들의 언어도 포함하여 미래 지향적인 접근을 강조한다.
OpenEuroLLM은 약 20개 조직이 참여하는 협력 프로젝트로, 프라하의 찰스 대학교의 계산 언어학자인 얀 하이치(Jan Hajič)와 지난 해 AMD가 6억 6,500만 달러에 인수한 핀란드 AI 연구소 Silo AI의 CEO이자 공동 설립자인 페터 사를린(Peter Sarlin)이 공동으로 이끌고 있다. 이 이니셔티브는 중요한 인프라와 도구를 유럽 내에 유지하려는 유럽의 광범위한 디지털 주권 추진과 일치한다. 이는 OpenAI와 같은 주요 클라우드 제공업체 및 AI 기업들이 EU 데이터가 유럽 토양에 남아 있도록 지역 인프라에 투자해온 행동을 반영한다.
또한, EU는 최근 110억 달러 규모의 주권 위성 군집을 구축하는 계약을 체결하며 일론 머스크의 Starlink와 경쟁자로 자리 잡았다. OpenEuroLLM은 유럽의 기술 자율성을 유지하는 데 초점을 맞추며 이 내러티브에 완벽히 부합한다.
자금과 도전 과제
야심찬 목표에도 불구하고, 모델 개발에 할당된 예산은 3,740만 유로로, 이 중 약 2,000만 유로는 EU의 디지털 유럽 프로그램에서 나온다. 이 금액은 기업 AI 거대 기업들의 투자에 비하면 미미하지만, 관련 작업에 대한 자금 지원을 고려하면 전체 예산은 증가한다. 비용의 상당 부분은 컴퓨팅 파워에 사용되며, OpenEuroLLM은 스페인, 이탈리아, 핀란드, 네덜란드에 있는 EuroHPC 슈퍼컴퓨터 센터와 파트너십을 맺고 있으며, 이는 70억 유로 규모의 EuroHPC 프로젝트의 일부이다.
학계에서 기업에 이르는 다양한 참여자 그룹은 프로젝트의 실행 가능성에 대한 의문을 제기한다. LLM 회사 Pleias의 공동 설립자인 아나스타시아 스타센코(Anastasia Stasenko)는 Mistral AI나 LightOn과 같은 더 민첩하고 집중적인 민간 AI 기업에 비해 대규모 컨소시엄의 효율성에 대해 회의적인 입장을 표명했다. 그녀는 소규모 팀이 더 직접적인 책임을 지고 도전 과제에 더 신속히 대응할 수 있다고 주장한다.
처음부터 시작인가, 기존 작업 활용인가?
OpenEuroLLM의 출발점은 다소 모호하다. 2022년부터 얀 하이치(Jan Hajič)는 고성능 컴퓨팅을 사용해 자유롭고 재사용 가능한 데이터셋, 모델, 워크플로우를 개발하는 고성능 언어 기술(HPLT) 프로젝트를 조정해왔다. 2025년 말에 종료될 예정인 이 프로젝트는 영국을 제외한 OpenEuroLLM의 많은 파트너를 공유한다.
하이치는 HPLT를 OpenEuroLLM의 전신으로 보고, 데이터, 전문성, 도구, 컴퓨팅 경험에서 견고한 기반을 제공한다고 언급했다. 그는 2026년 중반까지 OpenEuroLLM의 첫 번째 버전을 출시하고, 2028년 프로젝트 종료 시 최종 버전을 기대한다. 그러나 프로젝트의 GitHub 프로필은 여전히 빈약하여 일부 측면에서 처음부터 시작하는 것임을 나타낸다. 하이치는 프로젝트가 1년간의 준비 끝에 2024년 2월 1일에 공식적으로 시작되었다고 언급했다.
OpenEuroLLM 컨소시엄에는 체코, 네덜란드, 독일, 스웨�, 핀란드, 노르웨이의 조직과 Silo AI, Aleph Alpha, Ellamind, Prompsit Language Engineering, LightOn과 같은 기업이 포함된다. 프랑스의 AI 유니콘 Mistral은 하이치가 논의에 참여시키려 했음에도 불구하고 눈에 띄게 제외되었다.
목표와 결과물
프로젝트의 주요 목표는 유럽의 투명한 AI를 위한 일련의 기반 모델을 만들어 현재와 미래의 모든 EU 언어의 언어적, 문화적 다양성을 보존하는 것이다. 결과물은 아직 최종 확정 중이지만, 범용 작업을 위한 핵심 다국어 LLM과 효율성이 중요한 엣지 애플리케이션을 위한 더 작은 양자화 버전이 포함될 것으로 예상된다.
하이치는 품질의 중요성을 강조하며, 높은 이해관계와 공공 자금이 투입된 만큼 미완성 솔루션을 출시하지 않으려 한다고 밝혔다. 디지털 자원이 제한된 언어에서도 동등한 숙련도를 달성하는 것은 여전히 도전 과제다. 프로젝트는 이러한 언어와 문화를 정확히 반영하는 벤치마크를 사용할 계획이다.
HPLT 프로젝트의 데이터, 웹 크롤링에서 얻은 4.5페타바이트 데이터셋과 200억 개 이상의 문서를 포함하여 Common Crawl의 데이터를 보완하여 사용할 예정이다.
오픈소스 딜레마
AI에서 "오픈소스"가 무엇을 의미하는지에 대한 논쟁은 계속되고 있다. 오픈소스 이니셔티브(OSI)는 "오픈소스 AI"를 정의했지만, 일부는 모델뿐만 아니라 데이터셋, 사전 훈련된 모델, 가중치도 포함해야 한다고 주장한다. OpenEuroLLM은 "진정한 오픈소스"를 목표로 하지만, 하이치는 유럽 저작권법과 데이터 재배포 제한으로 인해 잠재적 한계가 있을 수 있다고 인정했다. 일부 훈련 데이터는 EU AI법에 따라 감사용으로만 제공되며 기밀로 유지되어야 할 수 있다.
기존 프로젝트와의 중복
OpenEuroLLM의 출시는 비슷한 목표를 공유하고 EU가 공동 자금을 지원하는 EuroLLM의 최근 출시와 비교되었다. EuroLLM은 9월에 첫 번째 모델을, 12월에 후속 모델을 출시하며 중복과 협력 필요성에 대한 우려를 불러일으켰다. Unbabel의 연구 책임자인 안드레 마르틴스(Andre Martins)는 소셜 미디어에서 이러한 유사성을 강조하며, 서로 다른 커뮤니티 간의 공개 협력을 촉구했다.
하이치는 불행한 중복을 인정했지만, OpenEuroLLM의 자금 제한으로 인해 영국 대학을 포함한 비EU 단체와의 협력이 제한된다고 언급하며 협력에 대한 희망을 표명했다.
자금과 기대
중국의 DeepSeek의 유망한 비용 대비 성능 비율의 등장으로 AI 모델 구축의 실제 비용에 대한 질문이 제기되었다. OpenEuroLLM의 기술 공동 책임자인 페터 사를린은 DeepSeek의 개발에 대한 세부 정보가 부족하지만, 주로 인건비를 충당하는 OpenEuroLLM의 자금에 대해 자신감을 표했다. 컴퓨팅 비용은 EuroHPC 센터에서 충당될 것으로 예상된다.
사를린은 OpenEuroLLM이 소비자나 기업 제품을 만드는 것을 목표로 하지 않고, 유럽 기업을 위한 AI 인프라로 오픈소스 기반 모델을 제공하려 한다고 강조했다. 그는 이미 여러 유럽 언어를 지원하는 모델을 개발하고 모든 유럽 언어를 포괄하는 "Europa" 모델을 출시할 준비를 하고 있는 Silo AI의 경험을 바탕으로 할당된 예산이 이 목적에 충분하다고 믿는다.
디지털 주권과 협력
도전과 비판에도 불구하고, 하이치는 OpenEuroLLM과 같은 협력 프로젝트의 잠재력에 대해 낙관적이다. 그는 학계의 전문성과 기업의 집중력을 결합하면 혁신적인 결과를 낳을 수 있다고 믿는다. 궁극적인 목표는 빅테크나 수십억 달러 규모의 AI 스타트업과 경쟁하는 것이 아니라, 유럽이 유럽을 위해 구축한 기반 LLM을 개발함으로써 유럽의 디지털 주권을 강화하는 것이다.
OpenEuroLLM이 최고 성능의 모델을 만들어내지 못하더라도, 하이치는 유럽에 완전히 기반을 둔 "좋은" 모델을 갖는 것이 대륙의 기술 자율성에 긍정적으로 기여할 가치가 있다고 본다.




Wow, OpenEuroLLM sounds like a game-changer for Europe's tech scene! Building LLMs for all EU languages is ambitious—imagine the boost for local AI startups. But can they keep up with the big players like OpenAI? 🤔




Super cool to see Europe pushing for open-source LLMs! Can't wait to see how OpenEuroLLM handles all those languages. 🌍




Wow, OpenEuroLLM sounds like a game-changer for Europe’s tech scene! Building open-source LLMs for all EU languages is ambitious—imagine the possibilities for local businesses and multilingual AI apps. But I wonder, will they keep up with the pace of global AI giants? 🤔




OpenEuroLLM sounds like a game-changer for Europe! Finally, we're getting open-source LLMs that cover all EU languages. It's about time we took control of our digital future. Can't wait to see how this develops! 🚀




オープンソースのLLMがEU全言語に対応するなんて素晴らしい!これでデジタルの未来を自分たちでコントロールできるようになるね。どう発展していくか楽しみだよ!🌟




OpenEuroLLM parece ser uma grande mudança para a Europa! Finalmente, LLMs de código aberto que cobrem todos os idiomas da UE. Está na hora de assumirmos o controle do nosso futuro digital. Mal posso esperar para ver como isso vai se desenvolver! 🚀












