opção
Lar
Notícias
Open Source LLMS incluído no roteiro da soberania digital da Europa

Open Source LLMS incluído no roteiro da soberania digital da Europa

17 de Abril de 2025
116

Open Source LLMS incluído no roteiro da soberania digital da Europa

Na última semana, a agenda de soberania digital da Europa recebeu um impulso significativo com o anúncio de uma nova iniciativa voltada para o desenvolvimento de uma série de modelos de linguagem de grande escala (LLMs) totalmente de código aberto, que atendem a todas as línguas da União Europeia. Este ambicioso projeto, chamado OpenEuroLLM, visa não apenas as 24 línguas oficiais da UE, mas também se estende a línguas de países que negociam a entrada na UE, como a Albânia, enfatizando a preparação para o futuro.

O OpenEuroLLM é um esforço colaborativo envolvendo cerca de 20 organizações, co-liderado por Jan Hajič, um linguista computacional da Universidade Charles em Praga, e Peter Sarlin, CEO e co-fundador do laboratório de IA finlandês Silo AI, que foi adquirido pela AMD por 665 milhões de dólares no último ano. Esta iniciativa está alinhada com o impulso mais amplo da Europa para a soberania digital, visando manter a infraestrutura e ferramentas críticas dentro do continente. Esse movimento ecoa as ações de grandes provedores de nuvem e empresas de IA como a OpenAI, que têm investido em infraestrutura local para garantir que os dados da UE permaneçam em solo europeu.

Além disso, a UE assinou recentemente um acordo de 11 bilhões de dólares para estabelecer uma constelação de satélites soberana, posicionando-se como concorrente do Starlink de Elon Musk. O OpenEuroLLM se encaixa perfeitamente nessa narrativa, focando na manutenção da autonomia tecnológica da Europa.

Financiamento e Desafios

Apesar de seus objetivos ambiciosos, o orçamento alocado para o desenvolvimento dos modelos é de 37,4 milhões de euros, com aproximadamente 20 milhões de euros provenientes do Programa Digital Europe da UE. Esse montante é pequeno em comparação com os investimentos feitos por gigantes corporativos de IA, embora o orçamento total aumente quando considerado o financiamento para trabalhos relacionados. Uma parte significativa da despesa é o poder de computação, com o OpenEuroLLM fazendo parceria com centros de supercomputadores EuroHPC na Espanha, Itália, Finlândia e Países Baixos, que fazem parte de um projeto EuroHPC mais amplo de 7 bilhões de euros.

O grupo diversificado de participantes, que vai desde a academia até corporações, levanta questões sobre a viabilidade do projeto. Anastasia Stasenko, co-fundadora da empresa de LLM Pleias, expressou ceticismo sobre a eficácia de um consórcio tão grande em comparação com empresas de IA privadas mais ágeis e focadas, como a Mistral AI e a LightOn. Essas equipes menores, ela argumenta, têm uma responsabilidade mais direta e podem reagir mais rapidamente aos desafios.

Construir do Zero ou Aproveitar o Trabalho Existente?

O ponto de partida do OpenEuroLLM é um tanto ambíguo. Desde 2022, Jan Hajič tem coordenado o projeto de Tecnologias de Linguagem de Alta Performance (HPLT), que se concentra no desenvolvimento de conjuntos de dados, modelos e fluxos de trabalho gratuitos e reutilizáveis usando computação de alto desempenho. Este projeto, previsto para terminar no final de 2025, compartilha muitos parceiros com o OpenEuroLLM, exceto aqueles do Reino Unido.

Hajič vê o HPLT como um precursor do OpenEuroLLM, observando que ele fornece uma base sólida em dados, expertise, ferramentas e experiência em computação. Ele prevê o lançamento das primeiras versões do OpenEuroLLM até meados de 2026, com as versões finais esperadas para a conclusão do projeto em 2028. No entanto, o perfil do projeto no GitHub permanece escasso, indicando um início do zero em alguns aspectos. Hajič mencionou que o projeto começou oficialmente em 1º de fevereiro de 2024, após um ano de preparação.

O consórcio OpenEuroLLM inclui organizações da Tchéquia, Países Baixos, Alemanha, Suécia, Finlândia e Noruega, ao lado de entidades corporativas como Silo AI, Aleph Alpha, Ellamind, Prompsit Language Engineering e LightOn. Notavelmente ausente está a Mistral, um unicórnio de IA francês, apesar das tentativas de Hajič de envolvê-los em discussões.

Metas e Entregáveis

O objetivo principal do projeto é criar uma série de modelos de fundação para uma IA transparente na Europa, preservando a diversidade linguística e cultural de todas as línguas da UE, tanto atuais quanto futuras. Os entregáveis ainda estão sendo finalizados, mas espera-se que incluam um LLM multilíngue central para tarefas de propósito geral e versões menores e quantizadas para aplicações de borda, onde a eficiência é fundamental.

Hajič enfatizou a importância da qualidade, afirmando que o projeto visa evitar a liberação de soluções mal acabadas, dado o alto risco e o financiamento público envolvido. Alcançar proficiência igual em todas as línguas, especialmente aquelas com recursos digitais limitados, continua sendo um desafio. O projeto planeja usar benchmarks que representem com precisão essas línguas e culturas.

Dados do projeto HPLT, incluindo um conjunto de dados de 4,5 petabytes de rastreamentos da web e mais de 20 bilhões de documentos, serão utilizados, complementados por dados do Common Crawl.

Dilemas de Código Aberto

O debate sobre o que constitui "código aberto" em IA está em andamento. A Iniciativa de Código Aberto (OSI) definiu "IA de código aberto", mas alguns argumentam que ela deve incluir não apenas modelos, mas também conjuntos de dados, modelos pré-treinados e pesos. O OpenEuroLLM pretende ser "verdadeiramente aberto", mas Hajič reconhece possíveis limitações devido às leis de direitos autorais europeias e restrições de redistribuição de dados. Alguns dados de treinamento podem precisar ser mantidos confidenciais, mas disponíveis para auditoria conforme a Lei de IA da UE.

Sobreposição com Projetos Existentes

O lançamento do OpenEuroLLM foi comparado ao EuroLLM, lançado recentemente, que compartilha metas semelhantes e também é co-financiado pela UE. O EuroLLM, que lançou seu primeiro modelo em setembro e um segundo em dezembro, gerou preocupações sobre redundância e a necessidade de colaboração em vez de competição. Andre Martins, chefe de pesquisa da Unbabel, destacou essas semelhanças nas redes sociais, pedindo uma colaboração aberta entre as diferentes comunidades.

Hajič reconheceu a sobreposição infeliz, mas expressou esperança por cooperação, observando que as restrições de financiamento do OpenEuroLLM limitam colaborações com entidades não pertencentes à UE, incluindo universidades do Reino Unido.

Financiamento e Expectativas

A emergência do DeepSeek da China, com sua promissora relação custo-desempenho, levantou questões sobre os verdadeiros custos de construção de modelos de IA. Peter Sarlin, co-líder técnico do OpenEuroLLM, observou a falta de informações detalhadas sobre o desenvolvimento do DeepSeek, mas permanece confiante no financiamento do OpenEuroLLM, que cobre principalmente os custos de pessoal. As despesas de computação devem ser cobertas pelos centros EuroHPC.

Sarlin enfatizou que o OpenEuroLLM não tem como objetivo criar um produto para consumidores ou empresas, mas sim fornecer um modelo de fundação de código aberto como infraestrutura de IA para empresas europeias. Ele acredita que o orçamento alocado é suficiente para esse propósito, baseando-se em sua experiência com a Silo AI, que já desenvolveu modelos que suportam várias línguas europeias e está se preparando para lançar os modelos "Europa" cobrindo todas as línguas europeias.

Soberania Digital e Colaboração

Apesar dos desafios e críticas, Hajič permanece otimista sobre o potencial de projetos colaborativos como o OpenEuroLLM. Ele acredita que combinar a expertise acadêmica com o foco corporativo pode levar a resultados inovadores. O objetivo final não é competir com grandes empresas de tecnologia ou startups de IA de bilhões de dólares, mas fortalecer a soberania digital da Europa, desenvolvendo LLMs de fundação construídos por e para a Europa.

Mesmo que o OpenEuroLLM não produza o modelo de melhor desempenho, Hajič vê valor em ter um modelo "bom" que seja inteiramente baseado na Europa, contribuindo positivamente para a autonomia tecnológica do continente.

Artigo relacionado
Criando Livros de Colorir Alimentados por IA: Um Guia Completo Criando Livros de Colorir Alimentados por IA: Um Guia Completo Projetar livros de colorir é uma busca recompensadora, combinando expressão artística com experiências calmantes para os usuários. No entanto, o processo pode ser trabalhoso. Felizmente, ferramentas d
Qodo Faz Parceria com Google Cloud para Oferecer Ferramentas Gratuitas de Revisão de Código por IA para Desenvolvedores Qodo Faz Parceria com Google Cloud para Oferecer Ferramentas Gratuitas de Revisão de Código por IA para Desenvolvedores Qodo, uma startup de codificação por IA baseada em Israel focada em qualidade de código, lançou uma parceria com Google Cloud para aprimorar a integridade de software gerado por IA.À medida que as emp
IA da DeepMind Ganha Ouro na Olimpíada de Matemática de 2025 IA da DeepMind Ganha Ouro na Olimpíada de Matemática de 2025 A IA da DeepMind alcançou um salto impressionante no raciocínio matemático, conquistando uma medalha de ouro na Olimpíada Internacional de Matemática (IMO) de 2025, apenas um ano após ganhar prata em
Comentários (18)
0/200
StevenMartin
StevenMartin 16 de Agosto de 2025 à59 18:00:59 WEST

Wow, OpenEuroLLM sounds like a game-changer for Europe's tech scene! Building LLMs for all EU languages is ambitious—imagine the boost for local AI startups. But can they keep up with the big players like OpenAI? 🤔

PaulHill
PaulHill 7 de Agosto de 2025 à6 19:01:06 WEST

Super cool to see Europe pushing for open-source LLMs! Can't wait to see how OpenEuroLLM handles all those languages. 🌍

ElijahCollins
ElijahCollins 23 de Julho de 2025 à29 05:59:29 WEST

Wow, OpenEuroLLM sounds like a game-changer for Europe’s tech scene! Building open-source LLMs for all EU languages is ambitious—imagine the possibilities for local businesses and multilingual AI apps. But I wonder, will they keep up with the pace of global AI giants? 🤔

PeterYoung
PeterYoung 22 de Abril de 2025 à1 04:11:01 WEST

OpenEuroLLM sounds like a game-changer for Europe! Finally, we're getting open-source LLMs that cover all EU languages. It's about time we took control of our digital future. Can't wait to see how this develops! 🚀

CharlesThomas
CharlesThomas 22 de Abril de 2025 à24 01:18:24 WEST

オープンソースのLLMがEU全言語に対応するなんて素晴らしい!これでデジタルの未来を自分たちでコントロールできるようになるね。どう発展していくか楽しみだよ!🌟

MatthewGonzalez
MatthewGonzalez 22 de Abril de 2025 à4 01:16:04 WEST

OpenEuroLLM parece ser uma grande mudança para a Europa! Finalmente, LLMs de código aberto que cobrem todos os idiomas da UE. Está na hora de assumirmos o controle do nosso futuro digital. Mal posso esperar para ver como isso vai se desenvolver! 🚀

De volta ao topo
OR