OpenEuroLLM

O projeto OpenEuroLLM (Open European Family of Large Language Models) reúne as principais empresas e instituições de investigação europeias no domínio da IA para desenvolver modelos linguísticos de fonte aberta da próxima geração.

O projeto OpenEuroLLM construirá uma família de modelos de base multilingues, multilingues e de grande dimensão para serviços comerciais, industriais e públicos. Os modelos de código aberto transparentes e compatíveis democratizarão o acesso a tecnologias de IA de alta qualidade e reforçarão a capacidade das empresas europeias para competir num mercado global e das organizações públicas para produzir serviços públicos com impacto. O consórcio do projeto reúne 20 instituições de investigação europeias líderes e centros EuroHPC coordenados pela Universidade Charles (Chéquia) e co-liderados pela AMD Silo AI (Finlândia). O ALT-EDIC traz para o projeto a sua capacidade para a criação e gestão de dados linguísticos, avaliação de tecnologia da linguagem e construção de comunidades.

O projeto OpenEuroLLM está alinhado com o imperativo de melhorar a competitividade e a soberania digital da Europa. O projeto é um excelente exemplo do tipo de infraestrutura tecnológica necessária para reduzir os limiares para o desenvolvimento e o refinamento de produtos europeus de IA, demonstrando a força da transparência, da abertura e do envolvimento da comunidade, valores amplamente reconhecidos em todo o ecossistema tecnológico europeu. Os modelos serão desenvolvidos no âmbito do sólido quadro regulamentar da Europa, assegurando o alinhamento com os valores europeus, mantendo simultaneamente a excelência tecnológica.

Cooperando com comunidades de código aberto e de ciência aberta, como a LAION, a open-sci e a OpenML, e com peritos adicionais no domínio reunidos no Conselho de Parceria Estratégica Aberta do projeto, a OpenEuroLLM assegurará que os modelos, o software, os dados e a avaliação sejam totalmente abertos e possam ser aperfeiçoados e adaptados às necessidades específicas da indústria e do setor público. Estes modelos multilingues preservam a diversidade linguística e cultural, permitindo às empresas europeias desenvolver produtos e serviços de elevada qualidade na era da IA.

O projeto, que recebeu o selo STEP (Strategic Technologies for Europe Platform), tira partido do apoio de projetos europeus anteriores e da experiência dos parceiros e dos seus resultados, incluindo grandes repositórios de dados de elevada qualidade e LLM-piloto desenvolvidos anteriormente. É financiado pela Comissão Europeia no âmbito do Programa Europa Digital e teve início em 1 de fevereiro de 2025, por um período de três anos.

Estão disponíveis mais informações aqui.