LLM'er4EU
Den LLMs4EU (Store sprogmodeller for Den Europæiske Union) Projektet koordineres af ALT-EDIC og vil støtte et stort antal partnere i det europæiske LLM-økosystem. Det vil sætte dem i stand til at indsamle sprogdata i tilstrækkelig kvalitet og kvantitet til at opbygge store sprogfundamentmodeller samt modeller, der er tilpasset specifikke sprog, domæner eller brancher, og til at yde dedikeret support og tjenester, der gør det muligt for andre at finjustere de tilgængelige modeller.
LLMs4EU-projektet har til formål at bevare europæisk sproglig og kulturel mangfoldighed i den digitale tidsalder gennem samarbejde mellem økonomiske og akademiske aktører. Faktisk er nogle europæiske sprog truet af at blive udeladt fra generativ AI-udvikling på grund af manglende ressourcer til at uddanne sprogmodeller. Desuden har projektet til formål at samle nogle af Europas førende aktører inden for generativ kunstig intelligens for at sikre, at europæiske virksomheder og navnlig SMV'er har adgang til værktøjer og ressourcer til at blive konkurrencedygtige med hensyn til sprogteknologier og navnlig store sprogmodeller. Projektet fokuserer på fem anvendelsesområder: energi, telekommunikation, turisme, offentlige tjenester og videnskab.

Målet er at gøre LLM'er og alle de værktøjer, der er nødvendige for at udnytte dem på alle EU-sprog, tilgængelige på en åben måde ved at udnytte eksisterende europæiske programmer og kompetencer. De værktøjer, der vil blive gjort tilgængelige for europæiske virksomheder, vil dække alle trin fra uddannelse af LLM'er til at sikre deres overensstemmelse med europæisk lovgivning (AI-loven, GDPR osv.).
Konsortiet, der er oprettet omkring ALT-EDIC, omfatter organisationer, der arbejder i 19 lande, hvilket sikrer god geografisk og sproglig dækning. Projektet vil udvikle forskellige relevante use cases for at demonstrere de europæiske aktørers evne til at samarbejde om at skabe tilpassede værktøjer til forskellige økonomiske sektorer, og dækningen af alle EU-sprog vil blive sikret gennem projektets oprettelse og erhvervelse af de nødvendige datasæt.
Projektet vil, herunder gennem finansiel støtte til tredjeparter, yde målrettet støtte og tjenester, navnlig til SMV'er, for at lette finjusteringen af de tilgængelige modeller.
Projektet er finansieret af programmet for et digitalt Europa. Den blev indledt i marts 2025 for en periode på tre år.