OpenEuroLLM

Proiectul OpenEuroLLM (Open European Family of Large Language Models) reunește cele mai importante companii și instituții de cercetare din domeniul IA din Europa pentru a dezvolta modele lingvistice cu sursă deschisă de generație următoare.

Proiectul OpenEuroLLM va construi o familie de modele lingvistice de înaltă performanță, multilingve și de mare anvergură pentru servicii comerciale, industriale și publice. Modelele transparente și conforme cu sursă deschisă vor democratiza accesul la tehnologii IA de înaltă calitate și vor consolida capacitatea întreprinderilor europene de a concura pe o piață mondială și a organizațiilor publice de a produce servicii publice de impact. Consorțiul proiectului reunește 20 de instituții europene de cercetare de vârf și centre EuroHPC coordonate de Universitatea Charles (Cehia) și co-conduse de AMD Silo AI (Finlanda). ALT-EDIC aduce în proiect capacitatea sa de creare și gestionare a datelor lingvistice, de evaluare a tehnologiei lingvistice și de construire a comunității.

Proiectul OpenEuroLLM este aliniat la imperativul de a îmbunătăți competitivitatea și suveranitatea digitală a Europei. Proiectul este un prim exemplu al tipului de infrastructură tehnologică necesară pentru a reduce pragurile pentru dezvoltarea și rafinarea produselor europene de IA, demonstrând forța transparenței, a deschiderii și a implicării comunității, valori recunoscute în mare măsură în ecosistemul tehnologic european. Modelele vor fi dezvoltate în cadrul de reglementare solid al Europei, asigurând alinierea la valorile europene, menținând în același timp excelența tehnologică.

Cooperând cu comunitățile de știință deschisă și cu sursă deschisă, cum ar fi LAION, open-sci și OpenML, precum și cu experți suplimentari în domeniu reuniți în cadrul Consiliului de parteneriat strategic deschis al proiectului, OpenEuroLLM se va asigura că modelele, software-ul, datele și evaluarea vor fi pe deplin deschise și pot fi ajustate și instruite pentru nevoile specifice ale industriei și ale sectorului public. Aceste modele multilingve păstrează diversitatea lingvistică și culturală, permițând întreprinderilor europene să dezvolte produse și servicii de înaltă calitate în era IA.

Proiectul, căruia i s-a acordat sigiliul STEP (Platforma „Tehnologii strategice pentru Europa”), beneficiază de sprijinul proiectelor europene anterioare și de experiența partenerilor și de rezultatele acestora, inclusiv de depozite mari de date de înaltă calitate și de LLM-uri-pilot dezvoltate anterior. Acesta este finanțat de Comisia Europeană în cadrul programului Europa digitală și a început la 1 februarie 2025, pentru o durată de 3 ani.

Mai multe informații sunt disponibile aici.