OpenEuroLLM
Le projet OpenEuroLLM (Open European Family of Large Language Models) rassemble les principales entreprises et institutions de recherche européennes dans le domaine de l’IA afin de développer des modèles linguistiques open source de nouvelle génération.
Le projet OpenEuroLLM construira une famille de modèles linguistiques performants, multilingues et de grande taille pour les services commerciaux, industriels et publics. Les modèles open source transparents et conformes démocratiseront l'accès à des technologies d'IA de haute qualité et renforceront la capacité des entreprises européennes à être compétitives sur un marché mondial et des organisations publiques à produire des services publics percutants. Le consortium du projet rassemble 20 institutions de recherche européennes de premier plan et des centres EuroHPC coordonnés par l'Université Charles (Tchéquie) et co-dirigés par AMD Silo AI (Finlande). L'ALT-EDIC apporte au projet sa capacité de création et de gestion de données linguistiques, d'évaluation de la technologie linguistique et de renforcement de la communauté.
Le projet OpenEuroLLM est aligné sur l’impératif d’améliorer la compétitivité et la souveraineté numérique de l’Europe. Le projet est un excellent exemple du type d'infrastructure technologique nécessaire pour abaisser les seuils de développement et de raffinement des produits européens d'IA, démontrant la force de la transparence, de l'ouverture et de la participation de la communauté, valeurs largement reconnues dans l'écosystème technologique européen. Les modèles seront développés dans le cadre réglementaire solide de l’Europe, garantissant l’alignement sur les valeurs européennes tout en maintenant l’excellence technologique.
En coopérant avec des communautés de science ouverte et open source telles que LAION, open-sci et OpenML, ainsi qu’avec d’autres experts dans le domaine réunis au sein du comité de partenariat stratégique ouvert du projet, OpenEuroLLM veillera à ce que les modèles, les logiciels, les données et l’évaluation soient pleinement ouverts et puissent être affinés et adaptés aux besoins spécifiques de l’industrie et du secteur public. Ces modèles multilingues préservent à la fois la diversité linguistique et culturelle, permettant aux entreprises européennes de développer des produits et des services de haute qualité à l’ère de l’IA.
Le projet, qui a reçu le label STEP (Strategic Technologies for Europe Platform), tire parti du soutien de projets européens antérieurs et de l'expérience des partenaires et de leurs résultats, y compris de grands référentiels de données de haute qualité et des Grands Modèles de Langue (LLM) pilotes développés précédemment. Il est financé par la Commission européenne dans le cadre du programme pour une Europe numérique et a débuté le 1er février 2025 pour une durée de 3 ans.
Plus d'informations sont disponibles ici.