OpenEuroLLM
El proyecto OpenEuroLLM (Open European Family of Large Language Models) reúne a las principales empresas de IA e instituciones de investigación de Europa para desarrollar modelos lingüísticos de código abierto de próxima generación.
El proyecto OpenEuroLLM construirá una familia de modelos de alto rendimiento, multilingües y de gran lenguaje para servicios comerciales, industriales y públicos. Los modelos de código abierto transparentes y compatibles democratizarán el acceso a tecnologías de IA de alta calidad y fortalecerán la capacidad de las empresas europeas para competir en un mercado global y las organizaciones públicas para producir servicios públicos impactantes. El consorcio del proyecto reúne a 20 instituciones de investigación europeas líderes y centros EuroHPC coordinados por la Universidad Charles (Chequia) y codirigidos por AMD Silo AI (Finlandia). El ALT-EDIC aporta al proyecto su capacidad para la creación y gestión de datos lingüísticos, la evaluación de tecnologías lingüísticas y la construcción de comunidades.
El proyecto OpenEuroLLM está en consonancia con el imperativo de mejorar la competitividad y la soberanía digital de Europa. El proyecto es un excelente ejemplo del tipo de infraestructura tecnológica necesaria para reducir los umbrales para el desarrollo y el refinamiento de productos europeos de IA, lo que demuestra la fuerza de la transparencia, la apertura y la participación de la comunidad, valores ampliamente reconocidos en todo el ecosistema tecnológico europeo. Los modelos se desarrollarán en el marco reglamentario sólido de Europa, garantizando la armonización con los valores europeos y manteniendo al mismo tiempo la excelencia tecnológica.
Cooperando con comunidades de código abierto y de ciencia abierta como LAION, open-sci y OpenML, y con expertos adicionales en el campo reunidos en el Consejo de Asociación Estratégica Abierta del proyecto, OpenEuroLLM garantizará que los modelos, el software, los datos y la evaluación sean totalmente abiertos y puedan ajustarse y adaptarse a las necesidades específicas de la industria y el sector público. Estos modelos multilingües preservan la diversidad lingüística y cultural, permitiendo a las empresas europeas desarrollar productos y servicios de alta calidad en la era de la IA.
El proyecto, que ha sido galardonado con el sello STEP (Strategic Technologies for Europe Platform), aprovecha el apoyo de proyectos europeos anteriores y la experiencia de los socios y sus resultados, incluidos grandes repositorios de datos de alta calidad y LLM piloto desarrollados anteriormente. Está financiado por la Comisión Europea en el marco del Programa Europa Digital y comenzó el 1 de febrero de 2025, con una duración de 3 años.
Más información disponible aquí.