OpenEuroLLM
Проектът OpenEuroLLM (Open European Family of Large Language Models — Open European Family of Large Language Models) събира водещи европейски компании и изследователски институции за разработване на езикови модели с отворен код от следващо поколение.
Проектът OpenEuroLLM ще изгради семейство от високопроизводителни, многоезични, големи езикови модели за търговски, промишлени и обществени услуги. Прозрачните и съвместими модели с отворен код ще демократизират достъпа до висококачествени технологии в областта на ИИ и ще укрепят способността на европейските дружества да се конкурират на световния пазар и на публичните организации да произвеждат въздействащи обществени услуги. Консорциумът по проекта обединява 20 водещи европейски научноизследователски институции и EuroHPC центрове, координирани от Charles University (Чехия) и ръководени от AMD Silo AI (Финландия). ALT-EDIC внася в проекта способността си за създаване и управление на езикови данни, оценка на езиковите технологии и изграждане на общности.
Проектът OpenEuroLLM е съобразен с императива за подобряване на конкурентоспособността и цифровия суверенитет на Европа. Проектът е отличен пример за вида на технологичната инфраструктура, необходима за понижаване на праговете за разработване и усъвършенстване на европейските продукти с ИИ, демонстрирайки силата на прозрачността, откритостта и участието на общността, ценности, признати до голяма степен в европейската технологична екосистема. Моделите ще бъдат разработени в рамките на стабилната регулаторна рамка на Европа, като се гарантира съответствие с европейските ценности, като същевременно се запазят високите технологични постижения.
Сътрудничество с общности с отворен код и отворена наука като LAION, Open-Sci и OpenML, както и допълнителни експерти в областта, събрани в Съвета за отворено стратегическо партньорство на проекта, OpenEuroLLM ще гарантира, че моделите, софтуерът, данните и оценката ще бъдат напълно отворени и могат да бъдат прецизирани и обучени за специфични нужди на индустрията и публичния сектор. Тези многоезични модели запазват както езиковото, така и културното многообразие, което дава възможност на европейските предприятия да разработват висококачествени продукти и услуги в ерата на ИИ.
Проектът, на който бе присъден печатът STEP (стратегически технологии за Европа), използва подкрепата от предишни европейски проекти и опита на партньорите и техните резултати, включително големи хранилища с висококачествени данни и пилотни LLM, разработени преди това. Тя се финансира от Европейската комисия по програмата „Цифрова Европа“ и стартира на 1 февруари 2025 г. за срок от 3 години.
Допълнителна информация е на разположение тук.