Europas ledande AI-företag och forskningsinstitutioner förenar sina krafter och expertis för att utveckla nästa generations språkmodeller med öppen källkod. AI Sweden är en av 20 europeiska organisationer som deltar i OpenEuroLLM, ett unikt samarbete för att främja europeisk AI-kapacitet.
Ett konsortium bestående av 20 ledande europeiska forskningsinstitutioner, företag och EuroHPC-, koordinerat av Jan Hajič (Charles University, Tjeckien) och Peter Sarlin (AMD Silo AI, Finland), kommer att bygga en familj av högpresterande, flerspråkiga språkmodeller för kommersiella, industriella och offentliga tjänster. De transparenta modellerna med öppen källkod kommer att vara anpassade efter europeisk lagstiftning och ha en demokratiserande effekt på tillgången till högkvalitativ AI-teknik. Det kommer stärka europeiska företags förmåga att konkurrera på en global marknad samtidigt som den offentliga sektorn ges förmåga att tillhandahålla sina tjänster på ett effektivt sätt.
OpenEuroLLM-projektet är i linje med behoven att förbättra Europas konkurrenskraft och digitala suveränitet. Det är ett utmärkt exempel på den typ av teknisk infrastruktur som behövs för att sänka trösklarna för utveckling och förädling av europeiska AI-lösningar, och visar på styrkan i transparens, öppenhet och samhällsengagemang, värden som i stor utsträckning är ett fundament för Europas tekniska ekosystem. Modellerna kommer att utvecklas i enlighet med Europas robusta regelverk, vilket säkerställer överensstämmelse med europeiska värderingar samtidigt som teknisk spets bibehålls.
Genom att samarbeta med open source- och open science-communities som LAION, open-sci och OpenML, samt ytterligare experter inom området som samlats i projektets Open Strategic Partnership Board, kommer OpenEuroLLM att säkerställa att modellerna, programvaran, data och utvärderingen kommer att vara helt öppna och möjliga att finjusteras och instruktionstränas för specifika behov inom industrin och den offentliga sektorn. Dessa högpresterande flerspråkiga modeller bevarar både språklig och kulturell mångfald, vilket gör det möjligt för europeiska företag att utveckla högkvalitativa produkter och tjänster i AI-eran.
Projektet, som har tilldelats STEP-sigillet (Strategic Technologies for Europe Platform), drar nytta av stöd från tidigare europeiska projekt och erfarenheterna från partnerna och deras resultat, inklusive stora arkiv med högkvalitativa data och pilotspråkmodeller som utvecklats tidigare. Konsortiet inleder sitt arbete den 1 februari 2025, med finansiering från Europeiska kommissionen under programmet Digital Europe.
AI Sweden har valts ut som en av 20 organisationer som bidrar till utvecklingen av framtida europeiska språkmodeller.
AI Swedens Natural Language Understanding (NLU)-team är en ledande forskningsgrupp inom europeisk språkteknologi och bidrar med spetskompetens och betydande erfarenhet till projektet.
Utöver OpenEuroLLM deltar AI Sweden i tre andra stora EU-projekt som stärker Europas AI-kapacitet (TrustLLM, DeployAI och Eurolingua-GPT). År 2023 släppte AI Sweden dessutom GPT-SW3, den första stora språkmodellen (LLM) för de nordiska språken.
”AI Sweden är entusiastiska över att delta i OpenEuroLLM-projektet och den möjlighet det ger att bidra till att stärka europeisk och svensk konkurrenskraft och digital suveränitet genom utvecklingen av kraftfulla och öppna europeiska språkmodeller”, säger Magnus Sahlgren, forskningschef för NLU på AI Sweden. Han tillägger: ”Med öppna och transparenta data som uppfyller våra lagkrav kan vi snabbare implementera och påskynda användningen av AI inom alla sektorer i hela Europa.”
Magnus Sahlgren
Head of Research for NLU på AI Sweden
Projektet pågår i 36 månader och avslutas den 31 januari 2028. Den totala budgeten för OpenEuroLLM-projektet uppgår till 34 miljoner euro, varav 20,5 miljoner euro finansieras av Europeiska kommissionen.
Läs mer om OpenEuroLLM på: https://openeurollm.eu/
Charles University (Institute of Formal and Applied Linguistics), Tjeckien (koordinator)
Alliance for Language Technologies EDIC (ALT-EDIC), Frankrike
Eindhoven University of Technology, Nederländerna
ELLIS Institute Tübingen, Tyskland
Fraunhofer IAIS, Tyskland
Lindholmen Science Park (AI Sweden), Sverige
Research Center Juelich, Tyskland
University of Helsinki, Finland
University of Oslo, Norge
University of Turku, Finland
University of Tübingen (Tübingen AI Center), Tyskland
Silo GenAI (AMD Silo AI), Finland (delansvarig projektledare)
Aleph Alpha Research, Tyskland
ellamind, Tyskland
LightOn, Frankrike
Prompsit Language Engineering, Spanien
Barcelona Supercomputing Center, Spanien
Cineca Interuniversity Consortium, Italien
CSC - IT Center for Science, Finland
SURF, Nederländerna