Det har nu gått ett år sedan startskottet för OpenEuroLLM, ett av Europas mest ambitiösa AI-initiativ. Genom att förena 20 ledande forskningsinstitutioner och företag, har projektet under sitt första år lagt grunden för en ny generation öppna språkmodeller för en starkare europeisk digital suveränitet och konkurrenskraft.
Under det första året har OpenEuroLLM-projektet nått avgörande milstolpar inom infrastruktur, datapraxis och modellutveckling. Syftet är tydligt: att utveckla nästa generations öppna och transparenta stora språkmodeller för att främja europeisk AI-kapacitet.
![]()
OpenEuroLLM är ett kvitto på att teknisk spetskompetens i kombination med ett starkt europeiskt nätverk är förutsättningen för att vi ska lyckas med storskalig AI-utveckling. För Sverige och våra partners innebär detta en unik möjlighet att bygga på en öppen och transparent grund som stärker vår gemensamma innovationskraft.
![]()
Nina Ökvist
Head of NLU på AI Sweden
En av projektets mest betydelsefulla framgångar är lanseringen av datasetet MixtureVitae. Det är det första datasetet som är fritt att använda även i kommersiellt syfte med en prestanda som matchar eller överträffar de ledande icke-tillåtande alternativen på marknaden. MixtureVitae är särskilt starkt inom kod och matematiska resonemang, vilket är kritiskt för nästa steg i industriell AI-användning.
För att möta utmaningen med databrist för mindre europeiska språk har projektet, tillsammans med EuroLLM, utvecklat det första omfattande flerspråkiga syntetiska datasetet för förträning. Inom underprojektet, som kallas MultiSynt, har AI Swedens NLU-team arbetat med att översätta högkvalitativ engelsk data till språk som svenska, isländska, ungerska och spanska. Arbetet syftar till att överkomma de brister i nuvarande datainsamling som idag begränsar en korrekt representation av många språk. Genom att skapa ett öppet flerspråkigt dataset är målet att både möjliggöra träning av språkmodeller inom OpenEuroLLM och att driva forskningen kring flerspråkiga modeller framåt.
Genom att göra dessa resurser tillgängliga på europeiska superdatorsystem som LUMI och Leonardo undviks dubbelarbete och resurserna kan nyttjas maximalt i hela ekosystemet.
OpenEuroLLM blev i december 2025 det första AI-projektet som beviljas strategisk tillgång till flera av EuroHPC:s superdatorer samtidigt, inklusive LUMI, Leonardo, Jupiter och Marenostrum 5. Men ytterligare beräkningsresurser kommer att krävas för att komplettera de tidigare tilldelningarna, understryker projektets samordnare Jan Hajič.
![]()
Att skapa en flerspråkig LLM med öppen källkod som är offentligt drivet och inom ett stort konsortium är en utmanande uppgift. Jag är stolt över att projektet har nått sina mål för det första året, tack vare expertis, engagemang och hårt arbete från i synnerhet våra huvudpartners. Det återstår dock betydande utmaningar, särskilt när det gäller att säkra tillräcklig beräkningskapacitet för att skapa de slutliga modellerna.
![]()
Jan Hajič
Karlsuniversitetet
Under det kommande året växlar AI Sweden upp arbetet för att skapa förutsättningar för att de europeiska modellerna ska bli praktiskt användbara. Inom ramen för post-training – den kritiska fasen där modeller ändamålsanpassas – fokuserar AI Swedens NLU-team på att förse modellerna med de förmågor och beteenden som krävs för avancerad användning. Det handlar konkret om att optimera modellernas förmåga att hantera lång kontext, förbättra instruktionsföljande och chat-interaktion, samt stärka deras kapacitet för resonerande och funktionsanropning.
Under hösten planeras de första språkmodellerna utvecklade inom ramen för OpenEuroLLM att offentliggöras.
European High Performance Computing (EuroHPC) består av ett kluster av storskalig beräkningsinfrastruktur i Europa. Beräkningssystemen är främst avsedda att användas för akademisk forskning.
Inom ramen för EuroHPC ryms också stöd till forskning och innovation i form av utlysningar inom alla områden som rör storskaliga beräkningar, samt investeringar i kompetenscentra runtom i Europa som ska förenkla kunskapsutbyten, innovation och nya forskningssamarbeten.
Relaterade artiklar