Hoppa till huvudinnehåll

OpenEuroLLM tar nästa steg för europeisk AI-suveränitet

onsdag, mars 11, 2026

Det har nu gått ett år sedan startskottet för OpenEuroLLM, ett av Europas mest ambitiösa AI-initiativ. Genom att förena 20 ledande forskningsinstitutioner och företag, har projektet under sitt första år lagt grunden för en ny generation öppna språkmodeller för en starkare europeisk digital suveränitet och konkurrenskraft.

OPEN EURO LLM projektet medfinansieras av Europeiska Unionen

Under det första året har OpenEuroLLM-projektet nått avgörande milstolpar inom infrastruktur, datapraxis och modellutveckling. Syftet är tydligt: att utveckla nästa generations öppna och transparenta stora språkmodeller för att främja europeisk AI-kapacitet.

Nina Ökvist

OpenEuroLLM är ett kvitto på att teknisk spetskompetens i kombination med ett starkt europeiskt nätverk är förutsättningen för att vi ska lyckas med storskalig AI-utveckling. För Sverige och våra partners innebär detta en unik möjlighet att bygga på en öppen och transparent grund som stärker vår gemensamma innovationskraft.

Nina Ökvist

Nina Ökvist

Head of NLU på AI Sweden

Genombrott inom öppna data och infrastruktur

En av projektets mest betydelsefulla framgångar är lanseringen av datasetet MixtureVitae. Det är det första datasetet som är fritt att använda även i kommersiellt syfte med en prestanda som matchar eller överträffar de ledande icke-tillåtande alternativen på marknaden. MixtureVitae är särskilt starkt inom kod och matematiska resonemang, vilket är kritiskt för nästa steg i industriell AI-användning.

För att möta utmaningen med databrist för mindre europeiska språk har projektet, tillsammans med EuroLLM, utvecklat det första omfattande flerspråkiga syntetiska datasetet för förträning. Inom underprojektet, som kallas MultiSynt, har AI Swedens NLU-team arbetat med att översätta högkvalitativ engelsk data till språk som svenska, isländska, ungerska och spanska. Arbetet syftar till att överkomma de brister i nuvarande datainsamling som idag begränsar en korrekt representation av många språk. Genom att skapa ett öppet flerspråkigt dataset är målet att både möjliggöra träning av språkmodeller inom OpenEuroLLM och att driva forskningen kring flerspråkiga modeller framåt.

Genom att göra dessa resurser tillgängliga på europeiska superdatorsystem som LUMI och Leonardo undviks dubbelarbete och resurserna kan nyttjas maximalt i hela ekosystemet.

Beräkningskapacitet en avgörande byggsten

OpenEuroLLM blev i december 2025 det första AI-projektet som beviljas strategisk tillgång till flera av EuroHPC:s superdatorer samtidigt, inklusive LUMI, Leonardo, Jupiter och Marenostrum 5. Men ytterligare beräkningsresurser kommer att krävas för att komplettera de tidigare tilldelningarna, understryker projektets samordnare Jan Hajič.

Jan Hajič

Att skapa en flerspråkig LLM med öppen källkod som är offentligt drivet och inom ett stort konsortium är en utmanande uppgift. Jag är stolt över att projektet har nått sina mål för det första året, tack vare expertis, engagemang och hårt arbete från i synnerhet våra huvudpartners. Det återstår dock betydande utmaningar, särskilt när det gäller att säkra tillräcklig beräkningskapacitet för att skapa de slutliga modellerna.

Jan Hajič

Jan Hajič

Karlsuniversitetet

Vägen framåt

Under det kommande året växlar AI Sweden upp arbetet för att skapa förutsättningar för att de europeiska modellerna ska bli praktiskt användbara. Inom ramen för post-training – den kritiska fasen där modeller ändamålsanpassas – fokuserar AI Swedens NLU-team på att förse modellerna med de förmågor och beteenden som krävs för avancerad användning. Det handlar konkret om att optimera modellernas förmåga att hantera lång kontext, förbättra instruktionsföljande och chat-interaktion, samt stärka deras kapacitet för resonerande och funktionsanropning.

Under hösten planeras de första språkmodellerna utvecklade inom ramen för OpenEuroLLM att offentliggöras.

Om EuroHPC

European High Performance Computing (EuroHPC) består av ett kluster av storskalig beräkningsinfrastruktur i Europa. Beräkningssystemen är främst avsedda att användas för akademisk forskning.

Inom ramen för EuroHPC ryms också stöd till forskning och innovation i form av utlysningar inom alla områden som rör storskaliga beräkningar, samt investeringar i kompetenscentra runtom i Europa som ska förenkla kunskapsutbyten, innovation och nya forskningssamarbeten.

Relaterade artiklar

Anders Krifors and Lorna Bartram

Stora språkmodeller analyserar vårdavvikelser

2026-02-05
Kan stora språkmodeller användas för att stärka patientsäkerheten? Resultat från Region Västmanland tyder på att svaret på den frågan är ja. – Vården har samlat en guldgruva med information som vi nu...
Rader av svarta serverrack med färgglada kablar i ett ljust, modernt datacenter med golvpaneler av glas. EU-emblem med texten 'Medfinansieras av Europeiska unionen'

OpenEuroLLM säkrar strategisk tillgång till flera superdatorer – en milstolpe för europeiska språkmodeller

2025-12-18
OpenEuroLLM ska utveckla högpresterande språkmodeller för Europa. Nu har det stora europeiska samarbetsprojektet fått 10 miljoner GPU-timmar på Europas mest kraftfulla superdatorer. – Det här är...
Nina Ökvist and Magnus Sahlgren (composite image)

Unik kompetens kring språkmodeller stärker Sveriges och Europas oberoende

2025-11-06
Tillgången till stora, öppna språkmodeller är av stor betydelse för Sveriges och Europas suveränitet. Lika viktig är kompetensen som krävs för att utveckla, underhålla och använda dem.
Danila Petrelli

Hållbara strategier för data för stora språkmodeller

2025-11-05
Den accelererande användningen av stora språkmodeller skapar ett enormt värde för organisationer. Men för att fullt ut realisera denna potential måste en avgörande flaskhals hanteras: Hållbar...