Hoppa till huvudinnehåll

Språkmodeller för svenska myndigheter

Projektet utvecklar storskaliga språkmodeller för den svenska offentliga sektorn, vilket möjliggör ett antal applikationer med specifik relevans för svenska myndigheter.

Language Models for Swedish Authorities project

Syfte

RISE (Research Institutes of Sweden), projektets koordinator, beskriver projektet här som följer:

"Detta projekt ger verktygen och förutsättningarna för svenska myndigheter att bygga och integrera toppmoderna NLP-lösningar i sina nuvarande och framtida tjänster. Utvecklingen av toppmoderna svenska språkmodeller, specifikt utformade för användning inom den offentliga sektorn, och tekniker för att utnyttja dem, kommer att möjliggöra nya typer av NLP-applikationer som har potential att revolutionera användningen av NLP inom den svenska offentliga sektorn. De data, infrastrukturer och ramverk som utvecklas i projektet kommer också att möjliggöra utvecklingen av nya typer av representation learning, och kommer därför att säkerställa att svenskt NLP förblir i framkant av utvecklingen."

Projektet fokuserar initialt på fyra användningsfall: maskinförståelse och konversationell AI, semantisk textuell likhet, entitetstagging (namngiven entitetsigenkänning) och textklassificering.

AI Sweden är ansvariga för att koordinera och validera de data som används i projektet och för att distribuera resultaten och kunskapen till referensgruppen, externa intressenter och intresserade parter. Att organisera workshops och evenemang (såsom hackathons) kommer att vara en del av distributionsaktiviteterna, liksom att samarbeta och dela kunskap, erfarenhet och resultat med de andra NLP-projekten och dataägarna.

Bakgrund

De språkmodeller som utvecklas under projektets gång kommer så småningom att hjälpa myndigheterna att sila igenom, kategorisera och hitta rätt information i stora mängder text. Genom att använda NLP för att göra kommunikationen mer automatiserad, finns det en stor nytta för samhället i att betydligt minska kostnader och ineffektiv användning av resurser. Offentliga myndigheter kan till exempel få hjälp med att sammanställa och sammanfatta rapporter eller att minska normalt långa kötider för service. När myndigheter behöver hantera stora mängder dokumentation kommer NLP att tillåta dem att länka samman olika textdokument baserat på deras innehåll. Till exempel gynnar detta Arbetsförmedlingen i att förbättra matchningsprocessen mellan sökande och jobbannonser.

Fakta

Projektpartners: RISE, Peltarion, ArbetsförmedlingenLuleå tekniska universitet, TillväxtverketSkatteverketKungliga bibloteket och AI Sweden. RISE är ansvarig för projektledningen. Projektet finansieras av Vinnova.

Projektperiod: November 2019 - Oktober 2022

 

Arbetspaket och projektplan

Projektet kommer att slutföras i oktober 2022 och är uppdelat i fem arbetspaket.

Arbetspaket 1  
Data och utvärdering (AI Sweden 70% av WP1-timmarna)

Arbetspaket 2
Algoritmer och arkitektur

Arbetspaket 3
Implementering

Arbetspaket 4
Applikationer

Arbetspaket 5
Distribuering av resultat och koordination (AI Sweden 90% av WP5 timmarna)

Projektresultat och statusuppdatering (september 2020)

Data Readiness Level för Natural Language Processing (september 2020)

Om dokumentet: För myndigheter liksom alla organisationer som syftar till att använda sina egna data för att utveckla lösningar som involverar träning eller finjustering av språkmodeller, finns det vissa krav på datakvaliteten som behöver beaktas. Som en grund för projektet har RISE sammanfattat sin omfattande kunskap om dessa krav och relaterade utmaningar i ett vägledande dokument. 

"Syftet med detta dokument är att belysa och framhäva frågor relaterade till dataåtkomst, giltighet och nytta som kan uppstå i [dessa] situationer."

Dokumentet syftar till att "... ge insikter i vilken typ av utmaningar man kan stöta på, med avseende på data, när man ger sig in i ett projekt som involverar NLP. Dokumentet är inriktat på att ställa rätt frågor snarare än att ge en uttrycklig vägledning som täcker alla möjliga utmaningar i ett projekt: en sådan vägledning kommer oundvikligen att variera med den specifika uppgiften i åtanke".

För nerladdning

ArXiv version

 

Mer om våra initiativ inom Natural Langauge Understanding (NLU)

An open book with text
Förståelse av Natural Language Understanding (NLU) kommer att vara nyckeln till att fullt ut...

Kontakt

A picture of Magnus Sahlgren
Magnus Sahlgren
Head of Research, NLU
+46 (0)76-315 34 80