Resultatsida - Data Readiness Lab
Överbrygga datagapet i organisationer
Data Readiness Lab är mer än ett projekt; det är ett åtagande att ge organisationer möjlighet att utnyttja sin datas fulla potential. Oavsett om du börjar din AI-resa eller om du är en professionell, är våra leveranser utformade för att guida dig genom den mångfacetterade sfären av dataintensiva processer.
Data Readiness Lab initierades med en kärnvision: att rusta organisationer och företag med nödvändiga kunskaper, verktyg, ramverk och resurser för att förbättra deras databeredskap. Vårt labbs resultat är relevanta för både den offentliga och privata sektorn, eftersom vi inser den avgörande roll som data spelar för att förverkliga projekt.
Resultatöversikt
1. Fallstudier från offentlig sektor (på svenska)
En sammanställning av fyra fallstudier som belyser svårigheterna med att skaffa och använda data, med betoning på aspekter som datatillgänglighet, validitet och användbarhet. Dessa studier hämtar erfarenheter från:
- Strängnäs Kommun
- Sveriges Kommuner och Regioner (SKR)
- Arbetsförmedlingen
- Ekonomistyrningsverket (ESV)
Insikter från olika organisationer i olika stadier av datamognad ger värdefulla takeaways. Genom de medföljande exemplen vill vi erbjuda lärdomar och uppmuntra till eftertänksamhet och diskussioner om bästa praxis, bidra till bättre beslutsfattande i AI-tillämpningar och öka medvetenheten om dessa frågor eftersom de ofta förbises.
För en helhetsförståelse rekommenderar vi att du börjar med dessa fallstudier. Dessutom, för att bedöma beredskapen hos din valda datamängd, överväga analysmetoden för datamognad som vi använde i vårt labb:
- Roots of the Data Readiness Assessment Method
Vårt tillvägagångssätt för att bestämma datamognad går tillbaka till ett samarbete mellan Gavagai och AI Sweden (se artikeln "Vi behöver prata om data: betydelsen av databeredskap i naturlig språkbehandling”). Metoden utvärderar data utifrån perspektiven tillgänglighet, validitet och användbarhet. Denna metod har testats under projektet och även gjorts tillgänglig i Excel-format.
2: Text Annotation Handbook (på engelska)
En praktisk guide för maskininlärningsprojekt. Den här handboken är en praktisk guide om hur man närmar sig annotering av data. Den ger en introduktion till ämnet, en översikt över teoretiska begrepp samt praktiska råd. Ämnena som behandlas är mestadels tekniska, men affärsmässiga, etiska och regulatoriska frågor berörs också. Erfarenhet av annotering och kunskap om maskininlärning är användbara men inget krav. Dokumentet kan fungera som en primer eller referensbok för ett brett spektrum av yrken som teamledare, projektledare, IT-arkitekter, mjukvaruutvecklare och maskininlärningsingenjörer.
3.Verktyg för utövare:
-
Anonymiseringsverktyg:
nerblackbox, ett verktyg med öppen källkod som kan installeras lokalt och som fokuserar på anonymisering och pseudonymisering genom Named Entity Recognition (NER). Den använder namnigenkänning för att identifiera, ta bort eller ersätta personliga uppgifter. Länk till GitHub
nerblackbox is also documented in this paper:
Felix Stollenwerk. 2023. nerblackbox: A High-level Library for Named Entity Recognition in Python. In Proceedings of the 3rd Workshop for Natural Language Processing Open Source Software (NLP-OSS 2023), pages 174–178, Singapore. Association for Computational Linguistics. -
Verktyg för x-annotate:
x-annotate, ett projekthanteringsverktyg för korsannotering med populära annoteringsramverk. Den tillhandahåller ett enkelt kommandoradsgränssnitt (CLI) som låter dig dela data mellan annotatorer, slå samman anteckningar och lösa konflikter. Länk till GitHub
4.Träningsmaterial om databeredskap
Detta material finns tillgängligt på vår plattform MyAI, registrera dig gratis för att ta del av våra resurser kring data readiness.
Utbildningen syftar till att ge en överblick och möjlighet att komma igång med ditt projekt genom att titta närmare på lärdomar och metoder som används i Data Readiness Workshop.
Materialet är uppdelat i tre delar där du enkelt kan välja vad som passar dig, i vilken ordning du än föredrar.
Kontakt
