GPT-SW3
AI Sweden, har tillsammans med RISE och WASP WARA Media & Language, utvecklat en storskalig generativ språkmodell för de nordiska språken, främst svenska.
GPT-SW3 är den första riktigt stora generativa språkmodellen för svenska. Den är baserad på samma tekniska principer som OpenAI GPT-4. Genom den öppna licensen gör modellen det möjligt för svenska organisationer att bygga tillämpningar som tidigare inte var möjliga.
Vill ni använda GPT-SW3?
GPT-SW3 är släppt med en öppen licens och finns tillgänglig i sex olika storlekar. 126 miljoner, 356 miljon, 1,3 miljarder, 6,7 miljarder, 20 miljarder och 40 miljarder parametrar. Alla varianterna finns tillgängliga från AI Swedens kodbibliotek på HuggingFace. Storleken på modellen innebär att det krävs rejält med beräkningskapacitet för att kunna använda den.
- Vill du lära dig mer om GPT-SW3? På Discordservern AI Nordics möts utvecklarcommunityn i Norden, bland annat för diskussioner om GPT-SW3. Håll också ögonen öppna efter kommande workshops och seminarier.
- Vill du veta mer? Läs våra texter på Insights
- Anmäl ditt intresse för att få uppdateringar kring vårt arbete med GPT-SW3 och NLU
Frågor & svar
En så kallad generativ, förtränad modell. Genom att ha analyserat stora mängder text har språkmodellen hittat mönster i det svenska språket. De mönstren kan sedan användas för att komplettera text: När man skickar in en kortare eller längre text till en GPT-modell kommer den att komplettera texten på ett statistiskt rimligt sätt.
GPT-SW3 är däremot inte en produkt eller tjänst som är klar att användas. För att kunna använda modellen måste utvecklare bygga något med hjälp av den. Det kan vara en chattbot, en tjänst som sammanfattar dokument, eller något annat som bygger på språk.
Genom att träna modellen vidare på egen träningsdata kan organisationer finjustera GPT-SW3 att utföra specifika uppgifter.
Ja. Med den här releasen blir GPT-SW3 fritt tillgänglig för såväl privatpersoner som företag, myndigheter och andra organisationer.
Alla typer av tillämpningar som är möjliga att bygga med storskaliga språkmodeller: Lösningar för textanalys, klassificering, textgenerering, textbearbetning, innehållsmoderering, chattfunktioner och så vidare.
Nej. GPT-SW3 är inte en produkt, och AI Sweden är inte en organisation med resurser nog att ge teknisk support. Däremot finns en växande utvecklarcommunity kring modellen och användning av språkmodeller i Norden i stort. Den hittar du på Discord-servern AI Nordics, i GPT-SW3-kanalen. Det går också att använda communityfunktionerna på Hugging Face för att komma i kontakt med andra användare av GPT-SW3.
Fakta
Projektpartners: AI Sweden, RISE och WASP WARA Media & Language.
De nuvarande GPT-SW3-modellerna är tränade på Linköpings universitets superdator, Berzelius, med hjälp av Nemo Megatron-ramverket från NVIDIA.