Eduskunta
Protokollbyrån vid riksdagens kansli har till uppgift att dokumentera riksdagens alla plenum snabbt och pålitligt. Lingsofts taligenkänning stöder effektivt det här arbetet och den nya taligenkänningen som grundar sig på generativ artificiell intelligens har utvecklat anteckningsprocessen så den är smidigare och mer flexibel än förut.
Protokollbyrån vid riksdagens kansli upprättar textdokument om plenum. Arbetet tjänar vid sidan av det politiska beslutsfattandet även medborgarna och medierna och är en central del av öppenheten i det parlamentariska systemet. Det samlas rikligt med material på årsnivå.
– Vår uppgift är att i textform anteckna alla anföranden som hållits och beslut som gjorts i plenum och även att beskriva beslutsprocessen. Beroende på året finns det som mest material för upp till 600 timmar, berättar Maarit Peltola, byråchef vid protokollbyrån.
En lättnad i den tunga processen
Traditionellt har det varit tungt att producera protokoll: dokumentsekreterarna har manuellt skrivit ner inspelningarna till text, varefter specialsakkunniga redigerar texten så att den kan publiceras. Enligt Peltola kräver processen snabbt och noggrant skrivande.
– Den traditionella processen är mycket intensiv och tung. Därför behövs metoder för att underlätta och påskynda arbetet, och samtidigt måste man naturligtvis se till att publikationen håller hög kvalitet.
Man kunde bekanta sig med taligenkänning redan i början av 2010-talet och 2019 testade riksdagen för första gången Lingsofts taligenkänning. I och med försöken och upphandlingsprocessen inleddes det egentliga samarbetet mellan riksdagen och Lingsoft till slut i mars 2022.
– I början av samarbetet användes lösningen för taligenkänning via webbgränssnittet, men när verktyget integrerades i riksdagens eget inspelningssystem tog man ett stort steg framåt i utvecklingen: filidentifieringen fungerar snabbare och noggrannare än live-identifieringen, beskriver Maarit Peltola.
Ett kvalitativt kliv framåt med skräddarsydda och finjusterade språkmodeller
Våren 2025 infördes en ny taligenkänningsmodell baserad på artificiell intelligens som finjusterats med riksdagens material. Resultatet har varit klart bättre än tidigare: den nya modellen producerar menings- och satsindelning, de flesta gångerna någon stakar sig och upprepar sig försvinner automatiskt och artificiell intelligens utför också preliminärt redigeringsarbete.
– Den nya modellen har återigen varit ett kliv framåt, eftersom den skapar en mycket längre färdigbearbetad text. Naturligtvis behövs människans arbetsinsats fortfarande. Alla ord identifieras inte alltid korrekt och alla menings- och satsindelningar blir inte varje gång rätt. Ett bra botten som taligenkänningen producerat gör det möjligt att koncentrera sig på den egentliga uppgiften, dvs. att redigera tal till begriplig läst text.
Enligt Peltola har också arbetssättet förändrats. Tidigare var arbetet strikt delat in i roller där man bearbetade materialet till text och redigeringen – nu kan en person vid behov göra hela processen från början till slut.
Framåt genom samarbete
Maarit Peltola berömmer Lingsofts praktiska verksamhet och goda kommunikation. Samarbetet har varit smidigt, kontakten har varit öppen och man har reagerat snabbt på önskemål och förfrågningar.
– Lingsoft kombinerar teknisk sakkunskap och lingvistisk kompetens. Det har varit viktigt för oss.
Arbetet med taligenkänning fortsätter aktivt i riksdagen. Målet är att ytterligare förbättra noggrannheten och utveckla integrationen mellan systemen.
– Målet är att systemen ska fungera ännu smidigare tillsammans. Att förbättra identifieringens noggrannhet är alltid på önskelistan – men redan under de senaste tre åren har identifieringen utvecklats mycket.
Nyckeltal
- Riksdagens protokollbyrå ska producera och publicera protokoll från plenum, dvs. officiella handlingar, över vad som sagts vid sammanträdena
- Byrån är en del av förvaltningen av riksdagens kansli
- Beroende på riksmötesåret hålls 80–180 plenum
- Antalet plenartimmar är cirka 300 till 600 timmar
- År 2024 hölls sammanlagt 140 plenum och antalet plenartimmar var 565
- År 2024 var antalet ord som identifierades med Lingsofts taligenkänning nästan 3,5 miljoner ord, dvs. cirka 550 timmar tal
- Lingsofts taligenkänning används av 23 experter på protokollbyrån