Automatizácia prepisov parlamentných rozpráv pre Národnú radu SR

Nový systém na automatizáciu prepisov využíva technológie umelej inteligencie na konverziu zvukových stôp do textovej podoby.

IS AI Parlamentný asistent od Nuaktiv

Zdĺhavý manuálny proces prepisovania poslaneckých prejavov sa postupne stáva minulosťou. Agendu, ktorú doteraz zabezpečoval tím pätnástich prepisovateľov, nahrádza nový systém na automatizáciu prepisov využívajúci technológie umelej inteligencie na konverziu zvukových stôp do textovej podoby.

Riešenie je vyvíjané a implementované spoločnosťou Nuaktiv ako podporný modul k existujúcemu Automatizovanému systému pre správu prepisov (AOTS na platforme ActiveOffice) v prostredí Kancelárie Národnej rady SR.

Nový systém odbremeňuje zamestnancov parlamentu od rutinných úloh a zároveň prispeje k rýchlejšiemu sprístupneniu vystúpení verejnosti. Textové prepisy by mali byť dostupné prakticky „just in time“. Riešenie je aktuálne nasadené v Národnej rade SR a nachádza sa v testovacej prevádzke, ktorá potrvá približne šesť mesiacov.

Ako fungovali prepisy doteraz

Doterajší proces prepisovania poslaneckých rozpráv bol plne manuálny. Videozáznamy sa – bez ohľadu na ich dĺžku – rozdelili na 15-minútové úseky, ktoré spracovával tím prepisovateľov. Každý úsek následne prešiel kontrolou, korekciou a jazykovou úpravou, aby bol výsledný text formálne presný a jednotný.

Vzhľadom na rozsah vstupov, špecifiká parlamentnej terminológie a náročnú postprodukciu bol tento postup časovo aj administratívne náročný. Národná rada SR sa preto rozhodla proces automatizovať využitím služieb Speech-to-Text (STT). Cieľom je skrátiť čas potrebný na spracovanie prepisov, zvýšiť presnosť a umožniť paralelné spracovanie viacerých záznamov naraz.

Riešenie, ktoré pracuje v reálnom čase

Nové riešenie od Nuaktivu spracúva videozáznam kontinuálne. Po skončení každého 15-minútového úseku systém automaticky prijme zvukový alebo video súbor, skonvertuje ho do požadovaného formátu, vykoná prepis reči do textu a následne aplikuje postprocessing. Výsledkom je čitateľný a štruktúrovaný text, ktorý je k dispozícii už do piatich minút od spracovania úseku.

„Riešenie sme navrhli ako modulárnu ‘krabicu’, vďaka čomu je možné ho jednoducho nasadiť v cloude, integrovať do existujúcej infraštruktúry alebo používať ako samostatný backend komponent. Podporované je dávkové aj asynchrónne spracovanie, čo umožňuje flexibilne využívať rôznych poskytovateľov STT služieb podľa potrieb."

Dušan Pagáč, analytik Nuaktivu zodpovedný za realizáciu projektu

Pravidlá, výnimky a jazykové nuansy: najväčšia výzva projektu

Prepis parlamentných rozpráv sa riadi približne 60 presne definovanými pravidlami, ktoré upravujú formu aj obsah výsledného textu. „Národná rada SR má jasné požiadavky na to, ako má prepis vyzerať a aké informácie musí obsahovať,“ vysvetľuje Dušan Pagáč.

Ide napríklad o povinnosť uvádzať presné názvy zákonov, politických subjektov, organizácií, správne písať skratky ako Z. z., čl. či nahrádzať slová ako lomeno príslušným symbolom. Špecifickú výzvu predstavovali aj niektoré zvukové prvky – napríklad parlamentný gong, ktorý systém spočiatku prepisoval ako sériu číslic.

Post-processing: jazykový modul, ktorý dáva textu formu

Nuaktiv bol dodávateľom aj Digitálneho elektronického systému hlasovania pre NR SR, ktorý je prepojený so speech-to-text prepismi a umožňuje presnú identifikáciu rečníkov či parlamentných strán.

Kľúčom celého riešenia je prepracovaný post-processingový modul:

  • analyzuje vetnú štruktúru,
  • dopĺňa interpunkciu a normalizuje text,
  • identifikuje mená, organizácie a ďalšie entity,
  • priraďuje vystúpenia ku konkrétnym zákonom,
  • zabezpečuje jednotnosť a zrozumiteľnosť výsledného výstupu.

Systém kombinuje pravidlá, štatistické modely a jazykové heuristiky, ktoré sa prispôsobujú typu textu aj jeho kontextu. Na rozdiel od generatívnych jazykových modelov presne vie, čo upravuje – nikdy nemení význam vietVýsledkom je stabilný, transparentný a predvídateľný text pripravený na korektúru, publikáciu alebo archiváciu.

Dva STT modely, jeden víťaz

Počas testovacej prevádzky využíva riešenie dvojicu modelov umelej inteligencie na prepis: systém od Google a technológiu Whisper od OpenAI. Nuaktiv vytvoril algoritmus, ktorý umožňuje ich priebežné vyhodnocovanie – každý model hodnotí svoju presnosť na základe porovnania s manuálnymi prepisom.

Po šiestich mesiacoch bude Kancelária Národnej rady SR disponovať dátami, ktoré umožnia rozhodnúť, ktorý model ponúka najpresnejšie a najspoľahlivejšie výsledky pre slovenský jazyk. Toto riešenie potvrdzuje, že umelá inteligencia nemusí byť nepredvídateľná ani experimentálna. Kombinácia deterministických NLP metód, transformátorového NER a presne definovaných pravidiel umožňuje spracovať jazyk presne, konzistentne a reprodukovateľne.

Hotové prepisy zverejňuje Národná rada SR na svojom Mediálnom portáli, kde sú dostupné spolu s videozáznamami rokovaní. Nový systém tak výrazne skracuje cestu od prejavu poslanca až k jeho sprístupneniu verejnosti.

Vývoj aplikácií

27.11.2025

Všetky aktuality