Het radio-archief van Omrop Fryslân FOTO OMROP FRYSLAN

Elk Omrop Fryslân-fragment is te vinden

Het radio-archief van Omrop Fryslân FOTO OMROP FRYSLAN

Omrop-uitzendingen van weleer nog eens beluisteren of bekijken om een bepaald fragment terug te vinden, het kan vanaf juli volgend jaar. Dankzij FAME: Frisian Audio Mining Enterprise.

Men neme een schaats-Elfstedentocht van jaren her, een valpartij en de naam van de schaatser die daaraan verbonden was. Het duurt nog maar even of je kunt deze gegevens intypen op een zoeksite van Omrop Fryslân en je krijgt het betreffende radio- en/of televisiefragment voorgeschoteld. In juli 2018 moet het zoekprogramma operationeel zijn.

Onlangs riep de Omrop vrijwilligers op om te helpen bij de laatste fase van dit project. Op de bandhoezen in het archief van de provinciale omroep staat wel papieren informatie met gegevens over de betreffende uitzending, zoals bijvoorbeeld de presentator, maar dit moet allemaal ingetikt worden om digitaal terug te kunnen vinden.

In 2013 begon de zoektocht van Jouke Algra van de Omrop om automatische spraakherkenning mogelijk te maken. Het medium had er zelf behoefte aan en zag in dat dit ook voor het publiek interessant kan zijn. Dat er bij een breed publiek interesse is voor het napluizen van historische gegevens, merken ze wel bij Tresoar, vertelt Henk van den Heuvel, directeur van het CLST (Centre for Language and Speech Technology) van de Radboud Universiteit in Nijmegen.

Want hier kwamen de Friezen terecht. ,,Nederlandse universiteiten doen nauwelijks iets aan de ontwikkeling van spraakherkenning. Wij zijn daar wel mee bezig’’, aldus Van den Heuvel. Het wachten was op financiering. Daarvoor kwam er in 2014 een kans met een nieuw programma van de Nederlandse Organisatie voor Wetenschappelijk Onderzoek (NWO): Creatieve Industrie. Dat is erop gericht wetenschappelijke samenwerking met bedrijven op te zetten. De universiteit had de Omrop als partner en scoorde met dit project omdat cultureel erfgoed vastgelegd wordt. Er kwam zo’n 350.000 euro beschikbaar om van juli 2015 tot juli 2018 aan het project te werken.

Wat spraakherkenning in het geval van de Omrop-fragmenten extra interessant maakte was het switchen in de uitzendingen tussen Fries en Nederlands. Soms zelfs binnen een zin. ,,Hoe herken je die overgangen? Die bouwstenen vinden was ook een belangrijk element in onze aanvraag.’’

Uiteindelijk gebruikten de taalonderzoekers achttien uren uitzending om helemaal uit te tikken. Dit werd de basis om het spraakherkenningsprogramma te trainen. Voor herkenning zijn drie componenten nodig, vertelt Van den Heuvel. De akoestiek (,,modellen van klanken’’), een woordenboek met akoestische symbolen (,,hoe spreek je een woord uit’’) en een taalmodel (,,combinaties van woorden om na te gaan hoe waarschijnlijk het is dat ze in een bepaalde volgorde voorkomen’’).

Van de akoestische modellen was uit deze achttien uur niet voldoende materiaal te halen om de spraakherkenner te trainen, dus werden Nederlandse en Engelse modellen toegevoegd. Straks is het mogelijk op verschillende manieren in het Omrop-archief te zoeken. Bijvoorbeeld op de naam van een Omrop-presentator. Niet alleen spraakherkenning is mogelijk, ook herkenning van sprekers.

Wil een bedrijfseigenaar weten wat de burgemeester zei bij de opening van zijn onderneming, dan tikt hij naam van de burgervader, van zijn bedrijf en de datum in en kan op zoek. ,,In dit geval wordt de zoeker niet gelinkt aan precies dat geluidsfragment, omdat persoonsherkenning niet helemaal perfect is. We willen niet dat mensen aan uitspraken gelinkt worden die ze niet gedaan hebben. Maar de zoeker krijgt wel de uitzending met de betreffende spreker voorgeschoteld en kan die beluisteren.’’

Van den Heuvel ziet zeker ook kansen voor andere toepassingen van Friese spraakherkenning. Zoals een cursus Fries via internet waarbij je woorden en zinnen inspreekt en de computer je dan vertelt of ze juist uitgesproken zijn.

Plus artikel gelezen
Je las zojuist een artikel.
Onbeperkt PREMIUM-artikelen lezen?

Lees nu PREMIUM vanaf € 1,15 per week. Je krijgt dan onbeperkt toegang tot al onze artikelen, video’s, columns en meer.

Probeer PREMIUM direct