De Universiteit van Nederland neemt al een paar jaar korte, 15 á 20 minuten durende colleges op van welsprekende onderzoekers over een (meestal) aansprkend onderwerpen.
Voor het leren van het Nederlands zijn dit ideale "clips": interessant, goed gebracht en duidelijk gesproken. De Nederlandse Taalunie is daarom een project gestart om een 60-tal clips te ondertitelen zodat non-natives die het Nederlands wel (een beetje) begrijpen, de clips (net iets) beter kunnen volgen.
De eerste stap wordt door de spraakherkenner gedaan. De resultaten zijn behoorlijk goed, maar net niet goed genoeg voor het beeogde doel. Daarom worden de herkenningsresultaten door werkstudenten van de Radboud Universiteit gecorrigeerd. De juiste tekst wordt vervolgens opnieuw door de herkenner gehaald maar nu met de keuze "Forced Alignment" (FA) waarbij de juiste, gecorrigeerde tekst wordt opgelijnd met de audio.
Vervolgens wordt het resultaat van de FA weer gebruikt om een "perfecte" Karaoke en ondertiteling te maken.
Het resultaat staat hieronder.
Oorspronkelijk
UvN ASR
Ondertiteling
Karaoke
Gecorrigeerd
UvN FA
Ondertiteling
Karaoke