Op het Drongo Talen Festival wordt voor het eerst op grote schaal een nieuwe speech-to-text technologie gebruikt, waardoor bezoekers van lezingen de vertaling direct op hun mobiel te zien krijgen. Arjan van Hesse van de Universiteit Twente is één van de sprekers tijdens het festival. Welkom in de uitzending. Wat is er zo bijzonder aan deze nieuwe technologie die tijdens het festival getest gaat worden? Nou, vooral dat het nu eens een keer echt in de praktijk getest gaat worden. We zijn al jaren bezig met dit soort technologieën. Het zal zeker ook niet perfect werken, maar we zien in toenemende mate dat door steeds betere automatische vertalingen, steeds betere spraak naar tekstomzettingen, we langzaam in de buurt komen om als de inhoud niet te ingewikkeld is, realtime, of bijna realtime, dit soort vertalingen te gaan doen. Je kunt het vergelijken met een tolt die simultaan wordt vertaald. Die doet het ongetwijfeld nog beter, maar we komen heel end in de richting. Dus ik ben ook heel erg benieuwd naar wat we morgen en overmorgen, of vrijdag en zaterdag, te zien krijgen in Nijmegen. Ja, wat verwacht je ervan? Ik vraag dat we daar de bekende fouten zullen zien en dat is niemand aan te wrijven. Het is nog heel erg lastig. Baidu, dat is de Chinese techgigant, heeft vier dagen geleden ook een soort simultaan vertalen, alleen Amerikaans-Chinese-Chinese-Amerikaans geïntroduceerd. En wat ze daar doen, en dat kennen wij eigenlijk heel erg in het Nederlands en het Duits, dat zijn talen waarbij soms het beslissende werkwoord dat aangeeft waar het over gaat, of wat er gedaan gaat worden, helemaal op het einde komt. En dus het hout dat ik vorige week gekocht heb, ga ik vrijdag, nou maak het anders af. Dus dan moet je wachten tot het helemaal, tot het einde van de zin, voordat je kunt beginnen met het vertalen in het Engels waar je dat naar voren haalt. Nou, Baidu zegt, en dat is heel erg mooi, we proberen dit soort zin alvast te gaan voorspellen. Waarschijnlijk gaat het over hout hakken en hout zagen, of nou ja. En hoe beter je dat kunt voorspellen, hoe beter je dus ook die simultaan vertaling kunt doen. Ja, wat doen de simultaanvertalers natuurlijk gewoon zelf ook. Ja, die doen dat ook, maar alleen wat een mens kan zeggen, die kan zich herpakken. En nu zeg ik op een gegeven moment, ik verwacht hakken en dan is het toch zagen. Ja, we maken er een leuke draai aan. Precies. Ja, precies. Gebeurt dit nou op het Drongo Talenfestival ook tegelijkertijd in meerdere talen? Dus de presentatie is in het Nederlands bijvoorbeeld en dan wordt dan in eerdere talen vertaald? Nee, de presentatie is in het Pols en de vertaling is in het Engels. En dat is natuurlijk ook logisch, want kijk, dit soort technieken beginnen altijd met wat grotere talen. Nou, het Nederlands kent maar, wat is het, 20 miljoen sprekers, dus dat is gewoon niet een echt grote taal. Dus de eerste instantie gaat dat richting het Engels. Maar als de techniek erin gericht is en er zijn data, dan is het niet zo heel erg moeilijk. We doen het al, zelf wel naar het Nederlands, van het Italiaans naar het Nederlands. Maar dat is nog niet simultaan. Dat doe je pas als je een echte zin hebt. Dat is denk ik ook iets wat we morgen zullen zien of vrijdag zullen zien, daar ben ik heel erg benieuwd naar. Als jij en ik met elkaar praten, dan spreken wij grammaticaal niet correct. Jij maakt fouten, ik maak fouten. Spreektaal doen we dat. In het tegenwoordige tijd, ik ga over in het verleden, dat is gewoon spreektaal. En wij mensen kunnen dat heel goed scheiden van nou, dit is eigenlijk, kan ik weggooien deze informatie, hier komt beslissende informatie. Voor een spraakherkenner is dat lastig. Die begint gewoon wat hij hoort om te zetten in tekst. Die tekst gaat naar een automatische vertaling en die gaat alles vertalen. Wij spreken niet in zinnen. Dus een van de grote uitdagingen is hoe kun je nou een zin die eigenlijk geen zin is, goed vertalen. Heel spannend wordt dat. Hartelijk dank Arjan van Hesse van het Drongo Talen Festival. Dat plaatsvindt op 9 en 10 november bij de Radboud Universiteit in Nijmegen. We zijn heel benieuwd naar de resultaten.
Time_index | Confidentiality | Speaker |
---|---|---|