BRS85 - Erfgoed van een Oorlog

Door: Arjan van Hessen (Universiteit Twente/Telecats), Michel Boedeltje (Telecats), Petra Links en Ruben de Vos (NIOD)

Achtergrond

Oorlog is een van de meest ingrijpende gebeurtenissen in een mensenleven. Angst, onzekerheid, dood en verdriet aan de ene kant en saamhorigheid, intensiteit, hoop en vreugde aan de andere kant. In veel (gesproken) getuigenissen komen deze twee facetten van een oorlogssituatie duidelijk naar voren (“de mensen waren toen nog aardig en iedereen hielp elkaar, iets dat na de oorlog snel verdween: toen was het weer ieder voor zich”).

Tijd heeft een enorme impact op herinneringen van mensen en het kan goed zijn dat, met het verstrijken van de tijd, zowel positieve als negatieve indrukken duidelijk de boventoon gaan voeren in de herinneringen aan de oorlogssituatie. Het is daarom interessant om te zien hoe mensen zich de situatie vlak na de oorlog herinneren en hoe dat een groot aantal jaren later wellicht veranderd is. De officiële, grote geschiedenis wordt dikwijls door “de staat” en/of “autoriteiten” geschreven. Persoonlijke herinneringen van mensen aan “hun oorlog” kunnen echter een enorme verrijking en nuancering betekenen van het algemene, officiële beeld en geven beter dan wat ook inzicht in de “emotionele staat” van de betrokkenen. Oral History (het opnemen, bewaren en interpreteren van historische informatie, gebaseerd op de persoonlijke ervaringen en meningen van de spreker)[1] is een bloeiende tak van wetenschap, mede door de dalende prijzen en stijgende geluidskwaliteit van de opnamen en de toegenomen eenvoud om de opnamen voor iedereen beschikbaar te stellen.

In dit artikel zullen we eerst kort de twee gebruikte vormen van spraakherkenning behandelen en vervolgens drie verschillende en elkaar opvolgende Oral History projecten. Ten eerste het CATCH-project CHORAL. Vervolgens bespreken we het Getuigen Verhalen project, onderdeel van het grote VWS programma “Erfgoed van de Oorlog”. Tenslotte zullen we aandacht schenken aan het pas gestart CROME-project, waar de in Nederland ontwikkelde spraak- en ontsluitingstechnologie wordt ingezet in het nader tot elkaar brengen van de verschillende bevolkingsgroepen in de voormalige Joegoslavische deelrepubliek Kroatië.

Taal- en Spraaktechnologie (TST)

Met behulp van inmiddels bekende en veelgebruikte technieken om teksten doorzoekbaar te maken is het eenvoudig om in de transcripties van AV-materiaal te zoeken. Echter, met de huidige mogelijkheden en de trend om materiaal multimediaal op te slaan en te presenteren, zal een groot deel van de gebruikers de gezochte interviews direct willen beluisteren en/of bekijken zodat niet alleen duidelijk wordt wat er gezegd werd maar ook hoe! Men wil als het ware in de interviews zelf kunnen zoeken en beleven hoe een en ander gezegd werd. Moderne Taal- en Spraaktechnologie maakt dit mogelijk zoals hierna zal worden uitgelegd.

Herkenning

Taalmodel

Het klinkt wellicht tegenstrijdig, maar om spraak goed te kunnen herkennen (zowel door de mens als de computer), moet de spraak zo voorspelbaar mogelijk zijn. Mensen die een taal slecht beheersen en dus veel minder makkelijk kunnen voorspellen welke woorden eventueel gezegd zullen worden gegeven de al gesproken woorden, zullen a) deze taal als veel sneller ervaren en b) veel meer moeite hebben om de spraak te herkennen. Een beetje achtergrond ruis of muziek lijdt dan direct tot een sterke afname van de herkenning. Dit is voor computers niet anders en we kunnen de huidige software het best vergelijken met een brugklasser die net z’n eerste lessen Frans heeft gehad. Hoe meer voorbeelden hij zal krijgen, hoe beter hij een zin zal kunnen afmaken en dus hoe beter z’n Frans zal worden.

Om de computer te laten leren welke woorden gesproken kunnen worden, worden grote hoeveelheden tekst die over dezelfde onderwerpen gaan als de spraak die herkend moet gaan worden, aan de computer aangeboden. Die leert als het ware de mogelijke woorden en de volgorde waarin deze woorden gesproken kunnen gaan worden. Hoe beter vervolgens de spraak “past” op deze teksten, hoe beter de spraak herkend zal worden. Het resultaat van het leren van de computer is een statistisch taalmodel waarin de kans op een woord en een woordcombinatie ligt opgeslagen. Wanneer er dus interviews herkend moeten gaan worden die over de “NSB”, “concentratiekampen”, “joden” en “Dolle Dinsdag” gaan, dan moeten zoveel mogelijke teksten die hierover gaan, aan de computer worden gegeven. Hiermee moet men dan niet interviews gaan herkennen die over de aanval op Pearl Harbor of over de Japanse bezetting van Indonesië gaan omdat hier andere woorden en woordcombinaties gebruikt zullen worden!

Spraakherkenning

Ondank al deze maatregelen, zal voorlopig de herkenning niet veel beter zijn dan 60%: dwz dat 4 op de 10 woorden fout herkend zullen worden. Toch laten de toepassingen zien dat dit in de regel voldoende is voor het zoeken in de interviews. Wil men spraakherkenning gebruiken voor het ondertitelen dan moet men op minimaal 95% correcte herkenning zitten; iets dat anno 2010 met gewone, spontane spraak nog niet goed mogelijk is.

Van spraakherkenning naar oplijning

In veel gevallen is de spraak volledig uitgeschreven zodat er gebruik gemaakt kan worden van oplijning: spraakherkenning waarbij vooraf bijna precies bekend is wat er gezegd gaat worden. Er is hier dus sprake van een optimale voorspelling en het enige dat de software eigenlijk moet doen is de woorden op de juiste plek (= tijd) zetten. Het resultaat is een bijna 100% correct “herkende” tekst, zelf als binnen een zin de woordvolgorde in de opname anders is dan de woordvolgorde in de uitgeschreven tekst (of wanneer er delen van de zin missen). Dit resultaat maakt het mogelijk om de resultaten van de oplijner behalve voor het zoeken in de audiovisuele bestanden ook voor het ondertitelen ervan te gebruiken.

In de hierna te bespreken projecten wordt gebruik gemaakt van zowel oplijning als spraakherkenning.

CHORAL

Radio Oranje

In 2002 leidde een bezoek van de HMI-groep van de Universiteit Twente aan het NIOD in Amsterdam tot een initiatief om m.b.v. de in Twente ontwikkelde spraaktechnologie de historische geluidsopnamen en de vooraf uitgeschreven teksten van de toespraken van Koningin Wilhelmina voor Radio Oranje (Londen, 1940-1944) te synchroniseren en via het Internet beschikbaar te stellen.[2]

Brandgrens

Na de succesvolle lancering van deze website werd besloten het Radio Oranje Project onder te brengen bij het pas gestarte CHATCH-project CHORAL[3] (2005-2010). In het CHORAL project werd “echte” spraakherkenning ingezet om de gesproken collecties van Radio Rijnmond te kunnen ontsluiten. Een mooi resultaat hiervan is de website over de brandgrens[4]: de grens van het in de meidagen van ’40 platgegooide deel van Rotterdam. 16 ooggetuigen vertellen over hun belevenissen voor, tijdens en na het bombardement. Alle interviews zijn mbv spraakherkenning doorzoekbaar gemaakt.

Naast deze projecten heeft de Universiteit Twente ook nog meegedaan aan het ontsluiten van:

39 interviews met overleveraars van Buchenwald,
9 interviews met vrouwelijke hulpverleners uit de begin dagen van de tweede feministische golf

De gesproken versie van het dagboek van Anne Frank

Uiteindelijk besloot de HMI-groep[5] van de Universiteit Twente, ondanks de nog steeds groeiende vraag, te stoppen met het ontsluiten van nog meer Nederlandse OH-collecties. Om de kennis niet verloren te laten gaan, werd besloten de activiteiten onder te brengen in het project VerteldVerleden[6]: een samenwerking van verschillende Culturele Erfgoed instellingen, Beeld en Geluid en de Universiteit Twente. Ook werd de kennis beschikbaar gesteld aan verschillende MKB-bedrijven.

Getuigen Verhalen

Waarom?

Er zijn steeds minder mensen die zelf (bewust) de oorlog hebben meegemaakt: iemand die 10 jaar was toen de oorlog begon, is nu al 80. Willen we de verhalen van deze mensen voor het nageslacht bewaren, dan moet er haast gemaakt worden met het optekenen. Dit is de reden geweest waarom het ministerie van VWS besloot geld beschikbaar te stellen om een groot aantal getuigenissen vast te leggen en waar mogelijk op het internet te publiceren. De Oral History-poot van het programma[7] is bekend als het project Getuigen Verhalen[8] en omvat 46 Oral History projecten. Begin 2010 vroeg het ministerie van VWS, het NIOD (Nederlands Instituut voor Oorlogsdocumentatie) de website Getuigen Verhalen op te zetten en te beheren: sinds 16 september j.l is deze website actief[9].

Ontsluiting

Een vereiste van de subsidiegever, het ministerie van VWS, was dat de opgenomen interviews door medewerkers van de verschillende projecten zo “letterlijk mogelijk” zouden worden uitgeschreven; deze teksten zouden dan samen met de interviews in het archief moeten worden opgenomen. Hierdoor was de tekst van de interviews beschikbaar en kon er worden opgelijnd. Omdat de Universiteit Twente dit soort grote projecten niet meer wilde doen (er was immers geen sprake meer van vernieuwend onderzoek), werd Telecats gevraagd de spraak op te lijnen. Op moment van schrijven is men hard bezig de meer dan 200 uur AV-materiaal op te lijnen. Alle eenmaal opgelijnde opnamen kunnen vervolgens op woord niveau doorzocht worden.

Na het Getuigen Verhalen project (eind 2010) zal de zelfde oplijningstechnologie gebruikt gaan worden om 150 uur interviews over de late gevolgen van Sobibor op een zelfde wijze te ontsluiten.

Crome

Documenta

Het ministerie van Buitenlandse zaken stelt via het MATRA-programma (MAatschappelijke TRAnsformatie) geld beschikbaar voor projecten in landen die op de drempel staan om lid te worden van de Europese Gemeenschap. Het doel van zo’n MATRA-project is het vergemakkelijken van de overgang naar volwaardig EU-lid. Een van de landen op de drempel is Kroatië: een land dat van 1990 tot 1995 verwikkeld was in een hevige oorlog/burgeroorlog waarbij de verschillende eens zo vredig naast elkaar levende bevolkingsgroepen (Kroaten, Serviërs en Bosniërs) elkaar naar het leven stonden. Omdat na het beëindigen van de oorlogshandelingen deze bevolkingsgroepen nog steeds met elkaar door een deur moesten (niet alle Serviërs en Bosniërs waren verdreven) vatte de Kroatische mensenrechten organisatie Documenta het plan op om een grote collectie audiovisuele interviews op te nemen en mbv moderne taal- en spraaktechnologie te ontsluiten. Het plan lijkt dus erg op de andere twee beschreven projecten, zij het dan dat de Kroatische TST veel minder ontwikkeld is dan de Nederlandse. Bovendien wilde men de opgenomen interviews voor de gehele wereld beschikbaar stellen. Daarom moeten de interviews dus ook vertaald worden waarbij de synchronisatie met de oorspronkelijke spraak behouden moet blijven.

Het project, een samenwerking van de Erasmus Universiteit, de Universiteit Twente, DANS, Documenta en het Amsterdamse bedrijf Noterik, behelst het opnemen van 500 interviews met een dwarsdoorsnede van de Kroatische bevolking, het uitschrijven, oplijnen en vertalen van de interviews en het ontsluiten ervan via een website. Anders dan de oude Oral History projecten zoals hierboven beschreven, is dit project wetenschappelijk wel interessant omdat er allerlei nieuwe zaken spelen zoals meertaligheid, het ontbreken van een goede Kroatische spraakherkenner en het online toevoegen van additionele documenten en metadata. Bovendien zal onderzocht worden in hoeverre fragmenten van de verschillende interviews (semi-)automatisch aan elkaar gekoppeld kunnen worden zodat er virtuele collecties kunnen ontstaan.

Gevoeligheid

Doordat de gebeurtenissen in Kroatië nog vers in het geheugen liggen, is de emotionele lading bij de meeste interviews een stuk hoger dan bij de WOII verhalen in Nederland. De kans op serieuze uitglijers (het (ongefundeerd) beschuldigen van anderen, het verklappen van geheimen van nog levende personen) is dan ook een stuk hoger. Al het materiaal moet beoordeeld worden op de mogelijke gevolgen die het publiceren via Internet kan hebben voor zowel de geïnterviewden als voor anderen. Gevoelige stukken moeten onder embargo gezet worden maar niet zomaar verwijderd. Dit gebeurt trouwens ook bij delen van de getuigenverhalen-collectie (bv de interviews met dochters van NSB-vrouwen). Al het oorspronkelijk materiaal zal worden opgeslagen bij DANS in Den Haag en alleen de “goedgekeurde” onderdelen van de interviews zullen via de website openbaar gemaakt worden.

Conclusie

Dankzij de inzet van Taal- en Spraaktechnologie is het nu mogelijk om niet alleen in de handmatig toegevoegde metadata maar ook direct in de spraak van de interviews te kunnen zoeken. Eenmaal gevonden fragmenten kunnen bovendien direct beluisterd/bekeken worden hetgeen de collecties naar verwachting een stuk interessanter zal maken voor zowel wetenschappelijke onderzoekers als voor geïnteresseerde leken. Deze nieuwe manier van ontsluiten vormt enerzijds een belangrijke toevoeging aan het levend houden van de getuigenissen van de oorlog en anderzijds een goed middel voor het kweken van begrip voor de “ander”.

https://en.wikipedia.org/wiki/Oral_history
https://hmi.ewi.utwente.nl/choral/radiooranjestatic.html en http://hmi.ewi.utwente.nl/choral/radiooranjestatic.html en DIXIT jaargang 4 nr 2, dec, 2006
https://hmi.ewi.utwente.nl/choral/index.htmls
https://www.rotterdam4045.nl/
https://hmi.ewi.utwente.nl/
https://www.verteldverleden.org
https://www.rijksoverheid.nl/onderwerpen/tweede-wereldoorlog/erfgoed-van-de-oorlog
Het project Getuigen Verhalen is uitgevoerd met een financiële bijdrage van het Ministerie van VWS in het kader van het programma Erfgoed van de Oorlog. De website www.getuigenverhalen.nl is gemaakt en wordt beheerd door het NIOD. Zowel de openbare als de beperkt openbare interviews zijn digitaal opgeslagen bij het KNAW-instituut DANS (Data Archiving Network Services).

Hoe komen chatbots als ChatGPT tot hun antwoorden?

Een Introductie in Automatische Spraakherkenning

Wat is Spraaktechnologie?

Rights Defender Claire Hédon

From Chat to Voice

The BIAS of AI-Speech

Wat is de AI-Bias?

NLP versus NLU versus NLG

Onderzoekers van de UT op TV

Kunstmatige juristen rukken op

Dive into the future met AI

Erfgoed van een Oorlog