Line

BNR Nieuwsradio, Hemmen. De nieuwe privacy-wetgeving in Europa zorgde voor dat Europese tech-bedrijven op grote achterstand komen op het gebied van kunstmatige intelligentie. En dan gaan Amerika en China er met het nieuwe IT-goud vandoor, zegt mijn gast, onderzoeker taal- en spraaktechnologie aan de Universiteit van Twente Arjan van Hesse. Welkom meneer van Hesse, goeiemiddag. Het nieuwe IT-goud, het is uw term, wat is het? Even wat achtergrondinformatie. We doen al heel lang spraakherkenning, dat is al een heel lange droom zeg maar in de wetenschap. Ik zeg iets en dat wordt uitgeschreven op tekst. Dat gaat eigenlijk steeds beter werken en we zijn nu de volgende stap aan het maken van spraak naar begrijpen. Dus niet wat zeg jij, maar wat bedoel je. Om dat te doen, dat is zeg maar de talige informatie van de mens en wij zijn daar heel erg knap in. We gebruiken daarbij onze grammatica, de kennis van de wereld. De achtergrond, als ik met jou praat, ik ken jou niet zo goed, ga ik uit van andere kennis bij jou, dus ik leg dingen anders uit. Al dat soort zaken die willen we heel graag eigenlijk met computers nakunnen doen. En dat is natuurlijk de richting AI. Dus de kunstmatige intelligentie is nu nog vrij zwak. Dat is echt voor één probleem is het heel goed, maar daar blijft het ook bij. En we willen, tenminste als onderzoeker, naar een soort sterke AI dat echt de menselijke geest nadoet. Nou, dan moeten we dus dit soort processen nakunnen maken. En u zegt, we zijn nog niet zo ver op dat gebied. Kunstmatige intelligentie is nog wel een beetje dom. Maar waar staan we nou precies? Nou, helemaal in het begin. O, echt? Ja, kijk, de Kunstmatige intelligentie, alles wat we zien, en elke week zie je eigenlijk wel weer nieuwe update. Google wint een spelletje. Herseskents kunnen geïnterpreteerd worden beter door de computer dan door mensen. Watson wint quizzes, etc. Maar het is steeds één ding. Een mens kun je ergens neerzetten en dan kun je van context switchen en dan zeg je, goh, maar over Maxima, vertel eens wat vind je daarvan? En even later kun je het hebben over de AEX-index of over het weer. Al dat soort begrippen wij mensen kunnen heel gauw schakelen en kunnen eigenlijk alles. Wij kunnen plannen en al dat soort zaken. De AI die we op dit moment hebben kan één ding, heel goed, maar daar blijft het bij. En wat we willen is dus een meer algemene AI maken die richting schuift van de mens. Die denkt zoals u en ik en ook zo spreekt en dat aanvoelt als wij dat bedoelen. Dat een robot die bedoelingen kan aanvoelen. Wow, dus daar zijn we nog wel even van verwijderd. Ja, het gaat hard. Dus we zullen wel zien dat het die kant op gaat. Maar ik had een voorbeeldje laatst. Ik hoorde op een bandje wat ik aan het afluisteren was iemand die zei doe mij een goede Chinees. Dat is raar, doe mij een goede Chinese die meneer bedoelt, geef mij een goed Chinese restaurant hier in de buurt. Dat is iets wat wij Nederlanders heel makkelijk begrijpen, dat zit in onze cultuur, we horen dat, maar als je dit letterlijk zou vertalen naar het Engels, doe me Chinese, dan vraag je me af of we dat zouden begrijpen. Dus je ziet de cultuur, onze menselijke cultuur is ook cultuur gebonden, context gebonden, die is heel erg ingewikkeld om te begrijpen. En om dat goed te kunnen doen, en dat was natuurlijk de aanleiding van jouw vraag, hebben we talige data nodig. We hebben dus echt de uitingen van mensen nodig. En wat je nou ziet met die GDPR, waar ik op zich een groot voorstand over ben, het is echt heel erg goed. Dat is die Europese Privacy website? Ja, dat is de General Data Protection Regulation die dus aangeeft wat je nou met de data mag doen. En waar men over het algemeen heel bang voor is, en dat is logisch, is dat jouw persoonlijke data gewoon op straat ligt. Dat ze kunnen zien wat mijn ziektegeschiedenis is, wat mijn financiële situatie is, waar ik ben geweest, al dat soort zaken. En daar is het natuurlijk heel erg goed voor. Maar waar je voor moet oppassen is dat je het kind niet met badwater weggooit. De persoonlijke manier waarop jij spreekt kan, als ik dat over heel veel mensen verzamel, heel erg nuttig zijn om algoritmes te laten leren van hoe mensen in Nederland ongeveer zouden kunnen spreken. En daar kan ik ze algoritme oplossen laten om te zorgen dat een computer een mens beter begrijpt. Dus ik heb juist die talig informatie nodig die uit mensen komt. En op welke manier staat die Europese privacy-wetgeving dat dan in de weg? Omdat die niet herleidbaar mag zijn naar de persoonlijke data. En dat is natuurlijk ook met allerlei algoritmen. We zijn heel erg goed tegenwoordig in, als ik zeg, ik wil een stuk hebben van Mark Rutte. wil ik niet een nieuwsuitzending hebben waar gesproken wordt over Mark Rutte, maar ik wil een nieuwsuitzending hebben waarin hij spreekt, dus ik moet zijn stem herkennen. Dat gaat behoorlijk goed. Dat wil zeggen dat die hele privacy lastig is, want als ik dat straks heel erg goed kan, en daar de Chinezen doen dat in een bepaalde provincie, doen ze dat al onder het mond van veiligheid, gaan ze van iedereen een persoonlijke stemfingerprint maken, zeg maar. Als dat straks heel erg goed kan, dan wordt het lastig om die privacy te wijborgen. Want dan hoor ik wat, ik haal het door het algoritme. De politie doet het natuurlijk al. En gaat zeggen, dit is waarschijnlijk Pietje, Klaas of Jan. En waar blijf je dan met je privacy? Dus dan is de eerste instantie dat je zegt nee, dat mag niet, want het mag niet herleidbaar zijn tot een persoon. En dat is de kern van die Europese wetgeving? Nou ja, de kern van de Europese wetgeving is dat je dat wilt vermijden. Dat je wilt vermijden dat de data van mensen, individuen, online komt. Maar goed, als u mijn stem heeft en van iedereen een stemsample, een stukje spraak, dan is dat te vinden. U zei het tussen neus en lippen door, bij de politie doen ze dat al? Ja. Wat doen ze dan bij de politie? En dat is heel, heel gelimiteerd. We hebben daar hier in Amsterdam twee straten hier vandaan in de James Watt straat, dus ik heb een paar jaar geleden een test gedaan. De politie luistert natuurlijk af. En op een gegeven moment, een mens is maar een mens en die kan dat zoveel uur doen, dan word je afgelost door je collega en dan zeg je tegen hem, goh Klaas, ik heb net Klaas, Achmed, Marietje en Josephine gehoord. Dat kun je dan nog met voorbeelden doen, maar dan is het toch lastig voor jouw collega die het overneemt om als hij alleen maar iemand hoort te zeggen hey, hallo, met mij, om te weten is dat Josephine of Klazien. Daar heb je software voor. Spreker, identificatie. Dan ga je zeggen van luister, ik heb hier een aantal mensen in mijn database, dat geef eens even aan wie dit waarschijnlijk is. Technisch werkt dat heel erg goed. Juridisch mag het niet bij de politie en daar is heel veel voor te zeggen. Je mag niet zomaar over zaken heen, die data aggregeren. Je mag het wel van fingerprints doen. Iris scans DNA tegenwoordig. Waarvan je stem mag dat nog niet. Dus technisch werkt dat, maar het is nog niet heel erg bruidbaar op dit moment in de praktijk. Maar als die kunstmatige intelligentie waar u nou op zoek bent en wat gaat gebeuren maar waar we dan wel graag in Europa de lead willen hebben. U gaf al het voorbeeld dat ze in China bezig zijn met iets wat veel verder gaat dan in Europa al toen. Wij gaan hier de boot missen. Dat was ook de porté van het artikel. 85% van de AI op dit moment komt uit Amerika, 10% komt geloof ik uit China en die overige 5% uit de rest van de wereld en dan is Duitsland nog behoorlijk sterk. Maar in Europa zien we dat we gewoon heel vaak gereguleerd worden door allemaal op zich goede wetten, waar iedereen eigenlijk wel voorstander van is, maar jij pakt Syrië en je zegt wat tegen Syrië, maken afspraken, wat en ook, 10 milliseconden later staat dat in Cupertino op de database en daar blijft het staan. En dat gaan ze opnieuw gebruiken om later te trainen en betere algoritmes nog een keer te kijken, wat kan ik ermee en wat wordt er bedoeld, dat soort zaken. Dat doen we dus allemaal wel en dat zijn wij, consumenten, en wij, burgers, zeggen ho ho, nee nee, mijn data zijn mijn data, niemand mag ze hebben, die moeten afgeschermd worden of weggegooid worden. Dus die controversie die je overal ziet tussen de burger enerzijds en de consument anderzijds, is heel erg lastig. Europa heeft dat met de GDPR gelijk getrokken over heel Europa. Dat is heel goed, dat we dus niet meer het gedonder hebben in Duitsland is het weer net iets anders dan in Frankrijk of in Nederland. Dat is een groot pluspunt, maar je moet oppassen, kunnen we straks al die data nog wel gebruiken? En we zouden een mechanisme moeten vinden, een soort database waar de data in gaat. met veilige roem zoals het CBS dat bijvoorbeeld heeft, waar onderzoekers en bedrijven kunnen clearen met alle data, maar de data nooit naar buiten kunnen brengen. Dus wel de algoritmes, maar niet de data als zodanig. Dan is die data dan in een doos, maar nog steeds wel herleidbaar. Maar wat is daar het bezwaar tegen als het nou buiten kan komen? Nou ja, dat hangt af van de volgende autoriteit. Dat is natuurlijk het grotere. Wij willen ons beschermen tegen kwaadwillende autoriteiten, toch? Precies. Dus je zou een soort panicknop kunnen maken dat je zegt, luister eens, er komt een andere regering aan de macht, delete alles. Dat kan altijd nog, om zoiets te maken. Of dat realistisch is, is wat anders. Maar je moet gewoon even nadenken. Kijk, het CBS heeft natuurlijk ook alle gegevens van alle Nederlanders over inkomen, huwelijk, de hele mikmak. En je kunt daar naartoe. Moet je je telefoon in je computer achterlaten en dan mag je clearen met alle data. Metadaten mag je naar binnen naar buiten brengen, maar je mag nooit de originele data naar buiten brengen. Zo kun je dus wel leren van wat er speelt, wat er is. Maar je kunt nooit zeggen, kijk, ik heb hier het record van Pietje. En u kunt ermee werken, u kunt die artificiële intelligentie slimmer maken. Dat is het hele idee. Dan hebben we data nodig. U noemde net het voorbeeld van de politie. Volgens mij bent u vaker bij politiedingen betrokken. Afgelopen week had u volgens mij een lezing bij de politie. Nee, het was geen lezing, maar de politie is bezig en dat is een enorm boeiend iets. Je hebt 112, dat ken je. Wel politie en heel veel spoed. Wat de politie zegt, we willen data gedreven gaan werken. Er is een moment dat ik een melding doe over de telefoon. Er zit aan de andere kant een meneer of mevrouw die het allemaal hoort en vragen stelt en zegt goh en ziet u bloed of waar bent u en al dat soort vragen. Dat is op zich goed, maar die hij of zij moet ook die data invoeren in het politie systeem en dan gaan ze ergens anders gaan ze kijken wat is die data? Moeten we direct de ambulance sturen of een politieauto of wat moeten we precies hiermee doen? Nou, wat de politie zegt, en dat is interessant, wij luisteren naar die 112-daten. Wij willen dat eigenlijk direct omzetten in tekst. Dat is niet voldoende, want dan gaan we ook weer ze willen begrijpen. Die tekst moet naar entiteiten, naar objecten, naar zingevende gehele worden herleid. Dus als ik zeg, ik sta hier met mijn 26LZHT op de Dodenweg in Leusden, dan geef ik heel veel informatie, want het eerste is mijn nummerbord. kun je bij de RDW opvragen, oh dat is zo'n auto, dan kan je een plaatje doen of dat op het scherm zetten. De Dodeweg in Leusten, nou dat is een weg inderdaad in Leusten, kun je met Google Maps gelijk laten zien, dus dan in plaats van dat je alleen maar die spraak hoort, zie je in één keer alle informatie op je scherm van hey we hebben hier, daar is het en dan kan een telefonist ook vragen van staat u aan het begin daar of daar en kan dan dus hulpdiensten direct pinpointen, daar moet je wezen. Dus die stap van Spraak naar tekst, van tekst naar informatie, dat is wat de politie graag wil. En die hebben daar een soort open col voor uitgeschreven waarin wij met een aantal bedrijven en universiteiten deelnemen. en dat morgen gaan inleveren. Zonder een beetje op het risico over respectloos te overkomen, dat is niet de bedoeling. Maar dit klinkt niet zo heel moeilijk. Zo. Oké. Dus toch wel, sorry. Dat is heel moeilijk. Maar wat mis ik hier dan in? Want als die computer als Siri herkent mijn stem, Siri laat ook iets zien. Waarom kan dat dan niet op een grotere schaal in een politie systeem? Omdat er zit een aantal dingen. A. Kan Siri getuned worden op jouw stem? Als jij met Siri praat, ik weet niet hoe vaak je het doet, maar probeer het maar eens als je gespannen bent. Kijk, en dat zeiden ook de mensen van de 112-centrale, iemand die 112 belt, is altijd gespannen. Dus je bent niet, dat is het lombaereffect, je gaat je spieren anders trekken, je gaat anders praten, maar je bent gespannen. Ja, daar ligt die man met heel veel bloed. Heel snel, haast te praten, je wilt die informatie er doorheen jassen. Dat is best lastig. Natuurlijk, we doen die testen. En we hebben ook gezien dat wat de politie nu in het archief heeft belabberd is. ouwe meuk zeg maar, ze slaan het op een hele, vroeger was het geheugen duur, ze slaan het heel erg sterk gecomprimeerd op. Waardoor je die nuances mist. Je hebt nieuwe opnamen nodig in stereo, waardoor je de mensen in de centrale en de mensen in het veld op twee aparte kanalen kunt krijgen. En we moeten gewoon trainen om dat te doen. Dus technisch is er wel een oplossing, maar om het te organiseren en om te kijken hoe ga je nou die gespannen teksten van mensen, want mensen zeggen niet goedemorgen, u spreekt met Janssen, er ligt hier een bloedende meneer op de grond. Nee, dat zegt men niet. Dus dat zouden we goed kunnen herkennen, dan was het probleem opgelost. Maar mensen zijn gespannen en dat is lastig. En dan heb je ook nog dialecten. Je hebt andere talen. Je hebt mensen die onverstaanbaar praten. Je hebt talloze variabelen. Die vraag komt iedere keer terug. Kijk, zolang mensen met een accent praten, bijvoorbeeld zoals ze dat bij ons in Twente doen, dan is dat niet zo erg. Op het moment dat ze in dialect gaan praten met andere woorden, dan is het vooralsnog lastig. Het Fries, wat een andere taal is, is sowieso lastig. Maar ook de straattaal, mensen van Marokkaanse afkomst, Turkse afkomst hebben toch een ander accent, gebruiken ook andere woorden. Maar dit probleem is vooral heel groot bij de afluisterclub van de politie. Want daar willen mensen niet herkend worden. In de regel zien we dat mensen die 112 bellen, die willen wel dat de andere kant ze begrijpt. Want anders bel je namelijk niet. Dus er zit wel een zekere... Ja, dat mensen willen wel dat je verstaan wordt. Maar mensen zijn gespannen en gaan daardoor, en dat is volstrekt logisch, op een andere manier praten. En daar zitten de grote problemen. En morgen hoort u of... Nee, morgen moet het inleveren. En voor twee weken horen we of we uitgenodigd worden om er te komen verdedigen. Dan zouden we in een nieuwe jaar van start gaan. Wat cool, het is echt een pitch. Ja, het was vorige week in Den Haag, op de politieacademie, kregen we allemaal te horen dit is wat we willen. Jongens, succes. Dus dat hebben zij me nu aan het schrijven. Heel gaaf. Ik ben heel benieuwd hoe dit af gaat lopen. Ik hoop dat u nog een keer terug wil komen om daarover te praten. Leuk, hartelijk dank voor dit gesprek. Arjan van Essen, onderzoeker taal- en spraaktechnologie aan de Universiteit van Twente.