BRS85 - AV

zo af en toe wordt ik gevraagd een-en-ander te komen toelichten op RTV of andere media. Hieronder een overzicht met context van een aantal van deze "media-events" ?.

BNR 8 juni 2020

NH Radio zet spraaktechnologie van XS2Radio in voor nieuws

De technologie van XS2Radio maakt van geschreven teksten volautomatisch gesproken audioberichten.

Regionaal station NH Radio gaat als eerste zender in Nederland de automatisch gegenereerde nieuwsbulletins van de Hilversumse Text-to-Speech startup XS2Radio inzetten. De technologie maakt van geschreven teksten volautomatisch gesproken audioberichten die samen met de NH Radio vormgeving worden gecombineerd tot een voorgelezen nieuwsbulletin.

Te gast is Arjan van Hessen, onderzoeker taal- en spraaktechnologie aan de Universiteit Twente.

Ondertiteling

Karaoke

BNR 10 september 2019

BNR 17 juli 2019

BNR 29 januari 2019

Een Vandaag 9 januari 2019

vervangbare mens

De robots komen eraan en gaan ons mensen vervangen! Een ietwat boude uitspraak en wat wordt daar in 2019 nu mee bedoeld?

Een klassieke robot zoals de meeste kinderen (en ook volwassenen) zich dat voorstellen, is een mensachtige apparaat dat er min-of-meer uitziet als een mens, loopt, praat, luistert en je (enigzins) begrijpt.

Vanwege films als Blade Runner, the Terminator, Ex Machina, Star Wars en vooral Metropolis en vele anderen, hebben ze dikwijls een negatieve connotatie: ze willen onze wereld overnemen of op z'n minst beïnvloeden.
En dankzij de enorme vorderingen op het gebied kennisrepresentatie (LOD) en vooral Kunstmatige Intelligentie (AI) beginnen zaken als spraakgeneratie, spraak- en sprekerherkenning en NLP in de buurt van die van ons mensen te komen. We kunnen de computer vragenstellen en krijgen dikwijls een redelijk adequaat antwoord terug.

Maar strikt genomen zijn robots programmeerbare machines die op een intelligente wijze verschillende fysieke taken kan uitvoeren. Denk aan de spuit-robot die nieuwe auto's spuit, aan de broodbak-robot die zelfstandig van meel, zout en water een brood bakt, een metsel-robot die metselt en aan een Tesla die je straks bijna zonder menselijke tussenkomst van A naar B kan gaan rijden. Maar de meest aansprekende robots blijven toch die "mennekes" en "meiskes" die enigzins op ons lijken.

In de eerste week van 2019 heeft het actualiteiten programma Een Vandaag "De Vervangbare Mens": een serie van 5 uitzendigen over de verschillende aspecten van deze "menselijke" robots. Aan de derde uitzending over Taal- en Spraak heb ik samen met Piek Vossen meegewerkt (zie hieronder). Het gaat over de snelle ontwikkelingen op het gebied van Taal en Spraak (Arjan) en over een nieuwe manier waarop robots kennis van ons kunnen vergaren door met ons in gesprek te gaan (Piek).
Hoe gaat een robot dan om met tegenstrijdigheden? Iemand zegt dat iets een beker is (de robot kan objecten herkennen) maar een volgende persoon zegt dat het een jampot is?

Datum	Starttijd	Onderwerp
7 januari 2019	10:29	De vervangbare mens: introductie
8 januari 2019	19:16	De robot-arm
9 januari 2019	18:45	Robots, Taal, Spraak en begrijpenRobots, Taal, Spraak en begrijpen
10 januari 2019	09:20	Sociale vaardigheden van robots
11 januari 2019	08:23	Hoe creatief zijn robots?

BNR 7 november 2018

Parthenos 18 mei 2018

BNR 12 maart 2018

Masterclass Philipse Business School 1 februari 2018

BNR 21 november 2017

nrc 1 Naar aanleiding van een artikel op de opiniepagina van NRC-Handelsblad, werd ik door BNR gevraagd een en ander in het radioprogramma van Roelof Hemmen te komen toelichten. Om 13:00 al aanwezig in de studio (veel te vroeg en zenuwachtig) naarstig door mijn aantekeningen bladerend, zat ik daar te wachten. Om 13:30 mocht ik mee naar binnen. Je zit niet maar staat aan de tafel met een grote gele microfoon die op 10 cm voor je mond hangt (beste geluid).

Na het nieuws, de beursberichten en de verkeersinformatie volgde de introductie door Roelof Hemmen. Daarna mocht ik los gaan :-) om ons idee van een data-vault (een soort data-warenhuis waar de data wel in kunnen maar niet meer naar buiten kunnen) te propageren. Telecats, de UTwente en de Radboud Universiteit hadden een jaar geleden het plan opgevat om zo'n data-vault op te zetten om op deze wijze data te verzamelen en onderzoekers toegang te geven tot heel veel gesproken data. In de data-vault kunnen ze dan alles gebruiken om de algoritmes te trainen. De getrainde algoritmes mogen dan naar buiten maar de data blijven "binnen". Het gesprek ging verder goed.

Halverwegen ging het over naar het voorstel dat Telecats en de Radboud Universiteit bij de Nederlandse Politie gaan indienen (woensdag 22 nov). De politie wil graag "data-gedreven werken" en is opzoek naar de mogelijkheid om de spraak in 112-gesprekken te herkennen en direct om te zetten in informatie.En na een kwartiertje stond ik weer buiten. Opgelucht, want ik had (hoop ik) niet te veel onzin gedelibreerd.

Bij het downloaden en door de spraakherkenner halen van mijn "gesprek" bleek dat in het uur ervoor prof. dr. mr. Mireille van Eechoud geïnterviewd was geworden over "de rechten van consumenten op hun eigen data". Bij bv Faceboook "betaal" je met je gegevens. Wat als je Facebook opzegt? Kun je Facebook dan verbieden verder nog gebruik te maken van jouw persoonlijk data? Interessant vraagstuk!

Toen ik eenmaal de gehele uitzending had gedownload en de twee interviews eruit had geknipt, heb ik ze door "onze" spraakherkenner gehaald. Natuurlijk: foutloos is het niet maar wel verbluffend goed!

Hieronder de twee interviews in de gebruikelijke karaoke stijl.

Mireille

Arjan

Editie-NL 13 oktober 2017

Ex Machina 7 feb 2017

OCW - Open Access 10 mei 2016

Fast Moving Targets 5 mei 2016

Het is een kleine stap van de geofysica naar de taal- en spraaktechnologie. Het gaat allebei om trillingen en golven. Dus voor Arjan van Hessen, opgeleid tot geofysicus, was de overstap logisch. Hij is werkzaam bij diverse universiteiten, is betrokken bij het project Clariah en werkt voor het bedrijf Telecats. “Wat ik ontzettend boeiend vind is datgene wat er uitgevonden wordt in de praktijk gebruiken. Ik ben niet een hele goeie wetenschapper, maar ik ben wel goed in staat om die vertaalslag te maken van dat wat al die slimme collega’s van mij doen naar het bedrijfsleven waar ik ook werk. Dus om te zorgen dat datgene wat bedacht en uitgevonden wordt en waar mensen aan werken om dat ook echt in de maatschappij te gaan gebruiken.”

Op dit moment zijn er al vrij veel toepassingen van taal – en spraaktechnologie waar mensen dagelijks mee te maken krijgen. Denk aan de spellingschecker op de computer of de TomTom die tegen je praat. Maar de komende jaren zullen de voorbeelden alleen maar toenemen. “We zien dat de verzorgingsmaatschappij onder druk staat, mensen worden ouder. Er zijn minder jongeren om voor de ouderen te gaan zorgen. Je ziet al in Japan dat er steeds meer robots komen, maar wil je die robots echt in het intermenselijk verkeer als partner hier aan tafel erbij hebben dan moeten ze niet alleen kunnen praten, maar ze moeten ook kunnen begrijpen en sociaal kunnen zijn. Als jij gewoon chagrijnig bent dan wil je niet zo’n vrolijke eikel van een robot naast je hebben, dus hij moet aanvoelen hoe jij bent. Hij moet de manier waarop je praat kunnen interpreteren, kunnen aanvoelen. Social signal processing is dat. Waarom zie ik dat jij vrolijk bent? Dat is waanzinnig complex. En vaak cultureel afhankelijk. Dat maakt het ook lastig.”

“Data en computing power zorgen voor een stap voorwaarts ”

De afgelopen jaren heeft taal- en spraaktechnologie een enorme ontwikkeling doorgemaakt. “In de laatste 5, 6 jaar is er een enorme boost geweest in deze technologie en dat komt door het zogeheten deep learning. Jij ziet iemand lopen, die herken je. Waarom? Geen idee, het is iets in de manier van lopen. Beschrijf dat eens? Dat kun je niet. Dat is wat neurale netwerken ook doen. Wanneer je heel veel voorbeelden geeft leert de computer: wat zijn de parameters, hoe moet ik hem instellen om het kopje van het glas te onderscheiden. Die technologie wordt gebruikt voor gezichtsherkenning, beeld herkenning in het algemeen, spraak herkenning en emotie herkenning. En omdat we en heel veel computing power en heel veel data hebben zorgt dat voor stappen voorwaarts de laatste 5 jaar”

Gingen computers vroeger bij 1 op de 7 woorden de mist in qua herkenning, op dit moment is het 1 op de 12 woorden. “Dat is misschien nog wel te hoog, maar mensen zijn ook niet perfect. En waar mensen heel goed in zijn is een aha erlebnis: je hoort iets en je verstaat het eigenlijk niet goed maar vanwege de context kun je dat invullen.” Mensen spreken woorden vaak alles behalve netjes uit, maar door een context weten anderen vrijwel altijd wat je bedoelt. “Dus mensen horen wat ze verwachten te horen en meestal klopt dat en daarom zijn wij er zo goed in en dat moeten we de computer nog leren.” Een belangrijk proces dat zorgt voor brede inzetbaarheid van computers in diverse telefonische dienstverlening. Door computers goed te tunen zijn ze uitstekend in staat om een eerste afvang te doen, waarna mensen het werk kunnen overnemen. “Dat is wat je overal ziet: het is een hybride systeem. Saaie, makkelijke dingen gaat de computer doen en mensen gaan echt doen waar mensen goed in zijn: emotie en al dat soort zaken.”

“Google wil alle informatie van de wereld ontsluiten ”

Grote bedrijven als Facebook, Amazon en Google zetten fors in op de nieuwe mogelijkheden. “Google zegt wij willen alle informatie van de wereld ontsluiten. Een belangrijk deel van die informatie zit tegenwoordig in video, maar video is eigenlijk nog heel slecht doorzoekbaar voor een gebruiker.” Dat wordt anders wanneer het gesproken woord geautomatiseerd omgezet kan worden in tekst. Tekst is doorzoekbaar en kun je ordenen op trefwoorden. “Die bedrijven zetten dus massaal in op die technologie. Ik zag een interessante keynote van Microsoft. Die willen op je telefoon naar een situatie waarin one rules them all : één applicatie die straks al de andere apps gaat sturen. Waarom heb ik een app nodig voor de trein en het vliegtuig en het weer en hotels? Ik kan straks gewoon tegen dat ding praten en dan zorgen zij voor die onderlinge communicatie“

Of in de toekomst werkelijk alles doorzoekbaar zal worden en iedereen overal herkenbaar zal zijn, moeten we afwachten. Dat veiligheidsdiensten graag meer grip krijgen op wat burgers zeggen en doen staat vast. Misschien is dit dan ook een goed moment om na te denken over privacy en het beschermen daarvan. De ontwikkelingen staan in ieder geval niet stil. “Ik gok dat we nog een jaar of vijf in de versnelling zitten, omdat er nog heel veel data beschikbaar zijn waar mee getraind kan worden. Daar zul je nog enorm vaak winst door zien. In het begrijpen wat wordt er bedoeld? Waar gaat het over? Wat zegt ze nou precies? Want als iemand zegt ‘ik wil het nu niet over terrorisme hebben’ dan pikt de computer op dit moment als onderwerp terrorisme op, maar daar gaat het juist niet over. Er zit een ontkenning in. Dat is nog een stap die gemaakt kan worden en zal worden.”

(Een verslag van @daalder)

Leonieke Daalder

Categorie	Onderwijs
Licentie	Creative Commons-licentie - Naamsvermelding (hergebruik toegestaan)

In-de-media

BNR 8 juni 2020

NH Radio zet spraaktechnologie van XS2Radio in voor nieuws

Ondertiteling

Karaoke

BNR 10 september 2019

Gluren in de hersenen

Ondertiteling

Karaoke

BNR 17 juli 2019

Ondertiteling

Karaoke

BNR 29 januari 2019

Ondertiteling

Karaoke

Een Vandaag 9 januari 2019

BNR 7 november 2018

Ondertiteling

Karaoke

Parthenos 18 mei 2018

The relationship between research impact & data management

BNR 12 maart 2018

Ondertiteling

Karaoke

Masterclass Philipse Business School 1 februari 2018

Ondertiteling

Karaoke

BNR 21 november 2017

Mireille

Arjan

Editie-NL 13 oktober 2017

Ondertiteling

Karaoke

Ex Machina 7 feb 2017

Ondertiteling

Karaoke

OCW - Open Access 10 mei 2016

Fast Moving Targets 5 mei 2016

MuZIEum 15 maart 2015

Introductie

Interview

Editie-NL 10 september 2011

Ondertiteling

Karaoke