bnr nieuwsradio nieuwe privacywetgeving in europa zorgt ervoor dat de europese het bedrijf op grote achterstand komen op het gebied van kunstmatige intelligentie en dan gaan we amerika en china de met het nieuwe itv goud van door zegt mijn gast onderzoeker taal- en spraaktechnologie aan de universiteit van twente arjan van hessen welkom meneer van het nieuwe die goud het is uw ter wat is het wel even wat achtergrondinformatie we doen al heel lang spraakherkenning dat is al een hele lange droom zeg maar in in de wetenschap ik zeg iets en dat wordt uitgeschreven op tekst dat gaat eigenlijk steeds beter werken en we zijn nu de volgende stap aan het maken van spraak naar begrijpen niet wat zeg jij maar wat bedoel je nou om dat te doen dat is zeg maar de talige informatie van de mens en bij zijn daar heel erg knap in gebruiken daarbij onzer grammatica de kennis van de wereld de achtergrond als ik met jou praat ik ken jou niet zo goed ga ik uit van andere kennis bij jou dus ik leg dingen anders uit al dat soort zaken die willen we heel graag eigenlijk met computers na kunnen doen en dat is natuurlijk de richting a i dus de de kunstmatige intelligentie is nu nog vrij zwak dat is echt voor één probleem is het heel goed maar daar blijft het ook bij en we willen tenminste als onderzoeker naar een soort sterke a i dat echt de menselijke geest naar doet nou de dit soort processen na kunnen maken en ja u zegt we zijn nog niet zover op dat gebied kunstmatige intelligentie is nog wel een beetje dom maar waar waar staan we nou precies nou helemaal in het begin ook echt ja ja ja ik kijk die kunstmatige intelligentie alles wat we zien een elke week zie je eigenlijk wel weer nieuwe updaten google wint een spelletje hersenscans kunnen geïnterpreteerd worden beter door de computer dan door mensen botsen wint quiz is et cetera et cetera maar het is steeds één ding een mens kun je ergens neerzetten en dan kun je de context switchen zeg je god maar over maxima vertel eens wat vind je daarvan en even later kun je het hebben over de aex index of over het weer al dat soort begrippen wij mensen kunnen heel gauw schakelen en kunnen eigenlijk alles wij kunnen plannen en al dat soort zaken het a i die we op dit moment hebben kan één ding heel goed maar daar blijft het bij een wat we willen is dus meer algemene a i maken die richting schuift van de mens die denkt zoals u en ik en ook zo spreekt en dat aanvoelt als dat bedoel ik dat eigenlijk een robot die die bedoeling ja kan aanvoelen precies dus daar zijn we nog wel even van verwijderd ja het het het gaat hard dus we zullen wel zien dat het die kant opgaat maar ik had een een voorbeeldje laatst hoorde op een een bandje wat ik aan het afluisteren was iemand die zei doe mij een goede chinees dan denk ik ja maar dat is raar doen mij een goede chinees die meneer bedoeld geef mij een goed chinees restaurant hier in de buurt nou dat is iets wat wij nederlanders heel makkelijk begrijpen dat zit in onze cultuur wij horen dat maar als je dit letterlijk zou vertalen naar het engels doemen je cheney is dan vraag ik me af of we dat begrijpen de cultuur onze menselijke cultuur is ook cultuurgebonden context gebonden die is heel erg ingewikkeld om te begrijpen en om dat goed te kunnen doen en dat was natuurlijk de aanleiding voor jouw vraag hebben we talige data nodig hebben dus echt de uitingen van mensen nodig en wat je nou ziet werd die gdp pr waar ik op zich een groot voorstander van bent is het echt heel erg goed dat is die europese privacy ja dat is jenner al deed de apotheek die de aangeeft wat je nou met de data mag doen en waar men over het algemeen heel bang voor is en dat is logisch is dat jouw persoonlijke data gewoon op straat ligt dat ze kunnen zien wat mijn ziektegeschiedenis is wel van in financiële situatie is waar ik ben geweest al dat soort zaken en daar is natuurlijk heel erg goed voor maar waar je voor moet oppassen is dat je het kind niet met het badwater weggooit de persoonlijke manier waarop jij spreekt kan als ik dat voor over heel veel mensen verzameld heel erg nuttig zijn om algoritmes te laten leren van hoe mensen in nederland ongeveer zouden kunnen spreken en daar kan ik dus algoritme op losgelaten om te zorgen dat de computer een mens beter begrijpt dus ik heb juist die talige informatie nodig die uit mensen komt op welke manier staat die europese privacywetgeving dat dan in de weg omdat die niet herleid bar mag zijn naar de persoonlijke data en dat is natuurlijk ook met allerlei algoritmen we zijn heel erg goed tegenwoordig in als ik zeg ik wil een stuk hebben van mark rutte wil ik niet een nieuwsuitzending hebben waar gesproken wordt over mark rutte maar ik wil een nieuwsuitzending hebben waarin hij spreekt dus ik moet zijn stem herkennen maar dat gaat behoorlijk goed dat wil zeggen dat die hele privacy lastig is want als ik dat straks heel erg goed kan en daar de chinezen doen dat in een bepaalde provincie doen ze dat al onder het mom van veiligheid ganzen van iedereen een persoonlijke stem fingerprint maken zeg maar als dat straks heel erg goed kan dan wordt het lastig om die privacy te waarborgen want dan hoor ik wat ik haal door het algoritme de politie doet het natuurlijk al er gaat zeggen dit is waarschijnlijk pietje klaas of jouw en waar blijf je dan met je privacy dus dan is de eerste instantie dat je zegt nee dat mag niet want het mag niet herleidbaar zijn tot een persoon en dat zeker van europees europese geeft nou ja de de de europese wetgeving is dat je dat wilt vermijden dat je wilt vermijden dat de data van de mensen individuen online maar goed als u mijn stem heeft en van iedereen een stem sample stukjes spraak en ja dan dan dan is dat te vinden en dat is dat oké ik zei tussen neus en lippen door bij de politie doen ze dat al ja wat doen ze dan en dat is heel heel gelimiteerd we hebben daar hier in amsterdam twee straten hiervandaan in de james paar jaar geleden een test gedaan politie luistert natuurlijk af en op gegeven moment een mens is maar een mens en die kan dat zoveel uur doen dan moet je afgelost door je collega en zegt tegen me goh klaas ik ketnet klaas achmed marietje en josephine gehoord dat kun je dan nog met voorbeelden doen maar dan is het toch lastig voor jouw collega die dat overneemt om al die alleen maar iemand hoort zeggen hallo met mij om te weten is dat josephine of klassiek nou daar heb je software voor spreker identificatie dan ga je zeggen van luister eens ik heb hier een aantal mensen met deed staat geven zeven aan wie dit waarschijnlijk is een technisch werkt dat heel erg goed juridisch mag het niet bij de politie en er is heel veel voor te zeggen je mag niet zomaar over zaken heen die data ageren en je mag er wel voor vinger prins doen irisscans dna tegenwoordig waarvan je stem mag dat mag niet dus technisch werk dat maar het is nog niet heel erg bruikbaar is op dit moment in de praktijk maar als die kunstmatige intelligentie waar waar waar u naar op zoek bent een en en wat we echt wat gaat gebeuren maar waar we dan wel graag in europa de liet willen hebben u gaf van het voorbeeld als in china bezig zijn met iets wat veel verder gaat dan in europa al toen wij gaan hier de boot mis ja dat klopt dat ja dat was ook de de portee van dat artikel vijf tachtig procent van de i op dit moment komt uit amerika tien procent komt geloof ik uit china en die overige vijf procent uit de rest van de wereld en dan is duitsland nog behoorlijk sterk maar in europa zien we dat wel gewoon heel vaak jarige reguleert worden door allemaal op zich goede wetten waar iedereen eigenlijk wel voorstander van is maar j pak serie en je zegt wat tegen syrie maken afspraken of wat dan ook tien milliseconden later staat dat in wordt tino op de details en daar blijft staan en dat gaan ze opnieuw gebruiken om later te trainen en betere algoritmes nog een keer te kijken wat kan ik daarmee wat wordt bedoeld dat soort zaken dat doen we het dus allemaal wel en dat zijn wij consumenten en wij burgers zeggen ho ho nee nee mijn data zijn mandaat en niemand mag ze hebben die moeten afgeschermd weggegooid worden dus die controverse die overal ziet tussen burger enerzijds en de consument anderzijds het is heel erg lastig europa heeft dat met de gd pr gelijkgetrokken over heel europa dat is heel goed dat we dus niet meer het gedonder hebben in duitsland is het weer net iets anders dan in frankrijk of in in nederland dat is een groot pluspunt maar je moet oppassen kunnen we straks al die data nog wel gebruiken en we zouden een mechanisme moeten vinden een soort details waar de data ingaat met veilige roem zoals het cbs dat bijvoorbeeld heeft waar onderzoekers en bedrijven kunnen klieren met alle data maar de data nooit naar buiten kunnen brengen zowel de algoritmes maar niet de data als soda dat dan is die data dan in een in een doos maar nog steeds wel herleidbaar ja maar wat is daar het bezwaar tegen als ze naar buiten kan komen maar ja dat is de vraag of dat is hangt af van de volgende autoriteit dat natuurlijk het grote die wij willen ons beschermen tegen kwaadwillende autoriteiten prostitutie zou een soort knop kunnen maken zegt luister dan komt er een andere regering aan de macht delete liet alles dat kan altijd nog om zoiets te maken of dat realistisch is is wat anders maar je moet gewoon even nadenken ik kijk en het cbs heeft natuurlijk ook alle gegevens van alle nederlanders over inkomen en huwelijk de hele mikmak en je kunt daar naartoe moet je telefonie computer achterlaten en dan mag je klieren met alle data metadata mag je naar binnen naar buiten brengen maar je mag nooit de originele data naar buiten brengen zo kun je dus wel leren van wat er speelt wat er is maar je kunt nooit zeggen kijken piraterij kort van pietje en u kunt ermee werken u kunt die artificiële intelligentie slimmer maken dat is de bij u noemde net al het voorbeeld van de politie u volgens mij bent u vaker bij de bij politie dingen betrok u altijd afgelopen week had u volgens mij een lezing bij de politie ging nee het was geen lezing maar de politie is bezig en dat is een enorm boeiend iets je hebt één één twee dat kennelijk wel politie en een heel veel spoed maar wat de politie zegt we willen data gedreven gaan werken is een moment dat ik een melding doen over de telefoon zit aan de andere kant en meneer of mevrouw die het allemaal gehoord en vragen gesteld en rachel en ziet u bloed of waar bent u en al dat soort vragen dat is op zich goed maar die hij of zij moet ook die data invoeren in het politiesysteem en dan gaan ze ergens anders gaan ze kijken wat is die data moeten we direct de ambulance sturen of een politieauto of wat moeten we precies hiermee doen na wat de politie zegt en dat is interessant wij luisteren naar die ene in twee dagen wij willen dat eigenlijk direct omzetten in tekst en dat is niet voldoende want daar gaan maar ook weer niet willen begrijpen die tekst moet na entiteiten na objecten naar je zin geven gehele worden herleid zoals ik zeg ik sta hier met mijn zesentwintig lz ht op de dodenweg in leusden dan geef ik heel veel informatie want het eerste is m'n nummerbord kun je bij de rdw op vraag olympisch zo'n auto dan kan je een plaatje doen of dat op het scherm zetten de dodenweg in leusden nadat eerst een weg inderdaad in leusden kun je met google maps gelijk laten zien dus dan in plaats van dat je alleen maar die spraak hoort zie je in één keer allerlei informatie op je scherm van we hebben hier daar is het en dan kan een van telefonist ook vragen van staat u aan het begin daar of daar en kan dan dus hulpdiensten dreigt pin point en daar moet je wezen dus die die die stap van spraak naar tekst van tekst naar informatie dat is wat de politie graag wil en we hebben daar een soort nou ja open kohl voor uitgeschreven waarin wij met een aantal bedrijven en universiteiten deelnemen en dat morgen gaan inleveren en is is in een is zonder een beetje op het risico voor respectloos de over te komen dat het niet de bedoeling maar dit klinkt niet niet zo heel moeilijk zou ook dat is heel mooi maar wat mis ik hier in in want als die computer siri herkent mijn stem serie laat ook iets zien waarom kan dat dan niet op een op een grotere schaal in het politiesysteem omdat er zit een aantal dingen a kan sirigu tuned worden op jouw stem b als jij met siri praat ik weet niet hoe vaak je doet maar probeert maar als je gespannen bent kijk en dat zij daar ook de mensen van de één en twee centrale belt is altijd gespannen daar zitten dus je bent niet dat is de lombard effect gaat je spieren anders trekken je gaat alles praat maar je bent gespannen met heel veel bloed heel snel haast je wilt die informatie de doorheen jassen dat is best lastig natuurlijk weer doen die testen en we hebben ook gezien dat wat de politie nu in het archief heeft belabberd is ze ook gewoon ouwe ouwe meuk zeg maar ze slaan dat op een hele vroeger was geheugen duurste slaande heel erg sterk gecomprimeerd op z'n minst worden als je nieuwe opname nodig in stereo waardoor je de mensen in de centrale en de mensen in het veld op twee aparte kanalen kunt krijgen en we moeten gewoon trainen om wat te doen dus technisch is er wel een oplossing maar om het te organiseren en om te kijken hoe ga je nou dat gespannen teksten van mensen want mensen zegt niet goedemorgen u spreekt met jansen er ligt hier een bloedende meneer op de grond maar dat zegt men dus dat zou goed kunnen herkennen en was het probleem opgelost maar mensen zijn gespannen en en en ja dan heb je ook nog dialecten en je hebt andere taal leert mensen die onverstaanbaar praten ja precies talloze een variabele zijn ja dan wat is een die vraag komt iedere keer terug kijk zolang mensen een met een accent praten bijvoorbeeld de zoals ze dat wij bij ons in twente doen dan is dat niet zo erg op het moment dat ze in dialect gaan praten met andere woorden dan is het vooralsnog lastig het verlies wat een andere taal is is sowieso lastig maar ook de straattaal mensen van van marokkaanse afkomst turkse afkomst hebben toch een ander accent gebruiken ook andere woorden maar dit probleem is vooral heel groot bij de afluister- club van de politie daar willen mensen niet herkend worden in de regel zien we dat mensen die ene die willen wel dat de andere kant begrijpen en anders bel je namelijk dus daar zit wel een zekere of u ja dat mensen willen wel dat dat je verstaan wordt maar mensen zijn gespannen en gaan daardoor en dat is volstrekt logisch op een andere manier praat en daar zitten de grote problemen schitteren en en en morgen hoort u of moeten inleveren inleveren en over twee weken horen we of we uitgenodigd te worden om er te komen verdedigen ah daar zouden in het nieuwe jaar van start gaan afkoelen zegt een pitch ja ja was vorige week in den haag op de politieacademie kregen we allemaal te horen dit is wat we willen jongens een succes dus dat hebben zijn we nu aan het schrijven heel gaf ik ben helemaal niet biedt de afgelopen nog een keer terug wil komen om daarover te praten leuk hartelijk dank voor dit gesprek arjan van hessen onderzoeker taal- en spraaktechnologie aan de universiteit van twente dank


BNR_Privacy_2017_11_21.mp4
 0.0
TijdsindexBetrouwbaarheidSpreker