Wat is er nu al beschikbaar voor Nederlandse contact centers?
Eerder schreef Fun Zeegers voor klantcontact.nl een artikel over IBM Watson. Door een ander blog over cognitieve kennissystemen, ging hij experimenteren met Siri van Apple. Watson is qua technologie voor Nederlands klantcontact nog een verre stip op de horizon. Siri is hier en nu voor iedere consument in zijn Apple smartphone beschikbaar. Daarop ontstond de vraag: Wat zit er tussen Siri en Watson in, wat is voor contactcenters in Nederland op dit moment al beschikbaar?
Hieronder de, in samenspraak met Arjan geschreven blog van Fun.
Siri
Siri is de spraakgestuurde interface van Apple. In mijn ervaringen blijkt Siri regelmatig erg handig want het geeft op verrassend veel vragen en verzoeken een passende reactie. En de spraakbesturing is in de auto of bij veel handelingen prettig effectief. Zo werkt de tekst: “Siri, zet de wekker om 07:00 uur” veel makkelijker, dan handmatig de wekker op de iPhone instellen (ca. 6 handelingen). Maar Siri is nog verre van perfect. Zeker bij 2x doorvragen, kan het weleens misgaan.
In zo’n geval riep ik een keer geïrriteerd cynisch tegen Siri: “Nou, slim ben jij”. Siri begreep blijkbaar dat dit zeker niet als een compliment bedoeld was en gaf me de volgende reactie:
Deze reactie van Siri verraste me. Siri kan blijkbaar het cynisme uit mijn opmerking herkennen en hierop razendsnel reageren met humor. Als dit nu al beschikbaar is voor consumenten via een smartphone, welke technologie is er dan al beschikbaar voor professionele Nederlandse contact centers?
Wim Luimes van Telecats bracht me in contact met Arjan van Hessen. Arjan is verbonden aan de Universiteiten van Twente en Utrecht en is daarnaast taal- en spraaktechnologieadviseur voor Telecats. Van Hessen legt uit:
In Nederland wordt al een tijdje gewerkt met het maken van keuzes via spraakherkenning – als alternatief voor de voice respons systemen. Maar met het voortschrijden van de techniek zie je een verschuiving richting multimodaal: je zoekt iets op met spraak en bevestigt de op het scherm getoonde keuze met een druk op de (virtuele) knop. Steeds vaker zie je het gebruik van zogeheten avatars: diensten, dikwijls weergegeven als een virtueel persoon, die steeds meer intelligentie ingebouwd krijgen. De interactie-technologie ontwikkelt zich snel, mede als gevolg van de mogelijkheden van HTML5, waardoor sommige avatars al lipsynchroon kunnen “praten”, “emotie” in hun gezichtsuitdrukking kunnen tonen en steeds vaker permanent luisteren of ze iets moeten doen. Je hoeft ze dan niet meer te activeren middels een druk op de knop, maar via een spraak commando: “Hee Google!” Cortona, Alexa, GoogleNow en Siri zijn daar goed voorbeelden van maar ook een echte Avatar als Anne van Virtaks: de virtuele assistent met eindeloos geduld die het leven van mensen met een beperking (en de verzorgenden erom heen) een stuk aangenamer maakt.
Hoe meer we multimodaal kunnen gaan communiceren met systemen en hoe meer het gaat lijken op de manier waarop wij mensen onderling communiceren, hoe sneller de selfservice zich zal ontwikkelen en uitbreiden.
Moeten we dan vertrouwen op systemen als Siri, die nog niet helemaal perfect zijn?
“Het is maar hoe je het bekijkt. Siri werkt technisch gezien vrijwel feilloos maar het is de interactie met de omgeving die het moeilijk maakt. Stel bijvoorbeeld de vraag aan Siri of je een paraplu moet meenemen. Siri duikt dan diep je smartphone in en houdt bij het bepalen van de reactie rekening met de vraag, de locatie, de weersvooruitzichten. Siri komt in een natuurlijk tempo met de mededeling dat het weer prima is en dat je geen plu mee hoeft te nemen. Bij Siri gaat het nog op twee punten mis:
- spraakherkenning is, net als bij mensen, niet perfect en zal dat ook niet worden. Wij mensen “verbeteren” onze spraakherkenning door verschillende mogelijke woorden in de context te plaatsen (oh, je bedoelt dit!)
- vragen kunnen ambigue zijn en alleen binnen de context worden opgelost (je kijkt naar de grijze lucht buiten en vraagt Siri: “moet ik iets aantrekken”.
De grote winst zit de komende jaren, aldus Van Hessen, in het gebruik van “Deep Learning Algorithme’s” waarbij de context van een conversatie wordt meegenomen. Mensen begrijpen een veranderende context in een fractie van een seconde; om de computer dit ook te laten doen heb je een enorme rekenkracht, nog betere algorithme’s en een nog beter begrip van “de mens” nodig. Maar die rekenkracht en de algorithme’s komen wel steeds meer binnen handbereik zoals de virtuele assistenten van alle grote Internet bedrijven laten zien.
Watson
Watson maakt gebruik van enorme hoeveelheden ongestructureerde tekstuele informatie zoals Wikipedia, de Wallstreet Journal, kranten, tijdschriften, boeken en meer. Door de tekst te “lezen”, te analyseren (wat is onderwerp-gezegde-lijdend voorwerp) lukt het om over een onderwerp te redeneren. Agatha Christie was een bekende detectiveschrijfster maar ook een amateurarcheoloog in Mesopotamië. Op de vraag “welke detectiveschrijfster vond iets uit het Koninkrijk van Koning Ashurnasirpal II” kon Watson dan ook het juiste antwoord geven: Agatha Christie!”
Maar Watson kan meer dan quizzen winnen. Het kan redeneren over gestelde vragen en zal dus worden ingezet op kennisintensieve domeinen zoals de medische de juridische en die van de call center wereld. Door Watson te trainen met alle beschikbare documenten van een specifiek domein, kan de hiërarchische structuur van een IVR vervangen worden door de open vraag: ‘Hoe kan ik je helpen?’ De klant antwoord met een vraag en het resultaat van de spraakherkenning wordt door Watson geanalyseerd. Afhankelijk van de vraag en Watsons analyse komt er een volgende vraag of een antwoord.
Je kunt er ook anders naar kijken: via het telefoniekanaal vragen we vooral ‘wat kan het bedrijf voor mij betekenen’ terwijl het internetkanaal veel meer gebruikt wordt om na te gaan ‘wat kan het bedrijf mij bieden’. Technologieën als Watson en Siri combineren die twee waardoor de spraakgestuurde apps meer en meer een versmelting van telefonie en internet zullen laten zien. Bovendien zullen ze steeds persoonlijker worden doordat de stemkeuze, de manier waarop zich gedragen en de “tone-of-voice” door de gebruiker aanpasbaar wordt.
“Er zijn nu apps die ‘call me now’ of ‘call me later’ aanbieden. Ik verwacht dat het outboundverkeer weer gaat toenemen, doordat systemen ons op verzoek gaan terugbellen: het is de klant die aan het stuur zit. Dus niet het bedrijf bepaalt wanneer ze de klant gaat bellen, maar juist de klant. Die gaat op een voor hem of haar geschikt moment de dialoog aan met de virtual agent van het bedrijf en geeft zelf aan of en zo ja wanneer hij/zij gebeld wil worden. Deze hybride aanpak van het gehele serviceproces zal, mist goed geïmplementeerd, steeds populairder worden. Vergelijk het met boodschappen doen in de Albert Heijn: op sommige plekken pak je zelf je artikelen, soms staat er iemand bij de versafdeling die je iets aangeeft en als jij iets wilt weten, benader jij iemand van het personeel met jouw vraag (“weet u waar de custardpoeder staat?"). Gemeenten en banken passen dit hybride model al toe; het past in hun strategie om met minder geld meer mensen goed te helpen.
Maar de grootste stap moet nog komen, aldus Van Hessen en dat is waarbij technologie het antwoord zelf gaat bedenken in plaats van alleen opzoeken. “Siri put nog uitsluitend uit bestaande gegevens, Watson is al een stapje verder en maakt tegenwoordig gebruik van ‘deep learning’. Dat betekent dat er niet wordt opgezocht in bestaande documenten, maar dat bestaande documenten gebruikt worden om over de vraag te redeneren.”
Spraakanalyse
Maar zal het gebruik van spraak afnemen? Wellicht, maar verdwijnen zal het niet! Mensen zullen misschien meer met avatars gaan praten maar er zullen altijd situaties zijn waarbij men toch de voorkeur geeft aan een persoonlijk gesprek met een ander mens. Beiden type gesprekken zijn in potentie zeer interessant. Door ze op te nemen, door de herkenner te halen en te analyseren, kunnen nog beter de drivers van klantcontacten worden bepaald. “Als je van tienduizenden opgenomen gesprekken weet wat de inhoud en dus de vraag / behoefte was, kun je processen en producten verbeteren en het aantal contacten terugdringen door de aanleiding te elimineren.”
Van Hessen kijkt met plezier nog iets verder vooruit. We kunnen binnen klantcontact al goed tbv WorkForce Management de verkeerspatronen voorspellen. “Maar wie belt wanneer over welk onderwerp? Dat is pas een uitdaging: het voorspellen van de inhoud.”
Fun Zeegers & Arjan van Hessen