Spraakherkenning is de laatste jaren fors beter geworden en is nu in staat om spraak die rustige en helder gesproken wordt en die bovendien goed wordt opgenomen, zeer goed te herkennen. Voorbeelden zijn gesprekken van politici in het parlement, podcasts, lezingen en meer. Wat nog lastig is, zijn de meer discussieachtige gesprekken waar sprekers een punt willen maken en elkaar in de rede vallen. Ook bij de wat hijgerige gesprekken waarbij zinnen maar half worden uitgesproken, valt er nog wel wat te verbeteren. En uiteraard hebben we nog steeds het OV-probleem: Out-of-Vocabular oftwel het gesproken woord staat niet in ons woordenboek en kan dus niet herkend worden. Dikwijls treedt deze OV op bij specialistische gesprekken over bv de financiele wereld ("Financial Due Diligence", "Mortgage Rate", "Debt Ratio") of medische wereld ("antiseptisch", "psychosomatisch". Voor dat soort gesprekken moet dan ook een eigen taalmodel gemaakt worden waarbij gebruik gemaakt moet worden van teksten uit die betreffende wereld.

Zo werd in 2016 het Oral History taalmodel gemaakt (met behulp van 600 interviews van Getuigenverhalen) waarin de typische WOII woorden voorkwamen. In 2017 werd samen met de Dienst Verslaglegging en Registratie (DVR) het Parlementaire taalmodel gemaakt.

Om te laten zien hoe goed (of slecht) de herkenning werkt, tonen we hieronder een aantal voorbeelden van het herkennen van verschillende soorten gesprekken.


 

  • Laatste aanpassing website: maandag 22 januari 2024, 09:40:03.
  • Copyright @2023 Arjan van Hessen