• Facebook
  • LinkedIn
  • Blogs
  • Inloggen
  • Home
  • Schrijfsels
    • Blogs
    • Populaire
    • Wetenschappelijk
    • Drenten
  • In de media
    • AV
    • Web
    • Krant
    • Lezingen
    • AV-Lezingen
    • Televisie
  • Werk
    • TST & AI
      • Spraakherkenning
      • AI
      • Whisper
      • Knowledge Navigator
      • Showcases
      • Subtitles
      • LIPS
      • NTU
      • UvN
      • Maastricht
      • Diplomaten
      • TTS
      • URaad
      • Preek
    • Affiliaties
      • UTwente
      • UU
      • Telecats
      • Vorige wergevers
    • Netwerken
      • NOTaS
      • CLST
      • Levende Herinneringen
    • Infrastructuur
      • CLARIAH
      • CLARIN-NL
      • CLARIN-EU
      • DARIAH
      • CHAT
      • LISTEN
      • Verteld Verleden
    • Projecten
      • Voltooid
        • TTNWW
        • Radio Oranje
        • Buchenwald
        • Bosnian Memories
        • Croatian Memories
      • Lopend
      • Demonstratie
        • Gemeenten
        • Oratie
        • Preek
        • Klimaatverandering
        • Café Weltschmerz
        • Debat Gemist
    • Programming
    • Software
    • Over mij
    • LOT 2023
      • Background
      • Course
      • Assignments
      • AV-files
  • Persoonlijk
    • Arjan
      • Arjan
      • Ouders
      • Zus & Broer
      • Neven & Nicht
      • Grootouders
    • Brigitte
      • Brigitte
      • Ouders
      • Broer & Zus
      • Nicht & Neef
      • Grootouders
      • Operatie
    • Drentsche Patrijshonden
      • Pepper
      • Moos
    • Huizen
      • Samen
        • Italië
        • Burg. Reiger (2010 - ...)
        • Steve Biko (2009 - 2010)
        • Baarnseweg (2007 - 2009)
        • Poortstraat (1994 - 2007)
      • Arjan
        • Poortstraat (1977 -1994)
        • Sweelincklaan (1972 -1977)
        • Soestdijkseweg (1965 -1972)
        • Biltzigt (1958 -1965)
      • Brigitte
        • Thijssenlaan (1985 - 1994)
        • Braamstraat (1981 - 1985)
        • Voorstraat (1980 -1981)
        • Hopakker (1980 -1980)
        • Kemperstraat (1979 -1979)
        • Verwerstraat (1968 - 1979)
        • Oude Raadhuisstraat (1961 - 1968)
        • Drostlaan (1960 - 1961)
    • Rolanda
      • Levensverhaal
      • Rolanda 85
      • Afnemende Gezondheid
      • Begrafenis
      • Foto's
        • 85 Jaar
        • Sta-op stoel
  • Interessant
    • Zipf's Law
    • Conversatie Regels
    • Toon PDF
  • Extra Activiteit
  • WebServices
    • LabelMaker
    • IetsAnders

blogs

  • TST & AI
    • Spraakherkenning
    • AI
    • Whisper
    • Knowledge Navigator
    • Showcases
    • Subtitles
    • LIPS
    • NTU
    • UvN
    • Maastricht
    • Diplomaten
    • TTS
    • URaad
    • Preek
  • Affiliaties
    • UTwente
    • UU
    • Telecats
    • Vorige wergevers
  • Netwerken
    • NOTaS
    • CLST
    • Levende Herinneringen
  • Infrastructuur
    • CLARIAH
    • CLARIN-NL
    • CLARIN-EU
    • DARIAH
    • CHAT
    • LISTEN
    • Verteld Verleden
  • Projecten
    • Voltooid
      • TTNWW
      • Radio Oranje
      • Buchenwald
      • Bosnian Memories
      • Croatian Memories
    • Lopend
    • Demonstratie
      • Gemeenten
      • Oratie
      • Preek
      • Klimaatverandering
      • Café Weltschmerz
      • Debat Gemist
  • Programming
  • Software
  • Over mij
  • LOT 2023
    • Background
    • Course
    • Assignments
    • AV-files

Showcases

Spraakherkenning is de laatste jaren fors beter geworden en is nu in staat om spraak die rustige en helder gesproken wordt en die bovendien goed wordt opgenomen, zeer goed te herkennen. Voorbeelden zijn gesprekken van politici in het parlement, podcasts, lezingen en meer. Wat nog lastig is, zijn de meer discussieachtige gesprekken waar sprekers een punt willen maken en elkaar in de rede vallen. Ook bij de wat hijgerige gesprekken waarbij zinnen maar half worden uitgesproken, valt er nog wel wat te verbeteren. En uiteraard hebben we nog steeds het OV-probleem: Out-of-Vocabular oftwel het gesproken woord staat niet in ons woordenboek en kan dus niet herkend worden. Dikwijls treedt deze OV op bij specialistische gesprekken over bv de financiele wereld ("Financial Due Diligence", "Mortgage Rate", "Debt Ratio") of medische wereld ("antiseptisch", "psychosomatisch". Voor dat soort gesprekken moet dan ook een eigen taalmodel gemaakt worden waarbij gebruik gemaakt moet worden van teksten uit die betreffende wereld.

Zo werd in 2016 het Oral History taalmodel gemaakt (met behulp van 600 interviews van Getuigenverhalen) waarin de typische WOII woorden voorkwamen. In 2017 werd samen met de Dienst Verslaglegging en Registratie (DVR) het Parlementaire taalmodel gemaakt.

Om te laten zien hoe goed (of slecht) de herkenning werkt, tonen we hieronder een aantal voorbeelden van het herkennen van verschillende soorten gesprekken.


UMCG

EC: Biobrandstof

UvN: Marc van Oostendorp

UvN: Marc van Oostendorp

Hieronder een opnamen van een voordracht van Marc van Oostendorp voor de Universiteit van Nederland over "Waarom het raar is om met een Gooise R te praten".

Ondertiteling

Marc van Oostendorp

Karaoke

UvN: Abram de Swaan

UvN: Abram de Swaan

Hieronder een opnamen van een voordracht van Abram de Swaan voor de Universiteit van Nederland over "Waarom de ene taal succesvol is en de andere uitsterft".

Beslist geen slechte herkenning.

Ondertiteling

Abram de Swaan

Karaoke

Correspondent 2 april 2019

logo black red transparentOp 2 april 2019 was er een boeiden Podcast van Joris Luyendijk, Marc Chavanne en Ri (van de Correspondent) over de Brexit.

Helder gesproken en dus goed te herkennen. Hieronder het gesprek in karaoke-stijl.

 

Correspondent 18 mei 2018

Openbare vergaderingen

Spraakherkenning van openbare vergaderingen

In 2015 hebben we bij Telecats voor 3 verschillende gemeenten een korte demo gemaakt. Een paar opnamen van ongeveer een halfuur van willekeurig gekozen gemeenteraadsvergaderingen werden, zonder dat er iets aan getuned werd, door de spraakherkenner gehaald. Niet alle geluidsopnamen waren even geweldig (voorals die van Lansingerland was wat overstuurd), maar het eindresultaat stelde desalnietemin niet teleur.

Hieronder staan de 4 opnamen en hun resultaat. Door op een willekeurig woord in de herkende tekst te klikken, springt men erheen en wordt de opname vanaf dat punt verder afgespeeld.

Enschede

Enschede (II)

Dinkelland

Lansingerland

Tweede Kamer

Vlaams Parlement

 

 

  • Laatste aanpassing website: donderdag 30 maart 2023, 08:30:40.