OpenAIEind 2022 heb ik de stoute schoenen aangetrokken en ben me gaan verdiepen in Python en Whisper. Whisper was al sinds de release in september 2022 een zeer veelbelovende herkenner en enkele vooruitstrevende collega's hadden het al werkend op hun computers. Dus, het moest ook mij wel lukken.
De kerstvakantie er deels voor gebruikt en eind januari lukte het: een uitstekend werkende Whisper op mijn Windows machine (en een paar week later ook op mijn MacBook Pro).

In mijn uitgebreide Whisper-verslag geef ik meer voorbeelden van welke software er beschikbaar is voor Windows en/of OSX.

In de weken er na ben ik druk bezig geweest met allerlei extra zaken zoals bv WhisperX: een tools die de resultaten van Whisper verbetert (niet wat er gezegd werd maar wanneer het gezegd werd).
Samen met de Radboud gaan we ook nog kijken of we Forced Alignment en Spreker Diarizatie direct met Whisper kunnen doen.

Kortom: het werkt en er komen ongetwijfeld nog nieuwe items bij. Wordt dus vervolgd :-)

 

  • Laatste aanpassing website: woensdag 19 juni 2024, 15:00:14.
  • Copyright @2023 Arjan van Hessen