Tijdens mijn werk als "spraaktechnoloog" heb ik redelijk wat aanvullende software-oplossingen ontwikkeld voor de werkzaamheden die zich vaak voordoen na "het gebruik van standaard ASR".
Deze verschillende softwarepakketten worden hier beschreven en beschikbaar gesteld om te downloaden.
LabelMaker: How to add lables to the transcripts?
LabelMaker V1 is een software programma dat het mogelijk maakt om labels toe te kennen aan geselecteerde delen van de ondertiteling.
ASRcorrector: How can I correct the mistakes within an automatically generated transcript?
ASRcorrector V2.8.15 (en hoger), is een software programma met verschillende schermen die het mogelijk maken de herkenningsresultaten te verbeteren.
FromTo: How can I convert a ctm/spk file into subtitles and/or html-files?
FromTo V1.6 is our solution for this.
Zodra de ASR is uitgevoerd, kan men de (getimede) resultaten downloaden. Elke ASR-engine lijkt echter zijn eigen output-formaten te hebben. Soms krijg je een speciaal XML-bestand, soms een CSV-bestand en soms iets anders. Bovendien, als het XML is, lijkt elke ASR-engine zijn eigen XML-schema te gebruiken.
Daarom hebben we software geschreven die de (standaard) output leest van de ASR-engines die wij ondersteunen (een CTM-bestand), en deze omzet in een van de volgende output formaten:
- SRT: het standaard ondertitelformaat dat door bijna alle bestaande video en audio spelers (zoals VLC) wordt gebruikt
- VTT: de nieuwe internetversie van het SRT-formaat, gebruikt door alle moderne browsers
- Karaoke: een html-bestand waarin elk herkend woord is "verbonden" met het audio-bestand en waarin klikken op een woord resulteert in het afspelen van het audio-bestand van dat woord. Gespeelde woorden worden gemarkeerd.
- CHA: het formaat dat wordt gebruikt in het CHILDES-formaat.
FAconvertor: How do I combine the corrected transcript with the CTM-file to generated a subtitle/karaoke style file?
FAconvertor is een software programma dat de gecorrigeerde tekst (van ASR corrector) combineert met het CTM-bestand (d.w.z. het resultaat van de FAconvertor-software). Het resultaat is een correct HTML-bestand (Karaoke), SRT-subtielbestand en tekstbestand dat gemakkelijk kan worden omgezet in een MSword-bestand.
FAgluer: How do I combine two (or more) parts of an interview into one set of files?
FAgluer is een software programma dat 3x 2 aangrenzende delen van een interview combineert. Het resultaat is een nieuw wav, ctm en txt-bestand.
To_WAV_Convertor: How do I convert audio or video files to WAVE files, a filetype which is often required by tools?
ToWave convertor is een softwareprogramma voor MacOS waarmee je diverse AV-bestanden kunt omzetten in een 16-16-1 wav-bestand (een 16kHz, 16-bit, mono).