Definitie
Audiotranscriptie is het proces waarbij gesproken taal wordt omgezet in geschreven tekst. Het creëert gestructureerde tekstgegevens uit ruwe spraakopnames.
Doel
Het doel is om spraak doorzoekbaar, analyseerbaar en bruikbaar te maken voor natuurlijke taalverwerking. Het wordt veel gebruikt in toegankelijkheid, media en bedrijfsanalyses.
Belang
- Schakelt ondertiteling en toegankelijkheidsservices in.
- Biedt tekstuele input voor het trainen van NLP-modellen.
- Kwaliteit hangt af van de nauwkeurigheid van de spraak-naar-tekstconversie.
- Gevoelig voor achtergrondgeluiden, accenten en opnamekwaliteit.
Hoe het werkt
- Audiobestanden opnemen of importeren.
- Verdeel de spraak in kleinere eenheden.
- Pas automatische spraakherkenning (ASR) of handmatige transcriptie toe.
- Corrigeer de tekst en controleer of deze correct is.
- Sla transcripties indien nodig op met tijdstempels of metagegevens.
Voorbeelden (echte wereld)
- Rev: transcriptiedienst voor media en bedrijfsleven.
- Otter.ai: realtime transcriptie van vergaderingen op basis van AI.
- YouTube: genereert ondertitels met behulp van ASR-modellen.
Referenties / Verder lezen
- Automatische spraakherkenning — NIST.
- ISO/IEC 15938-4: Beschrijving van multimedia-inhoud — ISO.
- Spraak- en taalverwerking — Jurafsky & Martin, Stanford.