Spraak-naar-tekst

Spraak-naar-tekst

Definitie

Spraak-naar-tekst (STT) is het proces waarbij gesproken taal automatisch wordt omgezet in geschreven tekst met behulp van AI-modellen. Het is nauw verwant aan ASR.

Doel

Het doel is om gesproken content toegankelijk en doorzoekbaar te maken. Het wordt veel gebruikt in transcriptie, toegankelijkheid en digitale assistenten.

Belang

  • Ondersteunt de toegankelijkheid voor slechthorende gebruikers.
  • Zorgt voor transcripties van vergaderingen en lezingen.
  • De nauwkeurigheid hangt af van accenten en geluidsomstandigheden.
  • Wordt gebruikt in bijna alle spraakgestuurde toepassingen.

Hoe het werkt

  1. Audio-invoer vastleggen.
  2. Voorbewerken en normaliseren van audiosignalen.
  3. Pas ASR-modellen toe om woorden te herkennen.
  4. Transcriptie van de uitvoertekst.
  5. Controleer of corrigeer indien nodig onder menselijk toezicht.

Voorbeelden (echte wereld)

  • Google Cloud spraak-naar-tekst-API.
  • Microsoft Azure-spraakdiensten.
  • Transcriptie van Otter.ai-vergadering.

Referenties / Verder lezen

Vertel ons hoe we u kunnen helpen met uw volgende AI-initiatief.