Tamil-gegevensset
தமிழ் van het programma
Overzicht
Titel
tamil Taalgegevensset
Gegevenssettype
Callcenter
Omschrijving
Niet-gescript, synthetisch telefonisch gesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Gegevenssetgegevens
Uren in totaal
60
Sample Rate
8 Khz
Audio Channel
Dubbel
Opnameplatform
Desktop
Audioformaat
. Wav
Transcriptie-indeling
.json
WER (%)
5
Gegevensset demografie
Land
India
Taal
tamil
Geslacht
Man: 102, Vrouw: 442 en Onbekend: 0
Aantal Luidsprekers
544
Leeftijd
18-50
Overzicht
Titel
tamil Taalgegevensset
Gegevenssettype
Algemeen gesprek
Omschrijving
Niet-gescript, synthetisch telefonisch gesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Gegevenssetgegevens
Uren in totaal
100
Sample Rate
8 Khz
Audio Channel
Dubbel
Opnameplatform
Desktop
Audioformaat
. Wav
Transcriptie-indeling
.json
WER (%)
5
Gegevensset demografie
Land
India
Taal
tamil
Geslacht
Man: 158, Vrouw: 282 en Onbekend: 0
Aantal Luidsprekers
440
Leeftijd
18-50
Overzicht
Titel
tamil Taalgegevensset
Gegevenssettype
Media-audio
Omschrijving
Licentiebaar Audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. – 1 tot 5 personen. ca. Audioduur (Bereik) 15-60 minuten.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Gegevenssetgegevens
Uren in totaal
40
Sample Rate
16 Khz
Audio Channel
Mono
Opnameplatform
Websourcing
Audioformaat
. Wav
Transcriptie-indeling
.json
WER (%)
5
Gegevensset demografie
Land
India
Taal
tamil
Geslacht
Man: 28, Vrouw: 4 en Onbekend: 0
Aantal Luidsprekers
32
Leeftijd
18-50
Uitgelichte klanten
Teams in staat stellen om toonaangevende AI-producten te bouwen.
Kunt u niet vinden wat u zoekt?
Er worden nieuwe kant-en-klare datasets verzameld voor alle datatypen
Neem nu contact met ons op om uw zorgen over het verzamelen van audio-/spraaktrainingsgegevens los te laten