Swahili gegevensset
Hifadhidata en Kiswahili
Overzicht
Titel
swahili Taal
dataset
Gegevenssettype
Callcenter
Linker kanaal
Juist kanaal
Omschrijving
Niet-gescript, synthetisch telefonisch gesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Gegevenssetgegevens
Uren in totaal
230
Sample Rate
8 kHz
Audio Channel
Dubbel
Opnameplatform
Desktop
Audioformaat
. Wav
Transcriptie-indeling
.json
WER (%)
5
Gegevensset demografie
Land
swahili
Taal
swahili
Geslacht
Vrouw 611, Man 833, Onbekend 0
Aantal Luidsprekers
1,444
Leeftijd
18-50
Overzicht
Omschrijving
Licentiebaar Audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. – 1 tot 5 personen. ca. Audioduur (Bereik) 15-60 minuten.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Gegevenssetgegevens
Uren in totaal
265
Sample Rate
16 kHz
Audio Channel
Mono
Opnameplatform
Websourcing
Audioformaat
. Wav
Transcriptie-indeling
.json
WER (%)
5
Gegevensset demografie
Land
swahili
Taal
swahili
Geslacht
Vrouw 118, Man 493, Onbekend 25
Aantal Luidsprekers
636
Leeftijd
18-50
Uitgelichte klanten
Teams in staat stellen om toonaangevende AI-producten te bouwen.
Kunt u niet vinden wat u zoekt?
Er worden nieuwe kant-en-klare datasets verzameld voor alle datatypen
Neem nu contact met ons op om uw zorgen over het verzamelen van audio-/spraaktrainingsgegevens los te laten