Kannada-gegevensset
ಕನ್ನಡಡೇಟಾಸೆಟ್
Overzicht
Titel
Kannada Taalgegevensset
Gegevenssettype
Callcenter
Omschrijving
Niet-gescript, synthetisch telefonisch gesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Gegevenssetgegevens
Uren in totaal
60
Sample Rate
8 Khz
Audio Channel
Dubbel
Opnameplatform
Desktop
Audioformaat
. Wav
Transcriptie-indeling
.json
WER (%)
5
Gegevensset demografie
Land
India
Taal
Kannada
Geslacht
Man: 152, Vrouw: 342 en Onbekend: 0
Aantal Luidsprekers
494
Leeftijd
18-50
Overzicht
Titel
Kannada Taalgegevensset
Gegevenssettype
Algemeen gesprek
Omschrijving
Niet-gescript, synthetisch telefonisch gesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Gegevenssetgegevens
Uren in totaal
100
Sample Rate
8 Khz
Audio Channel
Dubbel
Opnameplatform
Desktop
Audioformaat
. Wav
Transcriptie-indeling
.json
WER (%)
5
Gegevensset demografie
Land
India
Taal
Kannada
Geslacht
Man: 129, Vrouw: 295 en Onbekend: 0
Aantal Luidsprekers
424
Leeftijd
18-50
Overzicht
Titel
Kannada Taalgegevensset
Gegevenssettype
Media-audio
Omschrijving
Licentiebaar Audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. – 1 tot 5 personen. ca. Audioduur (Bereik) 15-60 minuten.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Gegevenssetgegevens
Uren in totaal
40
Sample Rate
16 Khz
Audio Channel
Mono
Opnameplatform
Websourcing
Audioformaat
. Wav
Transcriptie-indeling
.json
WER (%)
5
Gegevensset demografie
Land
India
Taal
Kannada
Geslacht
Man: 74, Vrouw: 16 en Onbekend: 32
Aantal Luidsprekers
122
Leeftijd
18-50
Uitgelichte klanten
Teams in staat stellen om toonaangevende AI-producten te bouwen.
Kunt u niet vinden wat u zoekt?
Er worden nieuwe kant-en-klare datasets verzameld voor alle datatypen
Neem nu contact met ons op om uw zorgen over het verzamelen van audio-/spraaktrainingsgegevens los te laten