Kannada-gegevensset
ಕನ್ನಡಡೇಟಾಸೆಟ್
Hoogwaardige Kannada-dataset voor callcenters, algemene gesprekken, gescripte monologen en media (podcasts) voor AI- en spraakmodellen
Overzicht
Titel (Taal)
Kannada-taaldataset
Datasettypen
Callcenter, algemeen gesprek, mediagegevens, gescripte monoloog
Land
India
Beschrijving
Deze dataset bevat niet-gescripte synthetische telefoongesprekken tussen agenten en klanten (5–15 minuten), licentieerbare audio- of videobestanden in het publieke domein, zoals interviews en podcasts met 1 tot 5 deelnemers (15–60 minuten) en gescripte monologen waarin één spreker vooraf gedefinieerde inhoud levert voor het trainen en evalueren van spraak- en taalmodellen.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Gegevenssetgegevens
| Gegevenssettype | Sampling Rate | Sprekers | Kanaal | Uren in totaal | Totaal aantal sprekers |
|---|---|---|---|---|---|
| Call Center | 8 kHz | 2-Sprekers | Dubbel | 59:57:02 | 494 |
| Call Center | 16 kHz | 2-Sprekers | Mono | 195:26:56 | 9,504 |
| Algemeen gesprek | 8 kHz | 2-Sprekers | Dubbel | 141:27:15 | 424 |
| Mediagegevens | 16 kHz | Meerdere luidsprekers | Mono | 14:19:52 | 124 |
| Monoloog met script | 24 kHz | Enkele luidspreker | Mono | 500:00:00 | Op aanvraag |
Uitgelichte klanten
Teams in staat stellen om toonaangevende AI-producten te bouwen.
Kunt u niet vinden wat u zoekt?
Er worden nieuwe kant-en-klare datasets verzameld voor alle datatypen
Neem nu contact met ons op om uw zorgen over het verzamelen van audio-/spraaktrainingsgegevens los te laten