Malayalam-gegevensset
മലയാളം voor de toekomst
Hoogwaardige Malayalam-dataset met algemene conversaties en podcasts voor AI- en spraakmodellen
Overzicht
Titel (Taal)
Malayalam-taaldataset
Datasettypen
Algemeen gesprek, media (podcast) gegevens
Land
India
Beschrijving
Deze dataset bevat niet-gescripte synthetische telefoongesprekken tussen een agent en een klant (5–15 minuten) en licentieerbare audio- of videobestanden in het publieke domein, zoals interviews en podcasts met 1 tot 5 deelnemers (15–60 minuten).
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Gegevenssetgegevens
| Gegevenssettype | Sampling Rate | Sprekers | Kanaal | Uren in totaal | Totaal aantal sprekers |
|---|---|---|---|---|---|
| Algemeen gesprek | 8 kHz | 2-Sprekers | Dubbel | 70:46:30 | 576 |
| Algemeen gesprek | 8 kHz | 2-Sprekers | Dubbel | 149:39:33 | 296 |
| Mediagegevens | 16 kHz | Meerdere luidsprekers | Mono | 12:39:24 | 81 |
Uitgelichte klanten
Teams in staat stellen om toonaangevende AI-producten te bouwen.
Kunt u niet vinden wat u zoekt?
Er worden nieuwe kant-en-klare datasets verzameld voor alle datatypen
Neem nu contact met ons op om uw zorgen over het verzamelen van audio-/spraaktrainingsgegevens los te laten