Marathi-gegevensset
Ik denk dat het goed is
Hoogwaardige Marathi callcenter-, algemene conversatie-, gescripte monoloog- en mediadataset (podcast) voor AI- en spraakmodellen
Overzicht
Titel (Taal)
Marathi-taaldataset
Datasettypen
Callcenter, Algemeen gesprek, Media (podcast), Gescripte monoloog
Land
India
Beschrijving
Deze dataset bevat niet-gescripte synthetische telefoongesprekken tussen agenten en klanten (5-15 minuten), natuurlijke telefoongesprekken tussen mensen (15-60 minuten) en gezongen audio met transcripties. Daarmee worden uiteenlopende spraakgegevens verstrekt voor het trainen en evalueren van spraak- en taaltechnologieën.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Gegevenssetgegevens
| Gegevenssettype | Sampling Rate | Sprekers | Kanaal | Uren in totaal | Totaal aantal sprekers |
|---|---|---|---|---|---|
| Call Center | 8 kHz | 2-Sprekers | Dubbel | 70:28:58 | 634 |
| Algemeen gesprek | 8 kHz | 2-Sprekers | Dubbel | 159:21:13 | 298 |
| Mediagegevens | 16 kHz | Multipal-luidsprekers | Mono | 24:09:24 | 94 |
| Monoloog met script | 24 kHz | Enkele luidspreker | Mono | 3,900:00:00 | Op aanvraag |
Uitgelichte klanten
Teams in staat stellen om toonaangevende AI-producten te bouwen.
Kunt u niet vinden wat u zoekt?
Er worden nieuwe kant-en-klare datasets verzameld voor alle datatypen
Neem nu contact met ons op om uw zorgen over het verzamelen van audio-/spraaktrainingsgegevens los te laten