Engelse dataset
हिंगलिश voor
Hoogwaardige Hinglish Call-Center- en Podcast-dataset voor AI- en spraakmodellen
Overzicht
Titel (Taal)
Hinglish-taaldataset
Datasettypen
Callcenter, Mediagegevens
Land
India
Beschrijving
Niet-gescripte, synthetische telefoongesprekken tussen een agent en een klant hebben een duur van 5 tot 15 minuten, terwijl licentieerbare, publieke audio- of videobestanden, zoals interviews en podcasts met 1 tot 5 deelnemers, doorgaans een duur hebben van 15 tot 60 minuten.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Gegevenssetgegevens
| Gegevenssettype | Sampling Rate | Sprekers | Kanaal | Uren in totaal | Totaal aantal sprekers |
|---|---|---|---|---|---|
| Call Center | 8 kHz | 2-Sprekers | Dubbel | 240:54:06 | 2404 |
| Mediagegevens | 16 kHz | Multipal-luidsprekers | Mono | 144:15:36 | 317 |
Uitgelichte klanten
Teams in staat stellen om toonaangevende AI-producten te bouwen.
Kunt u niet vinden wat u zoekt?
Er worden nieuwe kant-en-klare datasets verzameld voor alle datatypen
Neem nu contact met ons op om uw zorgen over het verzamelen van audio-/spraaktrainingsgegevens los te laten