Telugu-gegevensset
తెలుగు డేటాసెట్
Hoogwaardige Telugu callcenter-, algemene conversatie-, gescripte monoloog- en mediadataset (podcast) voor AI- en spraakmodellen
Overzicht
Titel (Taal)
Telgu-taaldataset
Datasettypen
Callcenter, algemeen gesprek, muziek, gescripte monoloog
Land
India
Beschrijving
Deze dataset bevat niet-gescripte synthetische gesprekken tussen agenten en klanten (5-15 minuten), natuurlijke telefoongesprekken tussen mensen (15-60 minuten) en mediadata met transcripties. Daarmee worden uiteenlopende spraakgegevens geboden voor het trainen en evalueren van spraak- en taaltechnologieën.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Gegevenssetgegevens
| Gegevenssettype | Sampling Rate | Sprekers | Kanaal | Uren in totaal | Totaal aantal sprekers |
|---|---|---|---|---|---|
| Call Center | 8 kHz | 2-Sprekers | Dubbel | 62:32:27 | 496 |
| Algemeen gesprek | 8 kHz | 2-Sprekers | Dubbel | 654:08:03 | 1,601 |
| Mediagegevens | 16 kHz | Meerdere luidsprekers | Mono | 666:24:29 | 1,230 |
| Monoloog met script | 24 kHz | Enkele luidspreker | Mono | 1,700:00:00 | Op aanvraag |
Uitgelichte klanten
Teams in staat stellen om toonaangevende AI-producten te bouwen.
Kunt u niet vinden wat u zoekt?
Er worden nieuwe kant-en-klare datasets verzameld voor alle datatypen
Neem nu contact met ons op om uw zorgen over het verzamelen van audio-/spraaktrainingsgegevens los te laten