Punjabi-gegevensset
Ik denk dat het goed is
Hoogwaardige Punjabi callcenter-, algemene conversatie- en mediadataset (podcast) voor AI- en spraakmodellen
Overzicht
Titel (Taal)
Punjabi-taaldataset
Datasettypen
Callcenter, algemene gesprekken, media (podcast) gegevens
Land
India
Beschrijving
Ongescripte, synthetische telefoongesprekken tussen een agent en een klant zijn beschikbaar met een geschatte duur van 5 tot 15 minuten. Daarnaast zijn licentieerbare audio- of videobestanden in het publieke domein, zoals interviews, podcasts en soortgelijke content met 1 tot 5 deelnemers, beschikbaar met een geschatte duur van 15 tot 60 minuten.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Gegevenssetgegevens
| Gegevenssettype | Sampling Rate | Sprekers | Kanaal | Uren in totaal | Totaal aantal sprekers |
|---|---|---|---|---|---|
| Call Center | 48 kHz | 2-Sprekers | Dubbel | 66:04:45 | 788 |
| Algemeen gesprek | 8 kHz | 2-Sprekers | Dubbel | 64:31:42 | 310 |
| Mediagegevens | 16 kHz | Meerdere luidsprekers | Mono | 11:27:33 | 44 |
Uitgelichte klanten
Teams in staat stellen om toonaangevende AI-producten te bouwen.
Kunt u niet vinden wat u zoekt?
Er worden nieuwe kant-en-klare datasets verzameld voor alle datatypen
Neem nu contact met ons op om uw zorgen over het verzamelen van audio-/spraaktrainingsgegevens los te laten