Arabische dataset
البيانات-programma's
Hoogwaardige Arabische algemene conversatie en tekst-naar-spraak (TTS) voor AI en spraakmodellen
Overzicht
Titel (Taal)
Arabische taalgegevensset
Datasettypen
Callcenter, algemeen gesprek, muziek, gescripte monoloog
Land
Arabisch
Beschrijving
Deze dataset bevat niet-gescripte synthetische telefoongesprekken tussen agenten en klanten (5-15 minuten), natuurlijke telefoongesprekken tussen mensen in het Golf-Arabisch (15-60 minuten) en gezongen audio met transcripties. Daarmee worden uiteenlopende spraakgegevens verkregen voor het trainen en evalueren van spraak- en taaltechnologieën.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Gegevenssetgegevens
| Gegevenssettype | Sampling Rate | Sprekers | Kanaal | Uren in totaal | Totaal aantal sprekers |
|---|---|---|---|---|---|
| Call Center | 8 kHz | 2-Sprekers | Dubbel | 62:52:19 | Op aanvraag |
| Call Center | 8 kHz | 2-Sprekers | Mono | 1,025:09:19 | Op aanvraag |
| Algemeen gesprek | 8 kHz | 2-Sprekers | Dubbel | 254:16:34 | 626 |
| Muziek | 48 kHz | Enkele luidspreker | Mono | 03:17:21 | 10 |
| Monoloog met script | 48 kHz | Enkele luidspreker | Mono | 4,249:00:00 | 2,125 |
| Monoloog met script | 24 kHz | Enkele luidspreker | Mono | 2,300:00:00 | Op aanvraag |
Uitgelichte klanten
Teams in staat stellen om toonaangevende AI-producten te bouwen.
Kunt u niet vinden wat u zoekt?
Er worden nieuwe kant-en-klare datasets verzameld voor alle datatypen
Neem nu contact met ons op om uw zorgen over het verzamelen van audio-/spraaktrainingsgegevens los te laten