Chinese dataset
Er zijn geen producten gevonden die aan je zoekcriteria voldoen
Hoogwaardige Chinese dataset voor AI- en spraakmodellen
Overzicht
Titel (Taal)
Dataset Chinese taal
Datasettypen
Callcenter, muziek, gescripte monoloog, mediagegevens (podcastgegevens)
Land
China
Beschrijving
Deze dataset bevat niet-gescripte synthetische telefoongesprekken tussen agenten en klanten (5-15 minuten), natuurlijke telefoongesprekken tussen mensen (15-60 minuten) en gezongen audio met transcripties. Daarmee worden uiteenlopende spraakgegevens verstrekt voor het trainen en evalueren van spraak- en taaltechnologieën.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Gegevenssetgegevens
| Taal | Gegevenssettype | Sampling Rate | Sprekers | Kanaal | Uren in totaal | Totaal aantal sprekers |
|---|---|---|---|---|---|---|
| Chinees gezang | Muziek | 48 kHz | Enkele luidspreker | Mono | 06:11:32 | 10 |
| Chinese traditionele) | Monoloog met script | 48 kHz | Enkele luidspreker | Mono | 1,499:00:00 | 1,805 |
| Chinees geaccentueerd Engels | Mediagegevens | 16 kHz | Meerdere luidsprekers | Mono | 306:04:58 | 2,130 |
| Vereenvoudigd Chinees | Monoloog met script | 48 kHz | Enkele luidspreker | Mono | 2,761:00:00 | 3,725 |
| Chinees Amerikaans geaccentueerd Engels | Call Center | 8 kHz | 2-Sprekers | Dubbel | 152:18:33 | 2,058 |
| Chinees Amerikaans geaccentueerd Engels | Mediagegevens | 16 kHz | Meerdere luidsprekers | Mono | 245:55:15 | 468 |
Uitgelichte klanten
Teams in staat stellen om toonaangevende AI-producten te bouwen.
Kunt u niet vinden wat u zoekt?
Er worden nieuwe kant-en-klare datasets verzameld voor alle datatypen
Neem nu contact met ons op om uw zorgen over het verzamelen van audio-/spraaktrainingsgegevens los te laten