Koreaanse dataset
Gebruik het apparaat
Hoogwaardige Koreaanse callcenter-, scripted monoloog- en media- (podcast) dataset voor AI- en spraakmodellen
Overzicht
Titel (Taal)
Koreaanse taalgegevensset
Datasettypen
Callcenter, mediagegevens, gescripte monoloog
Land
Korea
Beschrijving
Deze dataset bevat niet-gescripte synthetische telefoongesprekken tussen agenten en klanten (5–15 minuten), licentieerbare audio-/videobestanden in het publieke domein, zoals interviews en podcasts met 1 tot 5 deelnemers (15–60 minuten) en gescripte monologen met één spreker die vooraf gedefinieerde inhoud levert voor spraak- en taalmodeltraining.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Gegevenssetgegevens
| Gegevenssettype | Sampling Rate | Sprekers | Kanaal | Uren in totaal | Totaal aantal sprekers |
|---|---|---|---|---|---|
| Call Center | 8 kHz | 2-Sprekers | Dubbel | 102:27:55 | 1,244 |
| Mediagegevens | 16 kHz | Meerdere luidsprekers | Mono | 203:46:54 | 397 |
| Monoloog met script | 24 kHz | Enkele luidspreker | Mono | 500:00:00 | Op aanvraag |
| Monoloog met script | 48 kHz | Enkele luidspreker | Mono | 1,955:00:00 | Op aanvraag |
Uitgelichte klanten
Teams in staat stellen om toonaangevende AI-producten te bouwen.
Kunt u niet vinden wat u zoekt?
Er worden nieuwe kant-en-klare datasets verzameld voor alle datatypen
Neem nu contact met ons op om uw zorgen over het verzamelen van audio-/spraaktrainingsgegevens los te laten