Thaise gegevensset
Veelgestelde vragen
Hoogwaardige Thaise dataset met algemene conversaties, gescripte monologen en media (podcasts) voor AI- en spraakmodellen
Overzicht
Titel (Taal)
Dataset Thaise taal
Datasettypen
Algemeen gesprek, media (podcast), gescripte monoloog
Land
Thailand
Beschrijving
Deze dataset bevat niet-gescripte telefoongesprekken tussen twee mensen in het Hebreeuws uit Israël (15-60 minuten), licentieerbare audio- of videobestanden in het publieke domein met 1 tot 5 deelnemers (15-60 minuten) en gescripte monologen waarin één spreker vooraf gedefinieerde inhoud levert voor het trainen en evalueren van spraak- en taalmodellen.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Gegevenssetgegevens
| Gegevenssettype | Sampling Rate | Sprekers | Kanaal | Uren in totaal | Totaal aantal sprekers |
|---|---|---|---|---|---|
| Algemeen gesprek | 8 kHz | 2-Sprekers | Dubbel | 211:48:42 | 170 |
| Mediagegevens | 16 kHz | Enkele luidspreker | Mono | 249:14:31 | 670 |
| Monoloog met script | 24 kHz | Enkele luidspreker | Mono | 500:00:00 | Op aanvraag |
Uitgelichte klanten
Teams in staat stellen om toonaangevende AI-producten te bouwen.
Kunt u niet vinden wat u zoekt?
Er worden nieuwe kant-en-klare datasets verzameld voor alle datatypen
Neem nu contact met ons op om uw zorgen over het verzamelen van audio-/spraaktrainingsgegevens los te laten