Chinees-Engelse gegevensset
de beste manier om het te doen
Hoogwaardige Chinese Engelstalige callcenter- en podcastdataset voor AI- en spraakmodellen
Overzicht
Onderwerp
Chinees Engels Taalgegevensset
Gegevenssettype
Callcenter
Beschrijving
Niet-gescript, synthetisch telefonisch gesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Gegevenssetgegevens
Uren in totaal
169
Sample Rate
8 kHz
Audio Channel
Dubbel
Opnameplatform
Desktop
Audioformaat
. Wav
Transcriptie-indeling
.json
WER (%)
5
Gegevensset demografie
Land
China
Taal
Chinees Engels
Geslacht
Vrouw 1790, Man 523, Onbekend 13
Aantal Luidsprekers
2,326
Leeftijd
18-50
Overzicht
Onderwerp
Chinees Engels Taalgegevensset
Gegevenssettype
Podcast
Beschrijving
Licentiebaar Audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. – 1 tot 5 personen. ca. Audioduur (Bereik) 15-60 minuten.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Gegevenssetgegevens
Uren in totaal
249
Sample Rate
16 kHz
Audio Channel
Mono
Opnameplatform
Websourcing
Audioformaat
. Wav
Transcriptie-indeling
.json
WER (%)
5
Gegevensset demografie
Land
China
Taal
Chinees Engels
Geslacht
Vrouw 126, Man 346, Onbekend 6
Aantal Luidsprekers
478
Leeftijd
18-50
Overzicht
Onderwerp
Wuhan Taalgegevensset
Gegevenssettype
Spontane dialoog
Uren in totaal
500
Sample Rate
16 kHz
Chinees Taalgegevensset
TTS
300
16 kHz
Hokkienees Taalgegevensset
Spontane dialoog
100
16 kHz
Sjanghai Taalgegevensset
Spontane dialoog
500
16 kHz
Sichuan Taalgegevensset
Spontane dialoog
500
16 kHz
Engels (Chinees) Taalgegevensset
Gescript spontaan
2,000
16 kHz
Uitgelichte klanten
Teams in staat stellen om toonaangevende AI-producten te bouwen.
Kunt u niet vinden wat u zoekt?
Er worden nieuwe kant-en-klare datasets verzameld voor alle datatypen
Neem nu contact met ons op om uw zorgen over het verzamelen van audio-/spraaktrainingsgegevens los te laten