Hoogwaardige audio-/spraak-/spraakdatasets om uw gespreks-AI-model te trainen 

Kant-en-klare spraak-/spraak-/audiodatasets in meerdere talen om uw automatische spraakherkenningsmodellen (ASR) een vliegende start te geven

Spraakgegevenssets

Plug de audiodatacatalogus in die je vandaag hebt gemist

DetailsTaalgegevenssetSample RateGegevenssettypeTotaal aantal audio-urenKorte omschrijvingGegevenssetbeschrijvingAudio ChannelOpnameplatformWER (%)AudioformaatTranscriptie-indelingUse CaseAantal LuidsprekersCTA
Spraaknl_US_CC_8Afro-Amerikaanse volkstaalAfro-Amerikaanse volkstaalnl_NL8 kHzCallcenter211Afro-Amerikaanse lokale callcentergegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,Dubbeldesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw: 612, Man: 1242 en Onbekend: 12
Spraaknl_US_MA_16Afro-Amerikaanse volkstaalAfro-Amerikaanse volkstaalnl_NL16 kHzMedia-audio154Afro-Amerikaanse lokale mediagegevensLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenMonoWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw: 151, Man: 150 en Onbekend: 10
SpraakAfrikaans_GC_8AfrikaansAfrikaansaf_ZA8 kHzAlgemeen gesprek368Afrikaans Algemene gespreksgegevensUnscripted telefonisch gesprek tussen twee mensen. Ca. Audioduur (bereik) - 15-60 minuten, Afrikaans gesproken in AfrikaDubbeldesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw: 502, Man: 390 en Onbekend: 2
SpraakAfrikaans_MA_16AfrikaansAfrikaansaf_ZA16 kHzMedia-audio658Afrikaanse mediabestandenLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenMonoWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw: 750, Man: 1278 en Onbekend: 52
SpraakArabisch_GC_8ArabischArabischar_AE8 kHzAlgemeen gesprek292Arabisch Algemene gespreksgegevensUnscripted telefonisch gesprek tussen twee mensen. Ca. Audioduur (bereik) - 15-60 minuten, Arabisch uit de GolfstatenDubbeldesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw: 171, Man: 534 en Onbekend: 1
SpraakArabisch_SM_48ArabischArabischar-SA48 kHzMonoloog met script1,947Monoloog in Arabisch scriptOpnamen met één uiting, die meestal binnen het bereik van 5 tot 30 seconden vallenMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 838 Man 1209 Onbekend 78
SpraakAssamees_CC_8AssameesAssamees (in pijplijn) als inCallcenter60Assamese (in pijplijn) callcentergegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakAssamees_GCAssameesAssamees (in pijplijn) als inAlgemeen gesprek100Assamees (in de pijplijn) Algemene gespreksgegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakAssamees_MAAssameesAssamees (in pijplijn) als inMedia-audio40Assamees (in pijplijn) Media-audiogegevensLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakBengaals_CC_8BengaleesBengaals (in de pijplijn) bn_INCallcenter60Bengaalse (in pijplijn) callcentergegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakBengaals_GCBengaleesBengaals (in de pijplijn) bn_INAlgemeen gesprek100Bengaals (in pijplijn) Algemene gespreksgegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakBengaals_MABengaleesBengaals (in de pijplijn) bn_INMedia-audio40Bengaals (in pijplijn) Media-audiogegevensLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakBoston_CC_8Boston EngelsBoston Engelsnl_NL8 kHzCallcenter177Boston Callcenter-gegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,Dubbeldesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw: 605, Man: 711 en Onbekend: 0
SpraakBoston_GC_8Boston EngelsBoston Engelsnl_NL8 kHzAlgemeen gesprek32Boston Algemene gespreksgegevensUnscripted telefonisch gesprek tussen twee mensen. Ca. Audioduur (bereik) - 15-60 minuten, Dubbeldesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw: 53, Man: 83 en Onbekend: 0
SpraakBoston_MA_16Boston EngelsBoston Engelsnl_NL16 kHzMedia-audio93Boston Media-audiogegevensLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenMonoWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw: 43, Man: 181 en Onbekend: 2
SpraakCanadese_SM_48Canadees FransCanadees Fransfr-CA48 kHzMonoloog met script1,222Canadees FransOpnamen met één uiting, die meestal binnen het bereik van 5 tot 30 seconden vallenMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 974 Man 631 Onbekend 1
SpraakChinees_CC_8Chinees EngelsChinees Engelsnl_NL8 kHzCallcenter169Chinese callcentergegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,Dubbeldesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw: 1790, Man: 523 en Onbekend: 13
SpraakChinees_MA_16Chinees EngelsChinees Engelsnl_NL16 kHzMedia-audio249Chinese media-audiogegevensLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenMonoWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw: 126, Man: 346 en Onbekend: 6
SpraakVereenvoudigd Chinees_SM_48Vereenvoudigd ChineesVereenvoudigd Chineeszh-CN48 kHzMonoloog met script2,762Vereenvoudigd ChineesOpnamen met één uiting, die meestal binnen het bereik van 5 tot 30 seconden vallenMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 1920 Man 1535 Onbekend 270
SpraakTraditioneel Chinees_SM_48Traditioneel ChineesTraditioneel Chineeszh-TW48 kHzMonoloog met script1,028Traditioneel ChineesOpnamen met één uiting, die meestal binnen het bereik van 5 tot 30 seconden vallenMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 1069 Man 262 Onbekend 3
SpraakDeens_GC_8DeensDeensda_DK8 kHzAlgemeen gesprek372Deense algemene conversatiegegevensUnscripted telefonisch gesprek tussen twee mensen. Ca. Audioduur (bereik) - 15-60 minuten, Dubbeldesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw: 311, Man: 417, Onbekend: 0
SpraakDeens_MA_16DeensDeensda_DK16 kHzMedia-audio664Deense media audiogegevensLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenMonoWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw: 369, Man: 864, Onbekend: 27
SpraakDeens_SM_48DeensDeensda-DK48 kHzMonoloog met script2,579Deens geschreven monoloogOpnamen met één uiting, die de neiging hebben om in het bereik van 5 tot 30 seconden te vallen, Deens uit DenemarkenMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 1551 Man 1233 Onbekend 42
SpraakEngels Diep Zuid_CC_8Engels Diep ZuidEngels Diep Zuidnl_NL8 kHzCallcenter151Engels Deep South Callcenter-gegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,Dubbeldesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 221 , Man 1004 , Onbekend 7
SpraakEngels Diep Zuid_GC_8Engels Diep ZuidEngels Diep Zuidnl_NL8 kHzAlgemeen gesprek56Engelse Deep South Algemene gespreksgegevensUnscripted telefonisch gesprek tussen twee mensen. Ca. Audioduur (bereik) - 15-60 minuten, Dubbeldesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 99, Man 31, Onbekend 0
SpraakEngels Diep Zuid_MA_16Engels Diep ZuidEngels Diep Zuidnl_NL16 kHzMedia-audio266Engelse Deep South Media-audiogegevensLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenMonoWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 204, Man 356, Onbekend 21
SpraakDuits_CC_8DuitsDuitsde-De8 kHzCallcenter64Duitse callcentergegevens Ongescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,Monodesktop. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 478 Man 1440 Onbekend 0
SpraakDuitse_IVR_8DuitsDuitsde-De8 kHz IVR200Duitse IVR-gegevensMens naar machine. Een IVR-type stroom waarbij er een TTS-prompt is (bijv. "Hoe kan ik u helpen") gevolgd door een spontane menselijke reactieMonodesktop. Wav .jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling Vrouw 10115 Man 8750 Onbekend 0
SpraakGujarati_CC_8GujaratiGujarati (in de pijplijn) gu_INCallcenter60Gujarati (in de pijplijn) CallcentergegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakGujarati_GCGujaratiGujarati (in de pijplijn) gu_INAlgemeen gesprek100Gujarati (in de pijplijn) Algemene gespreksgegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakGujarati_MAGujaratiGujarati (in de pijplijn) gu_INMedia-audio40Gujarati (in de pijplijn) Media-audiogegevensLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakHebreeuws_Algemeen gesprek_8HebreeuwsHebreeuwshij_IL8 kHzAlgemeen gesprek399Hebreeuwse algemene conversatiegegevensUnscripted telefonisch gesprek tussen twee mensen. Ca. Audioduur (bereik) - 15-60 minuten, Hebreeuws in IsraëlDubbeldesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 414 , Man 399 , Onbekend 1
SpraakHebreeuws_MA_16HebreeuwsHebreeuwshij_IL16 kHzMedia-audio427Hebreeuwse media-audiogegevensLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenMonoWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 361 , Man 513, Onbekend 13
SpraakHindi_MA_16HindiHindihoi_IN16 kHzMedia-audio219Hindi Media-audiogegevensLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenMonoWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 83 , Man 309, Onbekend 0
SpraakHindi_SM_48HindiHindihi-IN48 kHzMonoloog met script2,867Monoloog in Hindi-schriftOpnamen met één uiting, die meestal binnen het bereik van 5 tot 30 seconden vallenMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 1977 Man 1864 Onbekend 147
SpraakHINGLISH_CC_8HinglishHinglishhg_IN8 kHzCallcenter208HINGLISH CallcentergegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,Dubbeldesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 822, Man 1262 , Onbekend 0
SpraakHINGLISH_MA_16HinglishHinglishhg_IN16 kHzMedia-audio216HINGLISH Media-audiogegevensLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenMonoWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 75, Man 380, Onbekend 0
SpraakSpaanse_CC_8Spaans EngelsSpaans Engelsnl_NL8 kHzCallcenter212Spaanse callcentergegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,Dubbeldesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 822, Man 1262, Onbekend 0
SpraakSpaanse_MA_16Spaans EngelsSpaans Engelsnl_NL16 kHzMedia-audio155Hispanic Call Media-audioLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenMonoWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 140, Man 219, Onbekend 5
SpraakIndonesisch_GC_8IndonesianIndonesianik deed8 kHzAlgemeen gesprek496Indonesische algemene gespreksgegevensUnscripted telefonisch gesprek tussen twee mensen. Ca. Audioduur (bereik) - 15-60 minuten, Bahasa IndonesischDubbeldesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 524, Man 454, Onbekend 2
SpraakIndonesisch_MA_16IndonesianIndonesianik deed16 kHzMedia-audio643Indonesische media-audiogegevensLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenMonoWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 746, Man 1507, Onbekend 129
SpraakIers_GC_8IersIersnl_IE8 kHzAlgemeen gesprek192Ierse algemene conversatiegegevensUnscripted telefonisch gesprek tussen twee mensen. Ca. Audioduur (bereik) - 15-60 minuten, Dubbeldesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 213 , Man 153 , Onbekend 0
SpraakJapanse_SM_48JapanseJapanseja-JP48 kHzMonoloog met script2,335Monoloog in Japans scriptOpnamen met één uiting, die meestal binnen het bereik van 5 tot 30 seconden vallenMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 1460 Man 1221 Onbekend 194
SpraakKannada_CC_8KannadaKannada (in pijplijn) kn_INCallcenter60Kannada (in de pijplijn) CallcentergegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakKannada_GCKannadaKannada (in pijplijn) kn_INAlgemeen gesprek100Kannada (in pijplijn) Algemene gespreksgegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakKannada_MAKannadaKannada (in pijplijn) kn_INMedia-audio40Kannada (in pijplijn) Media-audiogegevensLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakKoreaans_CC_8KoreanKoreanko_KR8 kHzCallcenter107Koreaanse callcentergegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,Dubbeldesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 1086, Man 210 , Onbekend 4
SpraakKoreaanse_MA_16KoreanKoreanko_KR16 kHzMedia-audio204Koreaanse media-audiogegevensLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenMonoWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 70 Man 303, Onbekend 25
SpraakKoreaans_SM_48KoreanKoreanko-KR48 kHzMonoloog met script1,955Monoloog in Koreaans scriptOpnamen met één uiting, die meestal binnen het bereik van 5 tot 30 seconden vallenMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 1195 Man 1134 Onbekend 122
SpraakMaleis_GC_8MalayMalayms_MY8 kHzAlgemeen gesprek266Maleis Algemene gespreksgegevensUnscripted telefonisch gesprek tussen twee mensen. Ca. Audioduur (bereik) - 15-60 minuten, Maleis in MaleisiëDubbeldesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 316, Man 176 , Onbekend 0
SpraakMaleis_MA_16MalayMalayms_MY16 kHzMedia-audio344Maleisische media-audiogegevensLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenMonoWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 236, Man 626, Onbekend 47
SpraakMalayalam_CC_8MalayalamMalayalam (in pijplijn) ml_INCallcenter60Malayalam (in pijplijn) callcentergegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakMalayalam_GCMalayalamMalayalam (in pijplijn) ml_INAlgemeen gesprek100Malayalam (in pijplijn) Algemene gespreksgegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakMalayalam_MAMalayalamMalayalam (in pijplijn) ml_INMedia-audio40Malayalam (in pijplijn) Media-audiogegevensLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakMarathi_CC_8marathiMarathi (in de pijplijn) dhr_INCallcenter60Marathi (In Pipeline) CallcentergegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakMarathi_GCmarathiMarathi (in de pijplijn) dhr_INAlgemeen gesprek100Marathi (in pijplijn) Algemene gespreksgegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakMarathi_MAmarathiMarathi (in de pijplijn) dhr_INMedia-audio40Marathi (in pijplijn) Media-audiogegevensLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakMexicaanse_SM_48Spaans (Mexico)Spaans (Mexico)es-MX48 kHzMonoloog met script1,492Monoloog in Mexicaans-Spaans scriptOpnamen met één uiting, die meestal binnen het bereik van 5 tot 30 seconden vallenMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 1016 Man 1069 Onbekend 95
SpraakNederland_SM_48NederlandsNederlandsnl-NL48 kHzMonoloog met script1,205Nederlandstalige monoloogOpnamen met één uiting, die meestal binnen het bereik van 5 tot 30 seconden vallenMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 1285 Man 531 Onbekend 3
SpraakNew York Engels_CC_8New York EngelsNew York Engelsnl_NL8 kHzCallcenter103New York Engels CallcentergegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,Dubbeldesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 610, Man 532, Onbekend 0
SpraakNew York Engels_GC_8New York EngelsNew York Engelsnl_NL8 kHzAlgemeen gesprek107New York Engels Algemene gespreksgegevensUnscripted telefonisch gesprek tussen twee mensen. Ca. Audioduur (bereik) - 15-60 minuten, Dubbeldesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 118, Man 114, Onbekend 0
SpraakNew York Engels_MA_16New York EngelsNew York Engelsnl_NL16 kHzMedia-audio140New York English Media-audiogegevensLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenMonoWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 66, Man 230, Onbekend 11
SpraakNieuw-Zeeland_GC_8Nieuw-Zeeland Engels Nieuw-Zeeland Engels nl_NZ8 kHzAlgemeen gesprek148Nieuw-Zeeland Engels Algemene gespreksgegevensUnscripted telefonisch gesprek tussen twee mensen. Ca. Audioduur (bereik) - 15-60 minuten, Dubbeldesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 167, man 121, Onbekend 4
SpraakNieuw-Zeeland_MA_16Nieuw-Zeeland Engels Nieuw-Zeeland Engels nl_NZ16 kHzMedia-audio400Nieuw-Zeelandse Engelse media-audioLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenMonoWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 367, man 678, Onbekend 26
SpraakOriya_CC_8OriyaOriya (in pijplijn) of_INCallcenter60Oriya (In Pipeline) Callcenter-gegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakOriya_GCOriyaOriya (in pijplijn) of_INAlgemeen gesprek100Oriya (in pijplijn) Algemene gespreksgegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakOriya_MAOriyaOriya (in pijplijn) of_INMedia-audio40Oriya (in pijplijn) Media-audiogegevensLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakPools_MA_16PoolsPoolspl_PL16 kHzMedia-audio269Poolse media-audioLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenMonoWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 173 Man 354 Onbekend 6
SpraakPools Poland_SM_48Pools (Polen)Pools (Polen)nl-NL48 kHzMonoloog met script1,482Pools Polen - Gescripte monoloogOpnamen met één uiting, die meestal binnen het bereik van 5 tot 30 seconden vallenMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 1324 Man 701 Onbekend 24
SpraakPunjabi_CC_8PunjabiPunjabi (in de pijplijn) PunjabiCallcenter60Punjabi (in de pijplijn) Callcenter-gegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakPunjabi_GCPunjabiPunjabi (in de pijplijn) PunjabiAlgemeen gesprek100Punjabi (in de pijplijn) Algemene gespreksgegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakPunjabi_MAPunjabiPunjabi (in de pijplijn) Punjabi Media-audio40Punjabi (in de pijplijn) Media-audiogegevensLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakRussische_SM_48RussianRussianru-RU48 kHzMonoloog met script2,398Monoloog in Russisch scriptOpnamen met één uiting, die meestal binnen het bereik van 5 tot 30 seconden vallenMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 1689 Man 1937 Onbekend 214
SpraakSchotse_GC_8Schots (Engels accent)Schots (Engels accent)nl_AB8 kHzAlgemeen gesprek292Schotse algemene gespreksgegevensUnscripted telefonisch gesprek tussen twee mensen. Ca. Audioduur (bereik) - 15-60 minuten, Dubbeldesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 285 , Man 260, Onbekend 3
SpraakSingapore_CC_8Singapore EngelsSingapore Engelsnl_SG8 kHzCallcenter218Singapore CallcentergegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,Dubbeldesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 2139 , Man 884, Onbekend 21
SpraakSingapore_MA_16Singapore EngelsSingapore Engelsnl_SG16 kHzMedia-audio247Singapore Media-audiogegevensLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenMonoWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 160, Man 455, Onbekend 37
SpraakZuid-Afrikaans Engels_CC_8Zuid-Afrikaans EngelsZuid-Afrikaans Engelsnl_ZA8 kHzCallcenter261Zuid-Afrikaans Engels CallcentergegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,Dubbeldesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 1274 , Man 935 , Onbekend 1
SpraakZuid-Afrikaans Engels_MA_16Zuid-Afrikaans EngelsZuid-Afrikaans Engelsnl_ZA16 kHzMedia-audio251Zuid-Afrikaans Engels Media-audiogegevensLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenMonoWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 235, Man 432, Onbekend 36
SpraakSwahili_CC_8swahiliswahilisw_KE8 kHzCallcenter230Swahili CallcentergegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,Dubbeldesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 611, Man 833, Onbekend 0
SpraakSwahili_MA_16swahiliswahilisw_KE16 kHzMedia-audio265Swahili Media-audiogegevensLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenMonoWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 118, Man 493, Onbekend 25
SpraakZweeds_CC_8SwedishSwedishsv_SE8 kHzCallcenter250Zweedse callcentergegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,Dubbeldesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 1581, man 727, Onbekend 2
SpraakZweedse_MA_16SwedishSwedishsv_SE16 kHzMedia-audio278Zweedse media-audiogegevensLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenMonoWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 195, man 500, Onbekend 21
SpraakTamil_CC_8tamilTamil (in de pijplijn) ta_INCallcenter60Tamil (in pijplijn) callcentergegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakTamil_GCtamilTamil (in de pijplijn) ta_INAlgemeen gesprek100Tamil (in de pijplijn) Algemene gespreksgegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakTamil_MAtamil Tamil (in de pijplijn) ta_INMedia-audio40Tamil (in pijplijn) Media-audiogegevensLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakTelugu_GC_8TeluguTelugute_IN8 kHzAlgemeen gesprek553Telugu Algemene gespreksgegevensUnscripted telefonisch gesprek tussen twee mensen. Ca. Audioduur (bereik) - 15-60 minuten, Dubbeldesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 574 , Man 564, Onbekend 0
SpraakTelugu_MA_16TeluguTelugute_IN16 kHzMedia-audio648Telugu Media-audiogegevensLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenMonoWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 207, Man 963, Onbekend 2
SpraakTelugu_CC_8TeluguTelugu (in pijplijn) te_INCallcenter30Telugu (in de pijplijn) Callcenter-gegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakTelugu_GCTeluguTelugu (in pijplijn) te_INAlgemeen gesprek50Telugu (in pijplijn) Algemene gespreksgegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,desktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakTelugu_MATeluguTelugu (in pijplijn) te_INMedia-audio20Telugu (in pijplijn) Media-audiogegevensLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
SpraakThaise_GC_8ThaiThaith_TH8 kHzAlgemeen gesprek183Thais algemeen gesprekUnscripted telefonisch gesprek tussen twee mensen. Ca. Audioduur (bereik) - 15-60 minuten, een informeel register dat wordt gebruikt tussen vriendenDubbeldesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 338, Man 96, Onbekend 8
SpraakThaise_MA_8ThaiThaith_TH16 kHzMedia-audio173Thaise media-audioLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenMonoWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 143, Man 502, Onbekend 26
SpraakTurks Turkije_SM_48Turks TurkijeTurks Turkijetr-TR48 kHzMonoloog met script2,027Turks TurkijeOpnamen met één uiting, die meestal binnen het bereik van 5 tot 30 seconden vallenMonoMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 1561 Man 1241 Onbekend 31
SpraakVietnamees_GC_8VietnameesVietnameesvi_VN8 kHzAlgemeen gesprek295Vietnamese algemene gespreksgegevensOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten, noordelijk (bijv. Hanoi), centraal en zuidelijk (bijv. Ho Chi Minh-stad).Dubbeldesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 400, man 380, Onbekenden 2
SpraakVietnamese_MA_16VietnameesVietnameesvi_VN16 kHzMedia-audio257Vietnamese media-audiogegevensLicentieplichtige audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. - 1 tot 5 personen. Ca. Audioduur (bereik) 15-60 minutenMonoWebsourcing5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 249, man 200, Onbekenden 45
SpraakWelsh_GC_8Wels (Engels accent)Wels (Engels accent)nl_WL8 kHzAlgemeen gesprek278Algemene conversatiegegevens in WalesOngescript, synthetisch telefoongesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten,Dubbeldesktop5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingVrouw 270, Man 324, Onbekend 0
SpraakVK Engels_WW_16UK EngelsUK Engelsnl_uk16 kHzWord Wekken200Wake Word Brits Engelstrefwoorden verzamelen van gegevens
  • 200 speakers
  • 4 unieke sleutelzinnen per spreker
  • 25-30 herhaalde keyphrases opnames per unieke keyphrase
  • 25-30 audiobestanden per unieke sleutelzin
  • 120 totaal opgenomen uitingen per spreker
1 kanaalMobile App5.0. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingGeslacht: 50% man, 50% vrouw, +/- 10%.

Ground Truth Audio & Speech Data om uw Conversational AI-ontwikkeling te versnellen

Met meer dan 40k uur aan audiodataset/spraakdataset, kan Shaip je helpen je gespreks-AI-modellen te schalen met hoogwaardige spraakdatasets. De gouden standaard spraakdatasets worden verzameld in meerdere talen en dialecten, demografie, sprekereigenschappen, dialoogtypes, omgevingen en scenario's. Kunt u niet vinden wat u zoekt? - Shaip kan u helpen met elke spraakgegevensset in elk geslacht, leeftijd, taal of instellingen.

Enkele van de taaldatasets die we ondersteunen: We hebben datasets over alle belangrijke talen en dialecten. Enkele van onze meest populaire talen zijn:

Afrikaanse spraakdatasets

Arabische spraakdatasets

Canadese spraakdatasets

Chinese spraakdatasets

Deense spraakdatasets

Engelse spraakdatasets

Duitse spraakdatasets

Hebreeuwse spraakdatasets

Indonesische spraakdatasets

Ierse spraakdatasets

Japanse spraakdatasets

Koreaanse spraakdatasets

Mexicaanse spraakdatasets

Poolse spraakdatasets

Russische spraakdatasets

Schotse spraakdatasets

Spaanse spraakdatasets

Zweedse spraakdatasets

Thaise spraakdatasets

Turkse spraakdatasets

Vietnamese spraakdatasets

Gegevenssetbeschrijving

Callcentergesprekken 8khz: Niet-gescript, synthetisch telefoongesprek: "agent" & "klant"

Algemene gesprekken 8khz: Telefonisch gesprek zonder script tussen 2 personen

Media & Podcasts 16khz: Audio/video-interviews in het publieke domein, podcasts, enz. 1-5 personen

Uiting/gescripte monoloog 16 kHz: Opnemen op basis van prompt 

Neem contact met ons op

Kunt u niet vinden wat u zoekt?

Er worden nieuwe kant-en-klare audio- en spraakgegevenssets verzameld voor alle gegevenstypen 

Neem nu contact met ons op om uw zorgen over het verzamelen van audio-/spraaktrainingsgegevens los te laten

  • Door te registreren ga ik akkoord met Shaip Privacy Beleid en Algemene Voorwaarden en geef mijn toestemming om B2B-marketingcommunicatie van Shaip te ontvangen.