Nu krijgen 50% KORTING* over kant-en-klare datasets voor conversatie-AI

Spraak- en audiodataset voor chatbots, stemassistenten en spraakgestuurde apparaten.

*Aanbieding voor beperkte periode

  • Door te registreren ga ik akkoord met Shaip Privacy Policy en Algemene Voorwaarden en geef mijn toestemming om B2B-marketingcommunicatie van Shaip te ontvangen.

Vertrouwd door marktleiders

DetailsKant-en-klare taaldatasetCallcentergesprekken 8khz*Algemene gesprekken 8khz*Media en podcasts 16 kHz*Uiting/gescripte monoloog 16 kHz*Totaal volume in urenDialecten gedektAudioformaatTeksttranscriptieformaatUse CasebronCTA
SpraakAfrikaansAfrikaanse audiogegevensset6009001500Afrikaans gesproken in Afrika. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakArabischArabische audiogegevensset80015002300Arabisch uit de Golfstaten. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakChineseChinese audiogegevensset20002000Chinees uit China. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakDeensDeense audiodataset40060020003000Deens uit Denemarken. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakNederlandsNederlandse audiodataset20002000Nederlands uit Nederland. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakEngels - AAVE-accentEngels - AAVE-audiogegevensset (African American Vernacular English).5005001000De variant in de volkstaal (soms bekend als AAVE, doorgaans gesproken door de overgrote meerderheid van Afro-Amerikanen uit de arbeiders- en middenklasse) en de meer standaardvariant (doorgaans gesproken door Afro-Amerikanen uit de middenklasse in formele en openbare situaties), maar met een sterkere nadruk op de volkstaal.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakEngels - Boston/New York-accentEngels - Boston/New York audiogegevensset225225350800Dit is een verzameling van verschillende regionale accenten die worden gesproken in en rond de steden Boston, New York en Philadelphia. Deze accenten klinken misschien hetzelfde als niet-lokale accenten, maar verschillen van andere Amerikaanse accenten. Ondanks een lokale woordenschat die verschilt van andere delen van de Engelssprekende wereld, zijn deze accenten onderling verstaanbaar met Engels dat elders wordt gesproken.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakEngels - Chinees accentEngels - Chinees geaccentueerde audiodataset150300450Sprekers die Chinees als hun eerste taal spreken en die als tieners/volwassenen naar de Verenigde Staten zijn verhuisd/geïmmigreerd en Engels als tweede taal hebben geleerd.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakEngels - Diep Zuid-accentEngels - Deep South Audio-gegevensset2752754501000Sprekers uit (i) Texas; (ii) Noord-Carolina, Zuid-Carolina, Georgië; (iii) New Orleans; (iv) Panhandle uit Florida; (v) Tennessee, Arkansas, Michigan.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakEngels - Spaans accentEngels - Hispanic Accent Audio Dataset400400800Spaans Engels verwijst naar de varianten van Amerikaans Engels die worden gesproken door Spaanstalige Amerikanen met een divers nationaal erfgoed. De nadruk lag vooral op Mexicaans-Amerikanen, sprekers van verschillende nationale afkomst (bijv. Mexico, Puerto Rico, Dominicaanse Republiek, Ecuador, Cuba, enz.) en ook uit verschillende regio's (bijv. Californië, New York, Florida). De inbegrepen sprekers waren die Spaans als eerste taal spreken, evenals sprekers van Spaanse afkomst die Spaans spreken en een erfgoedtaal hebben.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakEngels - Nieuw-Zeelands accentEngels - Nieuw-Zeelandse audiodataset2507501000Sprekers op beide eilanden, waaronder een mix van jongere sprekers (<40 jaar) en oudere sprekers (>40 jaar) in gelijke verhoudingen.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakEngels - Singapore-accentEngels - Singapore Audiodataset4006001000Zowel standaard Singapore Engels als informeel Singapore Engels. Singaporezen met verschillende etnische achtergronden (bijvoorbeeld Chinees, Maleis, Indiaas, enz.) en met verschillende opleidingsniveaus.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakEngels - Zuid-Afrikaans accentEngels - Zuid-Afrikaanse audiodataset4006001000Vertegenwoordigers uit verschillende sociaal-economische klassen en etnologische achtergronden (bijvoorbeeld Zuid-Afrikanen met een Europese, Afrikaanse, Indiase of gemengde achtergrond).. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakEngels - Iers accentEngels - Ierse audiodataset500500Engels gesproken in Ierland. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakEngels - Schots accentEngels - Schotse audiodataset800800Engels gesproken door Schots. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakEngels - Welsh accentEngels - Welshe audiogegevensset800800Welsh Engels. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakFrans CanadeesFrans-Canadese audiogegevensset10001000Canadees Frans. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakHebreeuwsHebreeuwse audiogegevensset7507501500Hebreeuws in Israël. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakIndonesianIndonesische audiogegevensset100010002000Bahasa Indonesisch. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakJapanseJapanse audiogegevensset20002000Japans uit Japan. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakKoreanKoreaanse audiogegevensset10020015001800Sprekers verspreidden zich door heel Zuid-Korea.. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakMalayMaleisische audiogegevensset5005001000Maleis in Maleisië. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakMexicaans SpaansMexicaans-Spaanse audiogegevensset12501250Mexicaan uit Mexico. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakPoolsPoolse audiodataset25020002250Pools uit Polen. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakRussianRussische audiogegevensset20002000Russisch uit Rusland. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakswahiliSwahili audiogegevensset3506501000Zuid-Afrikaans en Keniaans Swahili. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakZweedsZweedse audiodataset3506501000Zweeds in Zweden. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakTaiwanees ChineesTaiwanese audiogegevensset10001000Chinees uit Taiwan. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakThaiThaise audiogegevensset350450800Een informeel register dat wordt gebruikt tussen vrienden,. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakTurksTurkse audiodataset20002000Turks uit Turkije. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakVietnameesVietnamese audiogegevensset6004001000Noordelijk (bijvoorbeeld Hanoi), Centraal en Zuidelijk (bijvoorbeeld Ho Chi Minh-stad).. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakHindiHindi audiogegevensset80020002800Hindi in India, met name in de regio's Noord, Oost en West. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakHinglishIndiaas-Engelse audiogegevensset300500800Verzameld uit stedelijke Indiase steden die financiële centra van het land zijn vanwege de groeiende economische kansen. Dergelijke plaatsen kunnen Noida, Delhi, Dehradun, Chandigarh, Mumbai, Kolkata, Bangalore, Pune, Chennai, Hyderabad, enz. Zijn. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakEngelsEngelse audiogegevensset700700. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakKannadaKannada audiogegevensset6010040200Kannada uit Karnataka, India. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakMalayalamMalayalam-audiogegevensset6010040200Malayalam uit Kerala, Lakshadweep en Pondicherry. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakOriyaOriya-audiogegevensset6010040200Oriya uit delen van Odisha, West-Bengalen, Jharkhand en Chhattisgarh. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakPunjabiPunjabi audiogegevensset6010040200Punjabi uit Punjab, India. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraaktamilTamil-audiogegevensset60100240400Tamil uit Tamil Nadu, India. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakTeluguTelugu-audiogegevensset1009509502000Telugu uit Andhra Pradesh, India. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakBengaleesBengaalse audiogegevensset6010040200Bengaals uit West-Bengalen, India. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakGujaratiGujarati-audiogegevensset6010040200Gujarati uit Gujarat, India. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakmarathiMarathi-audiogegevensset6010040200Marathi uit Maharashtra, India. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip
SpraakAssameesAssamese audiogegevensset6010040200Assamees uit Asssam, India. Wav.jsonASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language ModelingShaip

Diepgaande expertise in Conversational AI

Conversational AI of Chatbots of Virtual / Digital Assistants zijn maar zo slim als de technologie en data erachter. Bij Shaip bieden we je een brede set van de gediversifieerde audiodataset voor Natural Language Processing (NLP) die gesprekken met echte mensen nabootst waarmee je je AI tot leven kunt brengen. Met onze diepgaande kennis helpen we u om AI-compatibele spraakmodellen te bouwen en te lokaliseren, met uiterste precisie met rijke en gestructureerde datasets in meerdere talen van over de hele wereld. We bieden meertalige audioverzameling, audiotranscriptie en audioannotatiediensten op basis van uw vereisten, terwijl we de gewenste intentie, uitingen en demografische distributie volledig aanpassen.

Verzameling van gescripte spraak

Spontane spraakverzameling

Transcriptie van audiogegevens

Gegevenslabels en annotaties

Met Shaip kunt u uw Conversational AI-platform nauwkeurig trainen, zodat het:

  • Naadloos praten, sms'en en chatten via meerdere kanalen.
  • Leer van bestaande interacties in de vorm van chat, spraaktranscripties, transacties, enz. en stel op basis van deze lessen voor en praat erover.
  • Begrijp de bedoeling achter menselijke spraak en verwijder dubbelzinnigheid in het begrijpen van menselijke taal.
  • Communiceer een-op-een met u en kan worden getraind om gebruikers te identificeren en eerdere gesprekken te onthouden.

Een wereldleider in Conversational AI-trainingsgegevens

Uren aan audiogegevens in meer dan 100 talen - Bron, getranscribeerd en geannoteerd

Spraakgegevenslicenties​

20k+ uur aan spraakgegevens in meer dan 40 talen en dialecten over een reeks van 55+ onderwerpen uit verschillende domeinen, zoals callcenter, debatten, algemene gesprekken, toespraken, podcasts, enz.

Spraakgegevensverzameling

Verzamel audio- en spraakgegevens (monoloog, 2-persoonsgesprek, mens-bot-chat) in meer dan 100 talen van over de hele wereld, aangepast aan uw AI-vereisten.

Transcriptie van spraakgegevens

Kosteneffectieve audiotranscriptie of audioannotatie door een sterk personeelsbestand van 30,000 medewerkers met gegarandeerde TAT, nauwkeurigheid en besparingen

Versnel de ontwikkeling van uw Conversational AI-app met Audio Collection & Audio Annotation Services

Het Shaip-voordeel

Schaal

We kunnen audiogegevens van over de hele wereld sourcen, schalen en leveren in meerdere talen en dialecten op basis van uw vereisten.

Expertise

We hebben de juiste expertise met betrekking tot nauwkeurige en onbevooroordeelde gegevensverzameling, transcriptie en annotatie volgens de gouden standaard.

Netwerk

Een netwerk van meer dan 30,000 gekwalificeerde bijdragers, aan wie snel gegevensverzamelingstaken kunnen worden toegewezen om AI-trainingsmodellen en opschalingsservices te bouwen.

Technologie

We hebben een volledig op AI gebaseerd platform met eigen tools en processen om het workflowbeheer 24 uur per dag te benutten.

Behendigheid

We passen ons zeer snel aan veranderingen in klantvereisten aan en helpen bij het versnellen van AI-ontwikkeling met hoogwaardige spraakgegevens die 5-10x sneller zijn dan de concurrentie.

Security

We hechten het grootste belang aan gegevensbeveiliging en privacy en zijn ook gecertificeerd om zeer gereguleerde gevoelige gegevens te verwerken.

Onze Specialiteiten

Trainingsdata

Krijg in een fractie van de tijd de hoogste kwaliteit gelabelde gegevens. Het is de gouden standaard, betrouwbaar en klaar om uw AI- en ML-modellen te trainen om de hoogste prestatieniveaus te bereiken.

Lees Meer

Gegevensverzameling, etikettering en annotatie

Met Shaip krijg je meer dan 15 jaar bewezen expertise in het verzamelen, transcriberen en annoteren van kwaliteitsgegevens. Met onze wereldwijde beroepsbevolking kunnen we gegevens van over de hele wereld verzamelen en vervolgens etiketterings- en annotatieservices bieden met het perfecte vaardigheidsniveau en de expertise die nodig is voor uw gegevens.

Lees Meer

Gegevenscatalogi en licenties

Met onze enorme inventaris van miljoenen datasets die u naar wens kunt verzamelen en ordenen. We kunnen die kwaliteitsgegevens vervolgens licentiëren voor uw specifieke AI- en ML-gebruiksvereisten. Bovendien zijn deze gegevens beschikbaar tegen een fractie van de kosten als u ze zelf zou maken.

Lees Meer

Zelf een dataset samenstellen?

Neem nu contact met ons op om te zien hoe we een aangepaste dataset kunnen verzamelen voor uw unieke AI-oplossing.