Amerikaans-Engelse dataset

Hoogwaardige Amerikaanse Engelse dataset voor AI- en spraakmodellen

Overzicht

Titel (Taal)

Amerikaans-Engelse taaldataset

Datasettypen

Callcenter, Media (Podcast), Medisch

Land

Beschrijving

Deze dataset bevat niet-gescripte synthetische gesprekken tussen agenten en klanten (5–15 minuten), licentieerbare audio- of videobestanden in het publieke domein, zoals interviews en podcasts met 1 tot 5 deelnemers (15–60 minuten), evenals media- en medische datasettypen voor uitgebreid spraak- en taalonderzoek.

Use Case

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Gegevenssetgegevens

Gegevenssettype Sampling Rate Sprekers Kanaal Uren in totaal Totaal aantal sprekers
Call Center 8 kHz 2-Sprekers Mono 10,196:00:00 1,052
Call Center 8 kHz 2-Sprekers Dubbel 597:26:43 Op aanvraag
Mediagegevens 16 kHz Meerdere luidsprekers Mono 620:23:43 5,466
MEDISCHE 8 kHz 2-Sprekers Mono 1,480:30:33 697

Uitgelichte klanten

Teams in staat stellen om toonaangevende AI-producten te bouwen.

Neem contact met ons op

Kunt u niet vinden wat u zoekt?

Er worden nieuwe kant-en-klare datasets verzameld voor alle datatypen

Neem nu contact met ons op om uw zorgen over het verzamelen van audio-/spraaktrainingsgegevens los te laten

  • Dit veld is voor de validatie doeleinden en moet onveranderd worden gelaten.
  • Door te registreren ga ik akkoord met Shaip Privacybeleid en Algemene Voorwaarden en geef mijn toestemming om B2B-marketingcommunicatie van Shaip te ontvangen.