Urdu-gegevensset

Hoogwaardige Urdu callcenter- en algemene conversatiedataset voor AI- en spraakmodellen

Overzicht

Titel (Taal)

Urdu-taalgegevensset

Datasettypen

Callcenter, algemeen gesprek

Land

Pakistan

Beschrijving

Deze dataset bevat niet-gescripte synthetische telefoongesprekken tussen agenten en klanten (5–15 minuten) en natuurlijke telefoongesprekken tussen mensen in het Urdu (15–60 minuten) met transcripties. Hiermee worden uiteenlopende spraakgegevens verkregen voor het trainen en evalueren van spraak- en taaltechnologieën.

Use Case

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Gegevenssetgegevens

Gegevenssettype Sampling Rate Sprekers Kanaal Uren in totaal Totaal aantal sprekers
Call Center 8 kHz 2-Sprekers Dubbel 85:37:24 484
Algemeen gesprek 44 kHz 2-Sprekers Dubbel 39:44:03 336

Uitgelichte klanten

Teams in staat stellen om toonaangevende AI-producten te bouwen.

Amazon
Google
Microsoft
Neem contact met ons op

Kunt u niet vinden wat u zoekt?

Er worden nieuwe kant-en-klare datasets verzameld voor alle datatypen

Neem nu contact met ons op om uw zorgen over het verzamelen van audio-/spraaktrainingsgegevens los te laten

  • Dit veld is voor de validatie doeleinden en moet onveranderd worden gelaten.
  • Door te registreren ga ik akkoord met Shaip Privacybeleid en Algemene Voorwaarden en geef mijn toestemming om B2B-marketingcommunicatie van Shaip te ontvangen.