Punjabi-gegevensset

Ik denk dat het goed is

Hoogwaardige Punjabi callcenter-, algemene conversatie- en mediadataset (podcast) voor AI- en spraakmodellen

Overzicht

Titel (Taal)

Punjabi-taaldataset

Datasettypen

Callcenter, algemene gesprekken, media (podcast) gegevens

Land

India

Beschrijving

Ongescripte, synthetische telefoongesprekken tussen een agent en een klant zijn beschikbaar met een geschatte duur van 5 tot 15 minuten. Daarnaast zijn licentieerbare audio- of videobestanden in het publieke domein, zoals interviews, podcasts en soortgelijke content met 1 tot 5 deelnemers, beschikbaar met een geschatte duur van 15 tot 60 minuten.

Use Case

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Gegevenssetgegevens

Gegevenssettype Sampling Rate Sprekers Kanaal Uren in totaal Totaal aantal sprekers
Call Center 48 kHz 2-Sprekers Dubbel 66:04:45 788
Algemeen gesprek 8 kHz 2-Sprekers Dubbel 64:31:42 310
Mediagegevens 16 kHz Meerdere luidsprekers Mono 11:27:33 44

Uitgelichte klanten

Teams in staat stellen om toonaangevende AI-producten te bouwen.

Amazon
Google
Microsoft
Neem contact met ons op

Kunt u niet vinden wat u zoekt?

Er worden nieuwe kant-en-klare datasets verzameld voor alle datatypen

Neem nu contact met ons op om uw zorgen over het verzamelen van audio-/spraaktrainingsgegevens los te laten

  • Dit veld is voor de validatie doeleinden en moet onveranderd worden gelaten.
  • Door te registreren ga ik akkoord met Shaip Privacybeleid en Algemene Voorwaarden en geef mijn toestemming om B2B-marketingcommunicatie van Shaip te ontvangen.