Chinese dataset

Er zijn geen producten gevonden die aan je zoekcriteria voldoen

Hoogwaardige Chinese dataset voor AI- en spraakmodellen

Overzicht

Titel (Taal)

Dataset Chinese taal

Datasettypen

Callcenter, muziek, gescripte monoloog, mediagegevens (podcastgegevens)

Land

China

Beschrijving

Deze dataset bevat niet-gescripte synthetische telefoongesprekken tussen agenten en klanten (5-15 minuten), natuurlijke telefoongesprekken tussen mensen (15-60 minuten) en gezongen audio met transcripties. Daarmee worden uiteenlopende spraakgegevens verstrekt voor het trainen en evalueren van spraak- en taaltechnologieën.

Use Case

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Gegevenssetgegevens

Taal Gegevenssettype Sampling Rate Sprekers Kanaal Uren in totaal Totaal aantal sprekers
Chinees gezang Muziek 48 kHz Enkele luidspreker Mono 06:11:32 10
Chinese traditionele) Monoloog met script 48 kHz Enkele luidspreker Mono 1,499:00:00 1,805
Chinees geaccentueerd Engels Mediagegevens 16 kHz Meerdere luidsprekers Mono 306:04:58 2,130
Vereenvoudigd Chinees Monoloog met script 48 kHz Enkele luidspreker Mono 2,761:00:00 3,725
Chinees Amerikaans geaccentueerd Engels Call Center 8 kHz 2-Sprekers Dubbel 152:18:33 2,058
Chinees Amerikaans geaccentueerd Engels Mediagegevens 16 kHz Meerdere luidsprekers Mono 245:55:15 468

Uitgelichte klanten

Teams in staat stellen om toonaangevende AI-producten te bouwen.

Neem contact met ons op

Kunt u niet vinden wat u zoekt?

Er worden nieuwe kant-en-klare datasets verzameld voor alle datatypen

Neem nu contact met ons op om uw zorgen over het verzamelen van audio-/spraaktrainingsgegevens los te laten

  • Dit veld is voor de validatie doeleinden en moet onveranderd worden gelaten.
  • Door te registreren ga ik akkoord met Shaip Privacybeleid en Algemene Voorwaarden en geef mijn toestemming om B2B-marketingcommunicatie van Shaip te ontvangen.