Tamil-gegevensset

தமிழ் van het programma

Benut de kracht van Tamil-spraakdatasets voor ASR, TTS en conversationele AI. Shaip biedt premium Tamil-audiodatasets om slimmere taalmodellen te trainen.

Overzicht

Titel (Taal)

Dataset Tamil-taal

Datasettypen

Callcenter, algemeen gesprek, mediagegevens, gescripte monoloog

Land

India

Beschrijving

Deze dataset bevat niet-gescripte synthetische gesprekken tussen agenten en klanten (5-15 minuten), natuurlijke telefoongesprekken tussen mensen (15-60 minuten) en mediadata met transcripties. Daarmee worden uiteenlopende spraakgegevens geboden voor het trainen en evalueren van spraak- en taaltechnologieën.

Use Case

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Gegevenssetgegevens

Gegevenssettype Sampling Rate Sprekers Kanaal Uren in totaal Totaal aantal sprekers
Call Center 8 kHz 2-Sprekers Dubbel 124:23:52 484
Call Center 16 kHz 2-Sprekers Mono 199:44:21 1,986
Algemeen gesprek 8 kHz 2-Sprekers Dubbel 101:42:05 440
Algemeen gesprek 48 kHz 2-Sprekers Mono 80:21:16 141
Mediagegevens 16 kHz Meerdere luidsprekers Mono 43:07:01 32
Monoloog met script 24 kHz Enkele luidspreker Mono 500:00:00 Op aanvraag

Uitgelichte klanten

Teams in staat stellen om toonaangevende AI-producten te bouwen.

Amazon
Google
Microsoft
Neem contact met ons op

Kunt u niet vinden wat u zoekt?

Er worden nieuwe kant-en-klare datasets verzameld voor alle datatypen

Neem nu contact met ons op om uw zorgen over het verzamelen van audio-/spraaktrainingsgegevens los te laten

  • Dit veld is voor de validatie doeleinden en moet onveranderd worden gelaten.
  • Door te registreren ga ik akkoord met Shaip Privacybeleid en Algemene Voorwaarden en geef mijn toestemming om B2B-marketingcommunicatie van Shaip te ontvangen.