Deense dataset

Dansk Datasæt

Hoogwaardige Deense algemene conversatie-, TTS- en podcastdataset voor AI- en spraakmodellen

Overzicht

Titel (Taal)

Deense taalgegevensset

Datasettypen

Callcenter, algemeen gesprek, mediagegevens (podcastgegevens), gescripte monoloog

Land

Denemarken

Beschrijving

Ongescripte telefoongesprekken tussen twee personen zijn beschikbaar met een geschatte duur van 15 tot 60 minuten. Licentieerbare audio- of videobestanden in het publieke domein, zoals interviews of podcasts met 1 tot 5 deelnemers, variëren eveneens van 15 tot 60 minuten. Daarnaast duren opnamen van één enkele Deense tekst uit Denemarken doorgaans 5 tot 30 seconden.

Use Case

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Gegevenssetgegevens

Gegevenssettype Sampling Rate Sprekers Kanaal Uren in totaal Totaal aantal sprekers
Call Center 8 kHz 2-Sprekers Mono 2,000:00:00 Op aanvraag
Algemeen gesprek 8 kHz 2-Sprekers Dubbel 356:29:47 700
Mediagegevens 16 kHz Meerdere luidsprekers Mono 665:16:30 1,261
Monoloog met script 48 kHz Enkele luidspreker Mono 2,496:00:00 2,825

Uitgelichte klanten

Teams in staat stellen om toonaangevende AI-producten te bouwen.

Neem contact met ons op

Kunt u niet vinden wat u zoekt?

Er worden nieuwe kant-en-klare datasets verzameld voor alle datatypen

Neem nu contact met ons op om uw zorgen over het verzamelen van audio-/spraaktrainingsgegevens los te laten

  • Dit veld is voor de validatie doeleinden en moet onveranderd worden gelaten.
  • Door te registreren ga ik akkoord met Shaip Privacybeleid en Algemene Voorwaarden en geef mijn toestemming om B2B-marketingcommunicatie van Shaip te ontvangen.