Poolse dataset

Poolse dataset

Hoogwaardige Poolse mediadata en gescripte monologen voor AI- en spraakmodellen

Overzicht

Titel (Taal)

Poolse taaldataset

Datasettypen

Media (Podcast), Gescripte monoloog

Land

Polen

Beschrijving

Deze dataset bevat licentieerbare audio- of videobestanden in het publieke domein, zoals interviews en podcasts met 1 tot 5 deelnemers (15-60 minuten), samen met gescripte monologen waarin één spreker vooraf gedefinieerde inhoud levert voor het trainen en evalueren van spraak- en taalmodellen.

Use Case

ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling

Gegevenssetgegevens

Gegevenssettype Sampling Rate Sprekers Kanaal Uren in totaal Totaal aantal sprekers
Mediagegevens 16 kHz Multipal-luidsprekers Mono 268:56:51 532
Monoloog met script 48 kHz Enkele luidspreker Mono 2,348:00:00 2,699

Uitgelichte klanten

Teams in staat stellen om toonaangevende AI-producten te bouwen.

Amazon
Google
Microsoft
Neem contact met ons op

Kunt u niet vinden wat u zoekt?

Er worden nieuwe kant-en-klare datasets verzameld voor alle datatypen

Neem nu contact met ons op om uw zorgen over het verzamelen van audio-/spraaktrainingsgegevens los te laten

  • Dit veld is voor de validatie doeleinden en moet onveranderd worden gelaten.
  • Door te registreren ga ik akkoord met Shaip Privacybeleid en Algemene Voorwaarden en geef mijn toestemming om B2B-marketingcommunicatie van Shaip te ontvangen.