Poolse dataset
Poolse dataset
Hoogwaardige Poolse mediadata en gescripte monologen voor AI- en spraakmodellen
Overzicht
Titel (Taal)
Poolse taaldataset
Datasettypen
Media (Podcast), Gescripte monoloog
Land
Polen
Beschrijving
Deze dataset bevat licentieerbare audio- of videobestanden in het publieke domein, zoals interviews en podcasts met 1 tot 5 deelnemers (15-60 minuten), samen met gescripte monologen waarin één spreker vooraf gedefinieerde inhoud levert voor het trainen en evalueren van spraak- en taalmodellen.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Gegevenssetgegevens
| Gegevenssettype | Sampling Rate | Sprekers | Kanaal | Uren in totaal | Totaal aantal sprekers |
|---|---|---|---|---|---|
| Mediagegevens | 16 kHz | Multipal-luidsprekers | Mono | 268:56:51 | 532 |
| Monoloog met script | 48 kHz | Enkele luidspreker | Mono | 2,348:00:00 | 2,699 |
Uitgelichte klanten
Teams in staat stellen om toonaangevende AI-producten te bouwen.
Kunt u niet vinden wat u zoekt?
Er worden nieuwe kant-en-klare datasets verzameld voor alle datatypen
Neem nu contact met ons op om uw zorgen over het verzamelen van audio-/spraaktrainingsgegevens los te laten