Hebreeuwse dataset
ערכת נתונים עברית
Hoogwaardige Hebreeuwse algemene conversatie- en podcastdataset voor AI- en spraakmodellen
Overzicht
Titel (Taal)
Hebreeuwse taaldataset
Datasettypen
Algemeen gesprek, mediagegevens
Land
Israël
Beschrijving
Niet-gescripte telefoongesprekken tussen twee mensen in het Hebreeuws uit Israël zijn beschikbaar met een duur van 15 tot 60 minuten, evenals licentieerbare audio- of videobestanden in het publieke domein, zoals interviews en podcasts met 1 tot 5 deelnemers, die ook variëren van 15 tot 60 minuten.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Gegevenssetgegevens
| Gegevenssettype | Sampling Rate | Sprekers | Kanaal | Uren in totaal | Totaal aantal sprekers |
|---|---|---|---|---|---|
| Algemeen gesprek | 8 kHz | 2-Sprekers | Dubbel | 398:47:10 | 814 |
| Mediagegevens | 16 kHz | Meerdere luidsprekers | Mono | 426:14:16 | 885 |
Uitgelichte klanten
Teams in staat stellen om toonaangevende AI-producten te bouwen.
Kunt u niet vinden wat u zoekt?
Er worden nieuwe kant-en-klare datasets verzameld voor alle datatypen
Neem nu contact met ons op om uw zorgen over het verzamelen van audio-/spraaktrainingsgegevens los te laten
Overzicht
Onderwerp
Hebreeuws Taalgegevensset
Gegevenssettype
Algemeen gesprek
Beschrijving
Telefonisch gesprek zonder script tussen twee mensen. ca. Audioduur (Bereik) – 15-60 minuten, Hebreeuws in Israël.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Gegevenssetgegevens
Uren in totaal
399
Sample Rate
8 kHz
Audio Channel
Dubbel
Opnameplatform
Desktop
Audioformaat
. Wav
Transcriptie-indeling
.json
WER (%)
5
Gegevensset demografie
Land
Israël
Taal
Hebreeuws
Geslacht
Vrouw 414, Man 399, Onbekend 1
Aantal Luidsprekers
814
Leeftijd
18-50
Overzicht
Onderwerp
Hebreeuws Taalgegevensset
Gegevenssettype
Podcast
Beschrijving
Licentiebaar Audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. – 1 tot 5 personen. ca. Audioduur (Bereik) 15-60 minuten.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Gegevenssetgegevens
Uren in totaal
427
Sample Rate
16 kHz
Audio Channel
Mono
Opnameplatform
Websourcing
Audioformaat
. Wav
Transcriptie-indeling
.json
WER (%)
5
Gegevensset demografie
Land
Israël
Taal
Hebreeuws
Geslacht
Vrouw 361, Man 513, Onbekend 13
Aantal Luidsprekers
887
Leeftijd
18-50