Engelse Deep South-gegevensset
Hoogwaardige Engelstalige Deep South Call-Center, algemene conversatie en podcastdataset voor AI- en spraakmodellen
Overzicht
Titel (Taal)
Dataset met Engelse taal uit het diepe zuiden
Datasettypen
Callcenter, Algemene gesprekken, Mediadata (Podcast)
Land
Zuidelijke Verenigde Staten
Beschrijving
Ongescripte, synthetische telefoongesprekken tussen een agent en een klant zijn beschikbaar met een duur van 5 tot 15 minuten, terwijl ongescripte telefoongesprekken tussen twee personen doorgaans 15 tot 60 minuten duren. Daarnaast zijn licentieerbare audio- of videobestanden in het publieke domein, zoals interviews of podcasts met 1 tot 5 deelnemers, ook beschikbaar binnen de periode van 15 tot 60 minuten.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Gegevenssetgegevens
| Gegevenssettype | Sampling Rate | Sprekers | Kanaal | Uren in totaal | Totaal aantal sprekers |
|---|---|---|---|---|---|
| Call Center | 8 kHz | 2-Sprekers | Dubbel | 266:44:22 | 634 |
| Algemeen gesprek | 8 kHz | 2-Sprekers | Dubbel | 197:25:07 | 1,490 |
| Mediagegevens | 16 kHz | Meerdere luidsprekers | Mono | 261:20:58 | 565 |
Uitgelichte klanten
Teams in staat stellen om toonaangevende AI-producten te bouwen.
Kunt u niet vinden wat u zoekt?
Er worden nieuwe kant-en-klare datasets verzameld voor alle datatypen
Neem nu contact met ons op om uw zorgen over het verzamelen van audio-/spraaktrainingsgegevens los te laten
Overzicht
Onderwerp
Engels Diep Zuid Taalgegevensset
Gegevenssettype
Callcenter
Beschrijving
Niet-gescript, synthetisch telefonisch gesprek tussen "agent" en "klant", Ca. Audioduur (bereik) 5-15 minuten.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Gegevenssetgegevens
Uren in totaal
151
Sample Rate
8 kHz
Audio Channel
Dubbel
Opnameplatform
Desktop
Audioformaat
. Wav
Transcriptie-indeling
.json
WER (%)
5
Gegevensset demografie
Land
Engels Diep Zuid
Taal
Engels Diep Zuid
Geslacht
Vrouw 221, Man 1004, Onbekend 7
Aantal Luidsprekers
1,232
Leeftijd
18-50
Overzicht
Onderwerp
Engels Diep Zuid Taalgegevensset
Gegevenssettype
Algemeen gesprek
Beschrijving
Telefonisch gesprek zonder script tussen twee mensen. ca. Audioduur (Bereik) – 15-60 minuten.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Gegevenssetgegevens
Uren in totaal
56
Sample Rate
8 kHz
Audio Channel
Dubbel
Opnameplatform
Desktop
Audioformaat
. Wav
Transcriptie-indeling
.json
WER (%)
5
Gegevensset demografie
Land
Engels Diep Zuid
Taal
Engels Diep Zuid
Geslacht
Vrouw 99, Man 31, Onbekend 0
Aantal Luidsprekers
130
Leeftijd
18-50
Overzicht
Onderwerp
Engels Diep Zuid Taalgegevensset
Gegevenssettype
Podcast
Beschrijving
Licentiebaar Audio-/videobestanden in het publieke domein, zoals interviews, podcasts enz. – 1 tot 5 personen. ca. Audioduur (Bereik) 15-60 minuten.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Gegevenssetgegevens
Uren in totaal
266
Sample Rate
16 kHz
Audio Channel
Mono
Opnameplatform
Websourcing
Audioformaat
. Wav
Transcriptie-indeling
.json
WER (%)
5
Gegevensset demografie
Land
Engels Diep Zuid
Taal
Engels Diep Zuid
Geslacht
Vrouw 204, Man 356, Onbekend 21
Aantal Luidsprekers
581
Leeftijd
18-50