Boston Engelse dataset
Hoogwaardige Boston English Call-Center, algemene conversatie- en podcastdataset voor AI- en spraakmodellen
Overzicht
Titel (Taal)
Boston Engelse taaldataset
Datasettypen
Callcenter, algemene gesprekken, mediagegevens (podcastgegevens)
Land
Beschrijving
Ongescripte, synthetische telefoongesprekken tussen een agent en een klant zijn beschikbaar met een geschatte duur van 5 tot 15 minuten. Daarnaast zijn licentieerbare audio- of videobestanden in het publieke domein, zoals interviews, podcasts en soortgelijke content met 1 tot 5 deelnemers, beschikbaar met een geschatte duur van 15 tot 60 minuten.
Use Case
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modeling
Gegevenssetgegevens
| Gegevenssettype | Sampling Rate | Sprekers | Kanaal | Uren in totaal | Totaal aantal sprekers |
|---|---|---|---|---|---|
| Call Center | 8 kHz | 2-Sprekers | Dubbel | 22:16:10 | 228 |
| Algemeen gesprek | 8 kHz | 2-Sprekers | Dubbel | 162:51:50 | 994 |
| Mediagegevens | 16 kHz | Meerdere sprekers | Mono | 85:51:52 | 206 |
Uitgelichte klanten
Teams in staat stellen om toonaangevende AI-producten te bouwen.
Kunt u niet vinden wat u zoekt?
Er worden nieuwe kant-en-klare datasets verzameld voor alle datatypen
Neem nu contact met ons op om uw zorgen over het verzamelen van audio-/spraaktrainingsgegevens los te laten