Spraak Emotie & Sentiment Analyse
Slimmere callcenters mogelijk maken met AI-gestuurde inzichten
Door gebruik te maken van Shaip's expertise op het gebied van het verzamelen en annoteren van audiogegevens kunnen we de realtime detectie van emoties en sentimenten verbeteren en zo de klantenservice verbeteren.
Geautomatiseerde spraak-emotie- en sentimentanalyse
De klant werkte samen met Shaip om een geautomatiseerd spraak-emotie- en sentimentanalysemodel te ontwikkelen voor callcenters. Het project omvatte het verzamelen en annoteren van 250 uur aan audiodata van callcenters in vier Engelse dialecten: VS, VK, Australisch en Indiaas. Hierdoor kon de klant hun AI-modellen verbeteren voor het detecteren van emoties zoals Blij, Neutraal en Boos, en sentimenten zoals Ontevreden en Tevreden in realtime klantinteracties.
Het project overwon uitdagingen zoals het detecteren van sarcasme, variërende audiolengtes en subtiele verbale signalen van ontevredenheid, en leverde nauwkeurige en schaalbare resultaten op.
Key Stats
Callcenter audiogegevens verzameld en geannoteerd in 4 Engelse dialecten
250 Hrs
Aantal talen
Amerikaans Engels, Brits Engels, Australisch Engels en Indiaas Engels
Gebruikers verhalen
Geautomatiseerde spraak-emotie- en sentimentanalyse
Project bereik
Verzamel en annoteer 250 uur aan audiogegevens van callcenters in vier Engelse dialecten:
- Amerikaans Engels (30%)
- Brits Engels (30%)
- Australisch Engels (20%)
- Indiaas Engels (20%)
In reikwijdte
Het project bestaat uit drie delen:
- Audiogegevens met specifieke entiteiten, inclusief metagegevens.
- Corresponderende getranscribeerde bestanden met segmentatie- en tijdstempeldetails.
- Emotie- en sentimentannotaties:
- Audio-emotie: Blij, Neutraal, Boos
- Transcriptie sentiment: Zeer ontevreden, ontevreden, neutraal, tevreden, zeer tevreden
Challenges
Diversiteit van dialecten
Ervoor zorgen dat de audiogegevens de gespecificeerde dialecten (VS, VK, Australisch en Indiaas) nauwkeurig weergeven, kan een uitdaging zijn. Verschillende regio's binnen deze categorieën kunnen verschillende woordenschat, accenten en uitspraken gebruiken.
Deskundigheidsvereiste
Voor het annoteren van audio en transcripties met betrekking tot emoties en sentiment zijn getrainde annotators nodig die bekend zijn met de culturele nuances en taalkundige subtiliteiten van elk dialect.
Complexiteit van emoties en gevoelens
Audio-emotie en transcriptie-sentiment komen niet altijd overeen. Bijvoorbeeld, iemand kan boos klinken maar in werkelijkheid tevredenheid uiten. Bijvoorbeeld, het behandelen van sarcasme-gesprekken in sarcastische zinnen als "Oh, geweldig, nog iemand die mijn probleem niet kan oplossen" moet correct worden geannoteerd voor emotie en sentiment.
Audio Kwaliteit
De kwaliteit van de audio-opnames kan variëren, wat de nauwkeurigheid van de transcriptie en emotiedetectie beïnvloedt. Achtergrondgeluid, overlappende gesprekken en verschillende opnameapparatuur kunnen aanzienlijke uitdagingen vormen.
Nauwkeurig vastleggen
Ontevredenheid via verbale signalen zoals diep uitademen of andere tekenen van frustratie.
Het resultaat
Met behulp van geavanceerde technieken voor natuurlijke taalverwerking (NLP) zijn de volgende oplossingen geïmplementeerd:
Gegevensverzameling
- 250 uur aan audiogegevens, verdeeld in dialectspecifieke quota.
- Amerikaans Engels (30% of 75 uur)
- Brits Engels (30% of 75 uur)
- Australisch Engels (20% of 50 uur)
- Indiaas Engels (20% of 50 uur)
- Gebruikers met een moedertaalaccent uit de VS, het VK, Australië en India.
- Spraakvoorbeelden met verschillende tonen, met speciale aandacht voor gevallen waarin de stememotie Boos is en het tekstgevoel Ontevreden of Extreem Ontevreden.
Tekstclassificatie/annotatie

- Annotatie van emoties en gevoelens op basis van specifieke categorieën:
- Audio-emotie: Blij, Neutraal, Boos.
- Transcriptie sentiment: Zeer ontevreden, ontevreden, neutraal, tevreden, zeer tevreden.
- Elk audiofragment bevatte slechts één primaire emotie.
- Variërende vertragingssegmenten (van 2 tot 30 seconden) toegepast binnen gesprekken.
- Het transcriptieformaat volgde de JSON-uitvoer, inclusief informatie over de linker- en rechterspreker, sentimenttags en het sentiment van het laatste segment.
Kwaliteitsborging

Nauwkeurigheid van transcriptie:
- Zorgde ervoor dat er 250 uur aan audio werd geleverd met minimaal:
- 90% nauwkeurigheid van de transcriptiefout (TER).
- 95% Woordherkenningspercentage (WER) nauwkeurigheid.
QA-proces:
- Er werden regelmatig audits uitgevoerd van willekeurig geselecteerde monsters uit de dataset.
- Geautomatiseerde hulpmiddelen gebruikt om TER en WER in de dataset te meten.
- Door handmatige controle van gemarkeerde secties werd gewaarborgd dat de nauwkeurigheidsdrempels werden gehaald.
De uitkomst
De trainingsgegevens ondersteunen de ontwikkeling van een geautomatiseerd model voor emotie- en sentimentdetectie, dat het volgende oplevert:
- Realtime emotiedetectie bij interacties in callcenters.
- Effectievere afhandeling van complexe gevallen, zoals sarcasme of ontevredenheid.
- Schaalbaarheid voor toekomstige projecten, eenvoudig aan te passen aan grotere datavolumes en meer talen.
Deliverables
- 250 uur aan audiobestanden (in 8 kHz PCM WAV-formaat, mono)
- Transcriptiebestanden (met segmentatie, sentimenttags en sprekeridentificaties)
- Metagegevens (audioduur, sprekergegevens, enz.)
De samenwerking met Shaip voor ons callcenterdata-project is een cruciaal moment geweest in de ontwikkeling van onze AI-oplossingen. Hun team heeft vakkundig 250 uur aan audiogegevens verzameld en geannoteerd in vier belangrijke Engelse dialecten - Amerikaans, Brits, Australisch en Indiaas - waardoor de hoogste kwaliteit en precisie gegarandeerd waren. De aandacht voor taalkundige nuances in deze regio's heeft de nauwkeurigheid van onze spraakherkenningsmodellen aanzienlijk verbeterd. Daarnaast is de expertise van Shaip in het beheren van complexe data-annotatieprojecten van essentieel belang geweest bij het bouwen van betrouwbare, conforme modellen op grote schaal.