Spraak Emotie & Sentiment Analyse

Slimmere callcenters mogelijk maken met AI-gestuurde inzichten

Door gebruik te maken van Shaip's expertise op het gebied van het verzamelen en annoteren van audiogegevens kunnen we de realtime detectie van emoties en sentimenten verbeteren en zo de klantenservice verbeteren.

Analyse van emoties en sentimenten in spraak

Geautomatiseerde spraak-emotie- en sentimentanalyse

De klant werkte samen met Shaip om een ​​geautomatiseerd spraak-emotie- en sentimentanalysemodel te ontwikkelen voor callcenters. Het project omvatte het verzamelen en annoteren van 250 uur aan audiodata van callcenters in vier Engelse dialecten: VS, VK, Australisch en Indiaas. Hierdoor kon de klant hun AI-modellen verbeteren voor het detecteren van emoties zoals Blij, Neutraal en Boos, en sentimenten zoals Ontevreden en Tevreden in realtime klantinteracties.

Het project overwon uitdagingen zoals het detecteren van sarcasme, variërende audiolengtes en subtiele verbale signalen van ontevredenheid, en leverde nauwkeurige en schaalbare resultaten op.

Geautomatiseerde spraak-emotie- en sentimentanalyse

Key Stats

Callcenter audiogegevens verzameld en geannoteerd in 4 Engelse dialecten

250 Hrs

Aantal talen

Amerikaans Engels, Brits Engels, Australisch Engels en Indiaas Engels

Gebruikers verhalen

Geautomatiseerde spraak-emotie- en sentimentanalyse

Project bereik

Verzamel en annoteer 250 uur aan audiogegevens van callcenters in vier Engelse dialecten:

  • Amerikaans Engels (30%)
  • Brits Engels (30%)
  • Australisch Engels (20%)
  • Indiaas Engels (20%)

In reikwijdte

Het project bestaat uit drie delen:

  • Audiogegevens met specifieke entiteiten, inclusief metagegevens.
  • Corresponderende getranscribeerde bestanden met segmentatie- en tijdstempeldetails.
  • Emotie- en sentimentannotaties:
    • Audio-emotie: Blij, Neutraal, Boos
    • Transcriptie sentiment: Zeer ontevreden, ontevreden, neutraal, tevreden, zeer tevreden

Challenges

Diversiteit van dialecten

Ervoor zorgen dat de audiogegevens de gespecificeerde dialecten (VS, VK, Australisch en Indiaas) nauwkeurig weergeven, kan een uitdaging zijn. Verschillende regio's binnen deze categorieën kunnen verschillende woordenschat, accenten en uitspraken gebruiken.

Deskundigheidsvereiste

Voor het annoteren van audio en transcripties met betrekking tot emoties en sentiment zijn getrainde annotators nodig die bekend zijn met de culturele nuances en taalkundige subtiliteiten van elk dialect.

Complexiteit van emoties en gevoelens

Audio-emotie en transcriptie-sentiment komen niet altijd overeen. Bijvoorbeeld, iemand kan boos klinken maar in werkelijkheid tevredenheid uiten. Bijvoorbeeld, het behandelen van sarcasme-gesprekken in sarcastische zinnen als "Oh, geweldig, nog iemand die mijn probleem niet kan oplossen" moet correct worden geannoteerd voor emotie en sentiment.

Audio Kwaliteit

De kwaliteit van de audio-opnames kan variëren, wat de nauwkeurigheid van de transcriptie en emotiedetectie beïnvloedt. Achtergrondgeluid, overlappende gesprekken en verschillende opnameapparatuur kunnen aanzienlijke uitdagingen vormen.

Nauwkeurig vastleggen

Ontevredenheid via verbale signalen zoals diep uitademen of andere tekenen van frustratie.

Het resultaat

Met behulp van geavanceerde technieken voor natuurlijke taalverwerking (NLP) zijn de volgende oplossingen geïmplementeerd:

Gegevensverzameling

  • 250 uur aan audiogegevens, verdeeld in dialectspecifieke quota.
    • Amerikaans Engels (30% of 75 uur)
    • Brits Engels (30% of 75 uur)
    • Australisch Engels (20% of 50 uur)
    • Indiaas Engels (20% of 50 uur)
  • Gebruikers met een moedertaalaccent uit de VS, het VK, Australië en India.
  • Spraakvoorbeelden met verschillende tonen, met speciale aandacht voor gevallen waarin de stememotie Boos is en het tekstgevoel Ontevreden of Extreem Ontevreden.

Tekstclassificatie/annotatie

Tekstclassificatie

  • Annotatie van emoties en gevoelens op basis van specifieke categorieën:
    • Audio-emotie: Blij, Neutraal, Boos.
    • Transcriptie sentiment: Zeer ontevreden, ontevreden, neutraal, tevreden, zeer tevreden.
  • Elk audiofragment bevatte slechts één primaire emotie.
  • Variërende vertragingssegmenten (van 2 tot 30 seconden) toegepast binnen gesprekken.
  • Het transcriptieformaat volgde de JSON-uitvoer, inclusief informatie over de linker- en rechterspreker, sentimenttags en het sentiment van het laatste segment.

 

Kwaliteitsborging

Kwaliteitsverzekering
Nauwkeurigheid van transcriptie:

  • Zorgde ervoor dat er 250 uur aan audio werd geleverd met minimaal:
    • 90% nauwkeurigheid van de transcriptiefout (TER).
    • 95% Woordherkenningspercentage (WER) nauwkeurigheid.

QA-proces:

  • Er werden regelmatig audits uitgevoerd van willekeurig geselecteerde monsters uit de dataset.
    • Geautomatiseerde hulpmiddelen gebruikt om TER en WER in de dataset te meten.
    • Door handmatige controle van gemarkeerde secties werd gewaarborgd dat de nauwkeurigheidsdrempels werden gehaald.

De uitkomst

De trainingsgegevens ondersteunen de ontwikkeling van een geautomatiseerd model voor emotie- en sentimentdetectie, dat het volgende oplevert:

  • Realtime emotiedetectie bij interacties in callcenters.
  • Effectievere afhandeling van complexe gevallen, zoals sarcasme of ontevredenheid.
  • Schaalbaarheid voor toekomstige projecten, eenvoudig aan te passen aan grotere datavolumes en meer talen.

Deliverables

  • 250 uur aan audiobestanden (in 8 kHz PCM WAV-formaat, mono)
  • Transcriptiebestanden (met segmentatie, sentimenttags en sprekeridentificaties)
  • Metagegevens (audioduur, sprekergegevens, enz.)
Citaat icoon

De samenwerking met Shaip voor ons callcenterdata-project is een cruciaal moment geweest in de ontwikkeling van onze AI-oplossingen. Hun team heeft vakkundig 250 uur aan audiogegevens verzameld en geannoteerd in vier belangrijke Engelse dialecten - Amerikaans, Brits, Australisch en Indiaas - waardoor de hoogste kwaliteit en precisie gegarandeerd waren. De aandacht voor taalkundige nuances in deze regio's heeft de nauwkeurigheid van onze spraakherkenningsmodellen aanzienlijk verbeterd. Daarnaast is de expertise van Shaip in het beheren van complexe data-annotatieprojecten van essentieel belang geweest bij het bouwen van betrouwbare, conforme modellen op grote schaal.

★ ★ ★ ★ ★
Citaat icoon