Synthetische Zorggesprekken voor ASR

Ontwikkeling van omgevingstechnologie mogelijk maken via synthetische gesprekken in de gezondheidszorg

Omgevingstechnologie

Meer dan 2000 uur aan audiogegevens verzameld en getranscribeerd in een klinische omgeving

In het snel evoluerende domein van Conversational AI bevindt een van de opmerkelijke toepassingen zich in de gezondheidszorg, waar technologie wordt gebruikt om de interacties tussen zorgverlener en patiënt te stroomlijnen. Onze klant, een toonaangevende naam in de gezondheidszorgtechnologie, benaderde Shaip met de eis om hun Automatic Speech Recognition (ASR)-model te verbeteren om gesprekken met meerdere sprekers in klinische omgevingen beter te begrijpen en te transcriberen. Vanwege de privacyregelgeving was het een uitdaging om dialogen uit de echte wereld te verwerven; Daarom was het idee om synthetische maar toch realistische interacties tussen zorgverleners en patiënten te creëren en te transcriberen.

Volume

2,000 uur, of ongeveer 12,000 naar 24,000 individuele synthetische interacties van 10 minuten gemiddelde duur.

Objectief

Ons primaire doel was om ongeveer 2,000 uur aan audio-opnamen te genereren, wat zich vertaalt in 12,000 tot 24,000 zorgvuldig vervaardigde synthetische interacties, die een diversiteit in geslacht, leeftijd, accenten en medische rollen belichamen. Deze uitgebreide en authentieke dataset, ontworpen om klinische dialogen uit de echte wereld na te bootsen, is tot stand gekomen met strikte naleving van privacyregelgeving zoals HIPAA. De synthetische interacties dienden als een rijke dataset, die een belangrijke rol speelde bij het trainen en verfijnen van het ASR-model van onze cliënt, waardoor de vaardigheid in het omgaan met echte gesprekken binnen een klinische omgeving aanzienlijk werd verbeterd.

 

Doelstellingen

Uitdagingen

Regulatory Compliance

Het garanderen van de naleving van privacywetten zoals HIPAA en tegelijkertijd het creëren van realistische maar synthetische interacties in de gezondheidszorg kan een uitdaging zijn.

Naleving van de regelgeving

Gegevensauthenticiteit en diversiteit

Het creëren van synthetische interacties die klinische dialogen uit de echte wereld nauwkeurig nabootsen en tegelijkertijd een breed scala aan scenario's, accenten, leeftijden en medische rollen omvatten, vereist een nauwgezette aanpak en diepgaande domeinkennis.

Authenticiteit en diversiteit van gegevens

Kwaliteitsborging

Het bereiken van een hoge mate van nauwkeurigheid bij transcriptie, zoals de beoogde 95% Word Accuracy Rate (WER) en 90% Tag Accuracy Rate (TER), vereist rigoureuze kwaliteitsborgingsprocessen.

Technische mogelijkheden

Ervoor zorgen dat de technische infrastructuur, inclusief de opname- en transcriptieplatforms, de hoeveelheid gegevens aankan en de kwaliteit behoudt, is een aanzienlijke uitdaging.

Werving en training van middelen

Het kan een behoorlijke uitdaging zijn om mensen met een medische achtergrond te werven voor rollenspellen en ervoor te zorgen dat ze zich aan realistische scenario's houden terwijl ze een natuurlijke gespreksstroom behouden. Bovendien vereist het opleiden van transcriptionisten om zich aan strenge kwaliteitsrichtlijnen te houden aanzienlijke inspanningen en expertise.

Aanpak/Oplossing

Audiocollectie en transcriptie

  • Scenariocreatie: Ontwikkelde realistische scenario's die veel voorkomende niet-dringende aandoeningen weerspiegelen die voorkomen in de huisartsgeneeskundepraktijk voor volwassenen, zoals hoge bloeddruk, diabetes en pijnbestrijding.
  • Rollenspel: We rekruteerden personen met een medische achtergrond om een ​​rollenspel te spelen als zorgverleners en patiënten, waarbij ze zich aan de gegeven scenario's hielden en klinische gesprekken uit de echte wereld simuleerden.
  • opname: Gebruik gemaakt van de Shaip Work mobiele app voor het vastleggen van audio, waardoor een gevarieerde vertegenwoordiging op het gebied van geslacht, leeftijd, accenten en professionele achtergronden onder de deelnemers werd gegarandeerd.

Validatie en transcriptie

  • Validatiescripts uitgevoerd om de nauwkeurigheid en kwaliteit van de audiobestanden te garanderen.
  • Transcripties werden uitgevoerd op het Bhasha-platform, waarbij de specifieke richtlijnen werden gevolgd en een woordelijke teksttranscriptie met nauwkeurige dagboekregistratie werd gegarandeerd.
  • Geannoteerde metadata, waaronder spreker-ID, leeftijd, geslacht, moedertaal en medische training/ervaring, die van cruciaal belang waren voor de modeltrainingsdoeleinden van de klant.

Kwaliteitsborging

  • Uitgebreide kwaliteitscontroles door CQA en PMO zorgden voor een transcriptiekwaliteitsdoelstelling van 95% Word Accuracy Rate (WER) en 90% Tag Accuracy Rate (TER).

Levering van gegevens

  • Structureerde de gegevens op een duidelijke, georganiseerde manier en leverde deze in batches aan, samen met gedetailleerde batchnotities en cultuurgidsen.
  • Zorgde ervoor dat alle gegevens, inclusief audiobestanden, transcripties en metadata, nauwkeurig werden geëtiketteerd en geformatteerd volgens de specificaties van de klant.

Feedback en iteratie

Samen met de klant een robuuste feedbackloop tot stand gebracht om eventuele tekortkomingen te identificeren, ervoor te zorgen dat correcties werden aangebracht en een volledige, nauwkeurige dataset werd aangeleverd.

Belangrijkste resultaten

  • Succesvolle verzameling en transcriptie van 2000 uur aan synthetische interacties in de gezondheidszorg.
  • Snelle en nauwkeurige transcriptie met een opmerkelijke nauwkeurigheid, die aanzienlijk bijdraagt ​​aan het doel van de klant om zijn ASR-model te verbeteren.
  • Demonstreerde het vermogen van Shaip bij het afhandelen van grootschalige, complexe projecten met een nauwgezette benadering van kwaliteit en nauwkeurigheid.

Resultaat

Het zorgvuldig uitgevoerde project, gefaciliteerd door Shaip, resulteerde in een rijke dataset die aanzienlijk heeft bijgedragen aan de verbetering van het ASR-model van de klant. De synthetische interacties creëerden een realistische weergave van klinische dialogen, waardoor de cliënt een robuustere en betrouwbaardere spraakdienst voor gezondheidszorgomgevingen kon realiseren. Door een gestructureerde en goed gecoördineerde aanpak zorgde Shaip voor de succesvolle oplevering van een complex project binnen het gestelde tijdsbestek, waardoor zijn expertise in het beheren van grootschalige conversationele AI-projecten in de gezondheidszorg werd versterkt.

Onze samenwerking met Shaip heeft ons project op het gebied van Ambient Technology en Conversational AI binnen de gezondheidszorg aanzienlijk bevorderd. Hun expertise in het creëren en transcriberen van synthetische gezondheidszorgdialogen vormde een solide basis, waarmee het potentieel van synthetische data bij het overwinnen van regelgevingsuitdagingen werd aangetoond. Met Shaip hebben we deze hindernissen overwonnen en zijn we nu een stap dichter bij het realiseren van onze visie op intuïtieve gezondheidszorgoplossingen.

Gouden 5-sterren

Versnel uw gezondheidszorg-AI
applicatieontwikkeling met 100%