Casestudy: Conversationele AI

Precisie van oncologische gegevens: licentieverlening, de-identificatie en annotatie voor NLP-modelinnovatie

Een revolutie in kankerzorg met geavanceerde NLP-technologieën.

Oncologie NLP-ontwikkeling

project Overzicht

De klant, een grote speler in de gezondheidszorg, had een geavanceerde NLP-oplossing nodig om een ​​aanzienlijk volume aan medische oncologische dossiers te verwerken. Als onderdeel van een cruciaal initiatief om oncologisch onderzoek te verfijnen, is de noodzaak om gedetailleerde data-analyse in evenwicht te brengen met strenge privacynormen van het grootste belang. Deze casestudy schetst onze bijdragen aan het verbeteren van de onderzoeksinspanningen van de klant door middel van high-fidelity data-annotatie, rigoureuze de-identificatiepraktijken en de toepassing van Natural Language Processing (NLP)-technieken, allemaal binnen het regelgevingskader van HIPAA.

Oncologie NLP-ontwikkeling

Key Stats

Gegevenslicenties
+ Gegevens De-id

10,000 pagina's

Niet-oncologie
Domein

10,000 pagina's

Oncologie
Domein

10,000 pagina's

Oncologie
Relaties

4500 pagina's

Ontkenning

9000 pagina's

NER + Relatie
Mapping

1223 pagina's

Challenges

Het project vereiste een genuanceerd begrip van klinische documentatie, nauwkeurige identificatie van medische entiteiten en de mogelijkheid om negatielabels nauwkeurig toe te passen, allemaal binnen een veilig raamwerk dat de privacy van patiënten beschermt volgens de HIPAA-regelgeving. Het streven vereiste niet alleen technische expertise bij het omgaan met grote hoeveelheden complexe gegevens, maar ook een strategische aanpak om feedback op te nemen en de kwaliteit in alle fasen van het annotatieproces te behouden.

Gedetailleerde beschrijving van diensten:

  • Uitgebreide klinische gegevensdekking: De dataset beslaat verschillende soorten notities, zorgomgevingen en oncologische subspecialismen, wat zorgt voor een robuuste dataset die een afspiegeling is van uiteenlopende klinische scenario's.
  • Strikte de-identificatie: Ervoor zorgen dat alle gelabelde records worden geanonimiseerd in overeenstemming met de Safe Harbor-methode van HIPAA, waardoor het vertrouwen van de klant in de privacy en beveiliging van gegevens wordt verzekerd.
  • Richtlijnen voor annotaties: Creatie en implementatie van standaardrichtlijnen voor gegevensannotatie voor het voorbereiden van gelabelde records in overeenstemming met HIPAA-normen.
  • Geavanceerde annotatietechnieken: Toepassing van NLP op 10,000 pagina's aan oncologiegerelateerde dossiers, waarbij de negatiestatussen en andere relevante details nauwkeurig worden gelabeld volgens vooraf vastgestelde richtlijnen.
  • Strenge kwaliteitsborging: Voldoen aan de in de richtlijn vastgelegde kwaliteitsnorm.

Het resultaat

Onze aanpak omvatte de volgende sleutelstrategieën:

Uitgebreide dekking van klinische gegevens

Om de dataset aan te passen aan de specifieke behoeften van de klant, werd een gerichte selectie van gegevens nauwkeurig geëxtraheerd uit Shaip's uitgebreide repository van meer dan 5 miljoen elektronische gezondheidsdossiers. Deze samengestelde dataset omvatte een verscheidenheid aan notitietypen en zorginstellingen, wat een rijke en diverse
spectrum van klinische scenario's. Dit zorgt voor een dataset die niet alleen uitgebreid is, maar ook zeer representatief voor medische gegevens uit de echte wereld.

Rigoureuze de-identificatie

Het proces volgde strikt de Safe Harbor-methode van HIPAA voor de-identificatie, die het vertrouwen van de klant in gegevensprivacy en -beveiliging garandeert. Dit houdt in dat alle beschermde gezondheidsinformatie (PHI) wordt verwijderd en vervangen door gelabelde tijdelijke aanduidingen, waardoor de bruikbaarheid van de gegevens behouden blijft en de vertrouwelijkheid van de patiënt wordt beschermd.

De-identificatievariabelen

Categoriesubcategorie
NaamNaam patiënt, naam arts, naam verpleeghuisarts, naam familielid, naam medisch centrum, naam kliniek, naam verpleeghuis, bedrijfsnaam, naam universiteit
Leeftijd 
DatumDatumpatroon, maand-jaarpatroon, dag-maandpatroon, dag-jaarpatroon, dag, maand, jaar, seizoen
LokatieLand, Staat, Stad, Straat, Postcode, Kamernummer, Suitenummer, Verdiepingnummer
IDBurgerservicenummer, medisch dossiernummer, begunstigdennummer van het zorgplan, rekeningnummer, certificaat-/licentienummer, biometrische identificatie, registratie-ID, toegangsnummer, voertuigidentificatienummer, kentekennummer, apparaatidentificatiegegevens en serienummer
ContactTelefoonnummer, faxnummer, e-mailadres, web-URL, IP-adres

Voorbeeld:

Op 25 september 2106, om 11 uur, werd de heer Harry Pace, 00 jaar oud, opgenomen in het Forrest General Hospital voor een geplande heupoperatie, eerder geraadpleegd door zijn huisarts Dr. Jose Martin, en bijgewoond door Kendra Reith, MD. Tijdens zijn verblijf stond hij onder de hoede van Mary Hu, NP, en Suzan Ray, RN, waarbij ook R. Charles Melancon, PA, werd geraadpleegd. Zijn operatie, uitgevoerd op dezelfde dag als opname, was succesvol en er werden geen complicaties gemeld. Na de operatie werd dhr. Pace voor herstel overgebracht naar kamer 90, verdieping 202. Zijn vrouw, Emma Pace, was de hele tijd aanwezig en werd voorzien van alle nodige updates. Tijdens zijn korte verblijf werden zijn medische dossiers, waaronder MRN MR2 en rekening KV99062619, behandeld volgens de standaardprotocollen van Gracewood Nursing Home, zijn vorige woonplaats. Hij werd later diezelfde dag ontslagen naar de polikliniek van Oakland voor verder herstel. Gedurende het hele proces werden alle procedures gedocumenteerd en beveiligd met inachtneming van de vertrouwelijkheidsnormen.

Voorbeeld: geanonimiseerd

On [Datumpatroon], om 11 uur, dhr. [Patient naam], oud [Leeftijd], werd toegelaten [Naam medisch centrum] voor een geplande heupoperatie, eerder geraadpleegd door zijn huisarts Dr. [Naam arts], en bijgewoond door [Naam arts] MD. Tijdens zijn verblijf stond hij onder toezicht [Verpleegkundig Specialist], NP, en [Verpleegkundig Specialist], RN, met [Naam arts], PA, ook geraadpleegd. Zijn operatie, uitgevoerd op dezelfde dag als zijn opname, was succesvol en er werden geen complicaties gemeld. Na de operatie, dhr. [Patient naam] werd overgebracht naar kamernr. [Kamernummer], Verdieping nr. [Verdiepingnummer], voor herstel. Zijn vrouw, [Naam van familielid], was de hele tijd aanwezig en werd voorzien van alle nodige updates. Tijdens zijn korte verblijf werden zijn medische dossiers, inclusief MRN [Medisch dossiernummer] en Rekening [Rekeningnummer]werden behandeld volgens de standaardprotocollen van [Naam verpleeghuis], zijn vorige verblijfplaats. Hij werd later diezelfde dag ontslagen en aan de zorg van [Klinieknaam] voor verder herstel. Gedurende het hele proces werden alle procedures gedocumenteerd en beveiligd met inachtneming van de vertrouwelijkheidsnormen.

Annotatierichtlijnen en geavanceerde annotatietechnieken

Shaip was instrumenteel in het vaststellen en implementeren van standaard richtlijnen voor data-annotatie, zorgde ervoor dat alle gelabelde records consistent en in overeenstemming met HIPAA-normen werden voorbereid. Bovendien werden 10,000 pagina's uit verschillende medische dossiers nauwkeurig geannoteerd, met
een focus op de gedetailleerde etikettering van negatiestatussen en andere klinisch relevante entiteiten, waaronder verschillende subspecialismen van oncologie. De annotatie werd uitgevoerd door een team van deskundige annotators met gespecialiseerde kennis van oncologie en regelgeving inzake gegevensprivacy.

Complexe annotatie

Categoriesubcategorie
Datum
aantekening
(Oncologie)
Diagnosedatum, stadiumdatum, begin, proceduredatum, startdatum van de medicatie, beëindiging van de medicatie,
Datum van start van de straling, datum van einde van de straling
Ziekte
(Oncologie)
Kankerprobleem, histologie, klinische status, lichaamslocatie, gedrag, graad, kankerstadium, TNM-stadium, tumormarkertest, afmetingen, code
Behandeling
(Oncologie)
Kankergeneeskunde, Dosering van medicijnen, Frequentie, Kankerchirurgie, Resultaat van de operatie, Stralingsmodaliteit, Stralingsdosering
GenomicsVariatiecode, genstudie, methode, monster
OntkenningNegatief, mogelijk negatief, onzeker, mogelijk positief
Klinische NER
Relaties
Kankerprobleem – Lichaamsplaats, Histologie – Lichaamsplaats, Gedrag – Lichaamsplaats, Kankerchirurgie – Lichaamsplaats, Stralingsmodaliteit – Lichaamsplaats, Histologie – Graad, Kankerprobleem – Dimensie

Voorbeeld:

Klinische notaverklaring oncologie

Klinische notaverklaring oncologie

“Patiënt Jane Doe kreeg op 03/05/2023 de diagnose stadium IIIB niet-kleincellige longkanker (NSCLC), met name adenocarcinoom. De kanker bevindt zich in de rechter onderkwab van de long. Het is geclassificeerd als T3N2M0 volgens het TNM-stadiëringssysteem, met een tumorgrootte van 5 cm x 3 cm. Een EGFR exon 19-deletie werd geïdentificeerd door middel van PCR-analyse van het tumorbiopsiespecimen. Chemotherapie met carboplatine AUC 5 en Pemetrexed 500 mg/m² werd gestart op 03-20-2023 en moet elke 3 weken worden toegediend. Op 60-30-04 is gestart met uitwendige radiotherapie (EBRT) met een dosis van 01 Gy in 2023 fracties. De behandeling van de patiënt is aan de gang en er zijn geen aanwijzingen voor hersenmetastasen op de recente MRI. De mogelijkheid van lymfovasculaire invasie moet nog worden vastgesteld en de tolerantie van de patiënt voor het volledige chemotherapieregime blijft onzeker.

Klinische notitie over oncologie:

Klinische notaverklaring oncologie

Strenge kwaliteitsborging

Een flexibel projectmanagementkader geïmplementeerd dat de effectieve integratie van feedback van klanten faciliteerde en tegelijkertijd strikte kwaliteitsnormen handhaafde. Een uitgebreid kwaliteitsborgingsprotocol werd afgedwongen, in lijn met de richtlijnen om de vereiste kwaliteitsbenchmarks te bereiken. Dit protocol omvatte opeenvolgende rondes van beoordeling en verificatie, waarmee de nauwkeurigheid en betrouwbaarheid van de geannoteerde gegevens werd gewaarborgd. Dergelijk nauwgezet kwaliteitstoezicht is cruciaal bij het maken van een betrouwbare NLP-oplossing, van vitaal belang voor geïnformeerde klinische besluitvorming en uitmuntendheid in onderzoek.

De uitkomst

Succesvol 10,000 hoogwaardige, gedeïdentificeerde gelabelde records geleverd, wat een veilige en waardevolle dataset oplevert voor de NLP-modelontwikkeling van de klant. De nauwgezette toepassing van NLP en naleving van HIPAA-de-identificatienormen resulteerde in een zeer verfijnde dataset die de lopende en toekomstige oncologische onderzoeksinspanningen van de klant zal ondersteunen, met als uiteindelijk doel de oncologische patiëntresultaten en de efficiëntie van de zorgverlening te verbeteren.

Het succes van het project illustreert ons vermogen om complexe medische gegevens nauwkeurig te verwerken. Daarmee leveren we een bijdrage aan de doelstelling van de klant om de resultaten van de patiëntenzorg te verbeteren en het tempo van innovatie in de gezondheidszorg te versnellen.

Onze samenwerking met Shaip heeft een belangrijke rol gespeeld bij het bevorderen van onze NLP-mogelijkheden binnen het oncologiedomein. De professionele behandeling van 10,000 medische dossiers, geannoteerd met gedetailleerde ontkenningen en andere klinische entiteiten, demonstreerde hun toewijding aan uitmuntendheid en naleving. Bovendien heeft hun inzet voor privacystandaarden zoals HIPAA ons voorzien van onschatbare middelen om onze AI-initiatieven voor de ontwikkeling van geavanceerde oncologische behandelingen en diagnostiek vooruit te helpen.

Gouden 5-sterren