Gegevensannotatie voor AI in de gezondheidszorg

Annotatie van door mensen aangedreven medische gegevens

Ontgrendel complexe informatie in ongestructureerde gegevens met extractie en herkenning van entiteiten

Annotatie van medische gegevens

Uitgelichte klanten

Teams in staat stellen om toonaangevende AI-producten te bouwen.

Amazone
Google
Microsoft
Coggebreid
Er is een toenemende vraag naar het analyseren van ongestructureerde, complexe medische gegevens om onontdekte inzichten bloot te leggen

80% van de data in de gezondheidszorg is ongestructureerd, waardoor deze ontoegankelijk is. Toegang tot de gegevens vereist aanzienlijke handmatige tussenkomst, waardoor de hoeveelheid bruikbare gegevens wordt beperkt. Het begrijpen van tekst in het medische domein vereist een diepgaand begrip van de terminologie ervan om het potentieel ervan te ontsluiten. Shaip biedt de expertise om gezondheidszorggegevens te annoteren om AI-motoren op schaal te verbeteren.

IDC, analistenbureau:

De wereldwijde geïnstalleerde basis van opslagcapaciteit zal bereiken 11.7 zettabyte in 2023

IBM, Gartner en IDC:

80% van de gegevens over de hele wereld is ongestructureerd, waardoor ze verouderd en onbruikbaar zijn. 

Echte oplossing

Analyseer gegevens om zinvolle inzichten te ontdekken om NLP-modellen te trainen met Medical Text Data Annotation

We bieden annotatiediensten voor medische gegevens die organisaties helpen kritieke informatie uit ongestructureerde medische gegevens te halen, dwz aantekeningen van artsen, samenvattingen van opnames/ontslag in het EPD, pathologierapporten, enz. die machines helpen de klinische entiteiten in een bepaalde tekst of afbeelding te identificeren. Onze gediplomeerde domeinexperts kunnen u helpen domeinspecifieke inzichten te leveren, zoals symptomen, ziekte, allergieën en medicatie, om inzichten voor de zorg te stimuleren.

Echte oplossing

We bieden ook eigen Medical NER API's (vooraf getrainde NLP-modellen), die de benoemde entiteiten die in een tekstdocument worden gepresenteerd, automatisch kunnen identificeren en classificeren. Medische NER API's maken gebruik van een eigen kennisgrafiek, met meer dan 20 miljoen relaties en meer dan 1.7 miljoen klinische concepten

Van gegevenslicenties en -verzameling tot gegevensannotatie, Shaip heeft u gedekt.

  • Annotatie en voorbereiding van medische afbeeldingen, video's en teksten, waaronder radiografie, echografie, mammografie, CT-scans, MRI's en fotonenemissietomografie
  • Farmaceutische en andere toepassingen in de gezondheidszorg voor natuurlijke taalverwerking (NLP), inclusief medische tekstcategorisering, identificatie van benoemde entiteiten, tekstanalyse, enz.

Medisch annotatieproces

Het annotatieproces verschilt over het algemeen van de eis van een klant, maar het omvat voornamelijk:

Domeindeskundigheid

Fase 1: Expertise in het technische domein (inzicht in richtlijnen voor bereik en annotaties)

Trainingsbronnen

Fase 2: Training van geschikte middelen voor het project

Qa-documenten

Fase 3: Feedbackcyclus en QA van de geannoteerde documenten

Ons Expertise

1. Herkenning/annotatie van klinische entiteiten

In het medisch dossier is een grote hoeveelheid medische gegevens en kennis grotendeels ongestructureerd beschikbaar. Medische entiteit Annotatie stelt ons in staat om ongestructureerde gegevens om te zetten in een gestructureerd formaat.

Annotatie van klinische entiteiten
Medicijnen Attributen

2. Attributie-annotatie

2.1 Medicijnattributen

Medicijnen en hun attributen worden gedocumenteerd in bijna elk medisch dossier, wat een belangrijk onderdeel is van het klinische domein. We kunnen de verschillende kenmerken van medicijnen identificeren en annoteren volgens richtlijnen.

2.2 Attributen van laboratoriumgegevens

Labgegevens worden meestal vergezeld van hun attributen in een medisch dossier. We kunnen de verschillende attributen van labgegevens volgens richtlijnen identificeren en annoteren.

Attributen van laboratoriumgegevens
Attributen voor lichaamsmetingen

2.3 Eigenschappen van lichaamsmetingen

Lichaamsmetingen gaan meestal gepaard met hun attributen in een medisch dossier. Het bestaat voornamelijk uit de vitale functies. We kunnen de verschillende attributen van lichaamsmeting identificeren en annoteren.

3. Oncologiespecifieke NER-annotatie

Naast generieke medische NER-annotatie kunnen we ook werken aan domeinspecifieke annotaties zoals oncologie, radiologie, enz. Hier zijn de oncologiespecifieke NER-entiteiten die kunnen worden geannoteerd: kankerprobleem, histologie, kankerstadium, TNM-stadium, kankergraad, dimensie, Klinische status, tumormarkertest, kankergeneeskunde, kankerchirurgie, bestraling, onderzocht gen, variatiecode, lichaamsplaats

Oncologiespecifieke Ner-annotatie
Aantekening bijwerking

4. Negatief effect NER & Relatie-annotatie

Naast het identificeren en annoteren van belangrijke klinische entiteiten en relaties, kunnen we ook de nadelige effecten van bepaalde medicijnen of procedures annoteren. De reikwijdte is als volgt: Etikettering van bijwerkingen en hun veroorzakers. Toewijzen van de relatie tussen het nadelige effect en de oorzaak van het effect.

5. Annotatie van relaties

Na het identificeren en annoteren van klinische entiteiten, wijzen we ook relevante relaties tussen de entiteiten toe. Er kunnen relaties bestaan ​​tussen twee of meer concepten.

Relatie Annotatie

6. Bewering Annotatie

Naast het identificeren van klinische entiteiten en relaties, kunnen we ook de status, ontkenning en het onderwerp van de klinische entiteiten toewijzen.

Status-Ontkenning-Onderwerp

7. Tijdelijke annotatie

Het annoteren van tijdelijke entiteiten uit een medisch dossier helpt bij het opstellen van een tijdlijn van de reis van de patiënt. Het biedt referentie en context voor de datum die is gekoppeld aan een specifieke gebeurtenis. Hier zijn de datumentiteiten: diagnosedatum, proceduredatum, startdatum medicatie, einddatum medicatie, startdatum bestraling, einddatum bestraling, datum van opname, datum van ontslag, datum van consultatie, notitiedatum, aanvang.

Tijdelijke annotatie
Sectie Annotatie

8. Sectieannotatie

Het verwijst naar het proces van het systematisch organiseren, labelen en categoriseren van verschillende secties of delen van gezondheidszorggerelateerde documenten, afbeeldingen of gegevens, dwz annotatie van relevante secties van het document en classificatie van de secties in hun respectieve typen. Dit helpt bij het creëren van gestructureerde en gemakkelijk toegankelijke informatie, die voor verschillende doeleinden kan worden gebruikt, zoals ondersteuning van klinische beslissingen, medisch onderzoek en gegevensanalyse in de gezondheidszorg.

9. ICD-10-CM & CPT-codering

Annotatie van ICD-10-CM en CPT codes volgens de richtlijnen. Voor elke gelabelde medische code zal het bewijs (tekstfragmenten) dat de labelbeslissing onderbouwt, samen met de code worden geannoteerd.

Icd-10-Cm &Amp; Cpt-codering
Rxnorm-codering

10. RXNORM-codering

Annotatie van RXNORM-codes volgens de richtlijnen. Voor elke gelabelde medische code wordt het bewijs (tekstfragmenten) dat de labelbeslissing onderbouwt, samen met de code geannoteerd.0

11. SNOMED-codering

Annotatie van SNOMED-codes volgens de richtlijnen. Voor elke gelabelde medische code zal het bewijs (tekstfragmenten) dat de labelbeslissing onderbouwt, samen met de code worden geannoteerd.

Snomed-codering
Umls-codering

12. UMLS-codering

Annotatie van UMLS-codes volgens de richtlijnen. Voor elke gelabelde medische code zal het bewijs (tekstfragmenten) dat de labelbeslissing onderbouwt, samen met de code worden geannoteerd.

Redenen om Shaip te kiezen als uw betrouwbare partner voor medische annotatie

Mensen

Mensen

Toegewijde en getrainde teams:

  • 30,000+ medewerkers voor gegevenscreatie, labeling en QA
  • Gecertificeerd projectmanagementteam
  • Ervaren productontwikkelingsteam
  • Talentpool Sourcing & Onboarding-team
Proces

Proces

De hoogste procesefficiëntie wordt gegarandeerd met:

  • Robuust 6 Sigma Stage-Gate-proces
  • Een toegewijd team van 6 Sigma black belts – Key process owners & Quality compliance
  • Continue verbetering en feedbacklus
Platform

Platform

Het gepatenteerde platform biedt voordelen:

  • Webgebaseerd end-to-end platform
  • Onberispelijke kwaliteit
  • Snellere TAT
  • Naadloze levering
Neem contact met ons op

Op zoek naar annotatie-experts in de gezondheidszorg voor complexe projecten?

Neem nu contact met ons op om te leren hoe we een dataset kunnen verzamelen en annoteren voor uw unieke AI/ML-oplossing

  • Door te registreren ga ik akkoord met Shaip Privacybeleid en Algemene Voorwaarden en geef mijn toestemming om B2B-marketingcommunicatie van Shaip te ontvangen.

Named Entity Recognition is een onderdeel van Natural Language Processing. Het primaire doel van NER is om gestructureerde en ongestructureerde gegevens te verwerken en deze benoemde entiteiten te classificeren in vooraf gedefinieerde categorieën. Enkele veel voorkomende categorieën zijn naam, locatie, bedrijf, tijd, geldwaarden, gebeurtenissen en meer.

Kort samengevat houdt NER zich bezig met:

Herkenning/detectie van benoemde entiteiten – Identificatie van een woord of een reeks woorden in een document.

Classificatie van benoemde entiteiten – Classificatie van elke gedetecteerde entiteit in vooraf gedefinieerde categorieën.

Natuurlijke taalverwerking helpt bij het ontwikkelen van intelligente machines die in staat zijn om betekenis uit spraak en tekst te halen. Machine Learning helpt deze intelligente systemen te blijven leren door te trainen op grote hoeveelheden datasets in natuurlijke taal. Over het algemeen bestaat NLP uit drie hoofdcategorieën:

De structuur en regels van de taal begrijpen - Syntaxis

De betekenis van woorden, tekst en spraak afleiden en hun relaties identificeren - Semantiek

Identificeren en herkennen van gesproken woorden en deze omzetten in tekst – Spraak

Enkele veelvoorkomende voorbeelden van een vooraf bepaalde entiteitsindeling zijn:

Persoon: Michael Jackson, Oprah Winfrey, Barack Obama, Susan Sarandon

Locatie: Canada, Honolulu, Bangkok, Brazilië, Cambridge

Organisatie: Samsung, Disney, Yale Universiteit, Google

Tijd: 15.35, 12 uur,

De verschillende benaderingen voor het maken van NER-systemen zijn:

Woordenboekgebaseerde systemen

Op regels gebaseerde systemen

Op machine learning gebaseerde systemen

Gestroomlijnde klantenondersteuning

Efficiënte menselijke hulpbronnen

Vereenvoudigde inhoudsclassificatie

Zoekmachines optimaliseren

Nauwkeurige inhoudsaanbeveling