DICOM-dataset met medische beeldvorming voor geavanceerde AI/ML-toepassingen in de gezondheidszorg
Geanonimiseerd DICOM-beeldgegevenssets met behoud van metadata – en optionele radiologische onderzoeksrapporten – om de training, validatie en het klinisch onderzoek van modellen te versnellen.
DICOM-beeldgegevens ontwikkeld voor AI in de praktijk
Shaip biedt AI-ready oplossingen. DICOM-datasets voor medische beeldvorming Ontworpen om AI-teams in de gezondheidszorg te helpen bij het bouwen, trainen en valideren van robuuste modellen voor diagnose, triage en besluitvorming – met behulp van geanonimiseerde gegevens die de klinische waarde behouden.
Momentopname van de dataset
- Totaal aantal onderzoeken:10M +
- Belangrijkste geografische gebieden (volgens studies): VS, Brazilië en India
- Vertegenwoordigde modaliteiten: CR, CT, US, DX, MR, MG, OT, RF, NM, Mammografie
- De afgebeelde lichaamsdelen: Borst, buik, hoofd, wervelkolom, nek, hart en meer
Veelvoorkomende gebruiksscenario's voor DICOM-afbeeldingsdatasets
Train AI-modellen voor diagnostische beeldvorming
- Detectie van afwijkingen
- Ziekteclassificatie
- Ernstscore/stadiëring
- Prioritering bij triage
- Ondersteunt de ontwikkeling van meerdere modaliteiten
Valideer en benchmark de prestaties van het model
- Evalueer de nauwkeurigheid van het model op grotere populaties.
- Benchmarkprestaties per modaliteit/lichaamsregio
- Voer externe validatie uit om overfitting te verminderen.
Verbeter de robuustheid van het model op verschillende apparaten en locaties.
- Test generalisatie over verschillende scanners/leveranciers
- Verminder prestatieverlies bij de implementatie in nieuwe ziekenhuizen.
Ontwikkel multimodale AI (beeld + radiologisch rapport)
- Leid zwakke labels af uit de rapporttaal.
- Train modellen afgestemd op de beschrijvingen in het rapport.
- Ontwikkel rapportagegestuurde triage en beslissingsondersteuning.
Klinisch onderzoek en het creëren van cohorten
- Filter cohorten op modaliteit/lichaamsdeel/tijdstip
- Ondersteun retrospectieve studies
- Versnel het testen van hypothesen met behoud van privacybescherming.
Annotatie en het creëren van grondwaarheden voor ML-training
- Classificatietags
- Grensvakken
- Segmentatiemaskers
Wat u ontvangt in de DICOM-afbeeldingsdataset
1. DICOM-pixelgegevens (de afbeeldingen)
Alle beelden zijn op pixelniveau geanonimiseerd:
- Tekst op afbeeldingen is onleesbaar gemaakt of gepseudonimiseerd.
- "Defacement"-artefacten kunnen ontstaan wanneer gezichtsreconstructie mogelijk is (bijvoorbeeld met behulp van een CT-scan met hoge resolutie).
3. Studierapport (optioneel, indien beschikbaar)
Ongestructureerde narratieve tekst geschreven door de radioloog/arts, met Safe Harbor-anonimisering en dezelfde methode voor het verschuiven van de datum toegepast.
2. DICOM-metadata (met Safe Harbor)
Alle standaard DICOM-metadata blijven behouden voor verzending, terwijl HIPAA Safe Harbor-identificaties worden geanonimiseerd, waaronder:
- Patiëntnaam vervangen door patiënt-ID
- Patiënt-ID cryptografisch gehasht
- De naam van de instelling is vervangen door een alternatieve naam.
- De datums zijn binnen 365 dagen verschoven (consistente verschuiving op patiëntniveau).
4. Aangepaste metadata (optionele meerwaarde)
Optionele afgeleide metadata kunnen het volgende omvatten:
- Geanalyseerde patiëntleeftijd
- SNOMED-tags (uit rapport)
- Positieve entiteiten (uit het rapport)
- Land van verblijf (van het adres)
- Toegerekend ras / Toegerekende etniciteit (afgeleide velden)
Privacygerichte DICOM-anonimiseringsmethoden
De dataset maakt gebruik van cryptografische hashing en pseudonimisering om te voldoen aan de HIPAA-regelgeving, terwijl de klinische bruikbaarheid behouden blijft en gevoelige gegevens worden beschermd.
Bescherming op pixelniveau
Het redigeren/pseudonymiseren van ingebrande tekst en het verwijderen van ongewenste elementen indien nodig.
Metadatabeveiliging
Safe Harbor-identificaties worden geanonimiseerd, terwijl de standaard DICOM-metadata behouden blijft.
Datum verschuiven
De datums worden binnen een periode van 365 dagen verschoven, op patiëntniveau, om de temporele verbanden tussen de studies te behouden.
Demografische vloerbedekking
Bepaalde velden hebben een maximum- of minimumwaarde om het risico op heridentificatie te verkleinen (bijvoorbeeld leeftijd, gewicht, lengte en sommige etnische waarden).
Kunt u niet vinden wat u zoekt?
Er worden nieuwe kant-en-klare medische datasets verzameld voor alle datatypes
Neem nu contact met ons op om uw zorgen over het verzamelen van gegevens over gezondheidstrainingen los te laten
Veel gestelde vragen (FAQ)
1. Wat is een DICOM-afbeeldingsdataset?
Een DICOM-beelddataset is een verzameling medische beeldstudies die zijn opgeslagen volgens de DICOM-standaard, inclusief pixelgegevens en klinische metadata. Deze datasets worden vaak gebruikt om AI-modellen voor de gezondheidszorg te trainen en te valideren.
2. Wat is er opgenomen in deze DICOM-afbeeldingendataset?
Afhankelijk van de licentieomvang kan het DICOM-pixelgegevens, bewaarde (geanonimiseerde) DICOM-metadata, optionele onderzoeksrapporten en optionele, toegevoegde waarde biedende, aangepaste metadata omvatten.
3. Zijn de afbeeldingen geanonimiseerd?
Ja. Afbeeldingen worden op pixelniveau geanonimiseerd, inclusief het verwijderen/pseudonymiseren van tekst op afbeeldingen en het onherkenbaar maken van de afbeelding indien nodig.
4. Zijn de DICOM-metadata bewaard gebleven?
Standaard DICOM-metadata blijven behouden voor verzending, terwijl HIPAA Safe Harbor-identificaties worden geanonimiseerd (bijv. patiënt-/instellingidentificaties en datums).
5. Hoe worden datums verwerkt?
De data kunnen binnen 365 dagen worden verschoven en worden consistent toegepast op patiëntniveau om de relatieve timing tussen onderzoeken te behouden.
6. Zijn radiologische/onderzoeksverslagen inbegrepen?
Indien beschikbaar en met de juiste licentie, kunnen onderzoeksrapporten (ongestructureerde narratieve tekst) worden opgenomen, waarbij de identificerende gegevens gepseudonimiseerd worden.
7. Welke aangepaste metadata kunnen beschikbaar zijn?
Mogelijke opties zijn onder andere de geanalyseerde leeftijd van de patiënt, SNOMED-tags, positieve entiteiten, land van verblijf en andere afgeleide velden.
8. Kan ik een specifieke cohort aanvragen (modaliteit, lichaamsdeel, geografische locatie, enz.)?
Ja, deel je gewenste scope en filters, en Shaip zal op basis van beschikbaarheid de meest geschikte datasetselectie voorstellen.
9. Hoe verkrijg ik een licentie voor de dataset?
Geef uw wensen door via het contactformulier. Ons team zal de beschikbaarheid, de omvang, de licentievoorwaarden en de leveringsmogelijkheden bevestigen.