Computer visie

22+ meest gezochte open-source datasets voor computervisie

Een AI-algoritme is zo goed als de data die je eraan geeft.

Het is geen gewaagde of onconventionele uitspraak. AI had een paar decennia geleden nogal vergezocht kunnen lijken, maar kunstmatige intelligentie en machine learning hebben sindsdien een heel lange weg afgelegd.

Computer visie helpt computers labels en afbeeldingen te begrijpen en te interpreteren. Wanneer u uw computer traint met behulp van de juiste soort afbeeldingen, kan deze de mogelijkheid krijgen om verschillende gelaatstrekken te detecteren, begrijpen en identificeren, ziekten te detecteren, autonome voertuigen te besturen en ook levens te redden met behulp van multidimensionale orgaanscanning.

De Computer Vision-markt zal naar verwachting bereiken: $ 144.46 miljard tegen 2028 van een bescheiden $ 7.04 miljard in 2020, groeiend met een CAGR van 45.64% tussen 2021 en 2028.

Enkele van de gebruiksscenario's van computervisie zijn:

  • Medische beeldvorming
  • Autonoom voertuig
  • Gezichts- en objectherkenning
  • Identificatie van defecten
  • Scènedetectie

De afbeeldingsgegevensset u voedt en traint uw Machine Learning- en computervisietaken zijn cruciaal voor het succes van uw AI-project. Een kwalitatieve dataset is vrij moeilijk te verkrijgen. Afhankelijk van de complexiteit van uw project, kan het enkele dagen tot een paar weken duren om betrouwbare en relevante datasets voor computervisiedoeleinden te krijgen.

Hier bieden we u een reeks (voor uw gemak gecategoriseerd) open-source datasets die u meteen kunt gebruiken.

Uitgebreide lijst met Computer Vision-datasets

Algemeen:

  1. IMAGEnet (Link)

    ImageNet is een veelgebruikte dataset en wordt geleverd met een verbazingwekkende 1.2 miljoen afbeeldingen, onderverdeeld in 1000 categorieën. Deze dataset is georganiseerd volgens de WorldNet-hiërarchie en onderverdeeld in drie delen: de trainingsgegevens, afbeeldingslabels en validatiegegevens.

  2. Kinetiek 700 (Link)

    Kinetics 700 is een enorme dataset van hoge kwaliteit met meer dan 650,000 clips van 700 verschillende klassen van menselijk handelen. Elk van de klassenacties heeft ongeveer 700 videoclips. De clips in de dataset hebben mens-object en mens-mens interacties, die heel nuttig blijken te zijn bij het herkennen van menselijke acties in video's.

  3. CIFAR-10 (Link)

    CIFAR 10 is een van de grootste computer vision-datasets met 60000 32 x 32 kleurenafbeeldingen die tien verschillende klassen vertegenwoordigen. Elke klas heeft ongeveer 6000 afbeeldingen die worden gebruikt om computervisie-algoritmen en machine learning te trainen.

Gezichtsherkenning:

Gezichtsherkenning

  1. Gelabelde gezichten in het wild (Link)

    Labeled Faced in the Wild is een enorme dataset met meer dan 13,230 afbeeldingen van bijna 5,750 mensen die via internet zijn gedetecteerd. Deze dataset van gezichten is ontworpen om het gemakkelijker te maken om onbeperkte gezichtsdetectie te bestuderen.

  2. CASIA WebFace (Link)

    CASIA Web face is een goed ontworpen dataset die machine learning en wetenschappelijk onderzoek naar onbeperkte gezichtsherkenning helpt. Met meer dan 494,000 afbeeldingen van bijna 10,000 echte identiteiten is het ideaal voor gezichtsidentificatie- en verificatietaken.

  3. UMD Faces-gegevensset (Link)

    UMD staat voor een goed geannoteerde dataset die uit twee delen bestaat: stilstaande beelden en videoframes. De dataset heeft meer dan 367,800 gezichtsannotaties en 3.7 miljoen geannoteerde videoframes van onderwerpen.

Handschrift herkenning:

  1. MNIST-database (Link)

    MNIST is een database met voorbeelden van handgeschreven cijfers van 0 tot 9, en heeft 60,000 en 10,000 trainings- en testbeelden. MNIST, uitgebracht in 1999, maakt het eenvoudiger om beeldverwerkingssystemen in Deep Learning te testen.

  2. Gegevensset kunstmatige tekens (Link)

    Artificial Characters Dataset is, zoals de naam al doet vermoeden, kunstmatig gegenereerde data die de Engelse taalstructuur in tien hoofdletters beschrijft. Het wordt geleverd met meer dan 6000 afbeeldingen.

Laten we vandaag uw AI-trainingsgegevensvereiste bespreken.

Objectdetectie:

  1. MS COCO (Link)

    MS COCO of Common Objects in Context is een dataset voor objectdetectie en ondertiteling.

    Het heeft meer dan 328,000 afbeeldingen met keypoint-detectie, detectie van meerdere objecten, ondertiteling en segmentatiemaskerannotaties. Het wordt geleverd met 80 objectcategorieën en vijf bijschriften per afbeelding.

  2. LSUN(Link)

    LSUN, een afkorting voor Large-scale Scene Understanding, heeft meer dan een miljoen gelabelde afbeeldingen in 20 object- en 10 scènecategorieën. Sommige categorieën hebben bijna 300,000 afbeeldingen, met 300 afbeeldingen specifiek voor validatie en 1000 afbeeldingen voor testgegevens.

  3. Home Objects(Link)

    De gegevensset Home Objects bevat geannoteerde afbeeldingen van willekeurige objecten uit het hele huis - keuken, woonkamer en badkamer. Deze dataset bevat ook enkele geannoteerde video's en 398 niet-geannoteerde foto's die zijn ontworpen om te testen.

Automotive:

  1. Stadsgezicht dataset (Link)

    Cityscape is de dataset om naar toe te gaan bij het zoeken naar verschillende videosequenties die zijn opgenomen uit de straatscènes van verschillende citaten. Deze beelden zijn gemaakt over een lange tijd en in verschillende weers- en lichtomstandigheden. De annotaties zijn voor 30 beeldklassen, verdeeld in acht verschillende categorieën.

  2. Barkley Deep Drive (Link)

    Barkley DeepDrive is speciaal ontworpen voor autonome voertuigtraining en heeft meer dan 100 geannoteerde videosequenties. Het is een van de nuttigste trainingsgegevens voor autonome voertuigen door de veranderende weg- en rijomstandigheden.

  3. Mapillair (Link)

    Mapillary heeft wereldwijd meer dan 750 miljoen straatbeelden en verkeersborden, wat erg handig is bij het trainen van visuele waarnemingsmodellen in machine learning en AI-algoritmen. Hiermee kunt u autonome voertuigen ontwikkelen die inspelen op verschillende licht- en weersomstandigheden en gezichtspunten.

Medische beeldvorming:

  1. Covid-19 Open onderzoeksdataset (Link)

    Deze originele dataset heeft ongeveer 6500 pixel-polygonale longsegmentaties over AP/PA thoraxfoto's. Daarnaast zijn 517 afbeeldingen van röntgenfoto's van Covid-19-patiënten met tags met de naam, locatie, opnamedetails, uitkomst en meer beschikbaar.

  2. NIH-database met 100,000 thoraxfoto's (Link)

    De NIH-database is een van de meest uitgebreide openbaar beschikbare datasets met 100,000 thoraxfoto's en gerelateerde gegevens die nuttig zijn voor de wetenschappelijke en onderzoeksgemeenschap. Het heeft zelfs afbeeldingen van patiënten met vergevorderde longaandoeningen.

  3. Atlas van digitale pathologie (Link)

    Atlas of Digital Pathology biedt verschillende histopathologische patchafbeeldingen, meer dan 17,000 in totaal, van bijna 100 geannoteerde dia's van verschillende organen. Deze dataset is nuttig bij het ontwikkelen van software voor computervisie en patroonherkenning.

Scèneherkenning:

Scèneherkenning

  1. Binnenscèneherkenning (Link)

    Indoor Scene Recognition is een zeer gecategoriseerde dataset met bijna 15620 afbeeldingen van objecten en binnenlandschappen voor gebruik bij machine learning en datatraining. Het wordt geleverd met meer dan 65 categorieën en elke categorie heeft minimaal 100 afbeeldingen.

  2. xBekijken (Link)

    Als een van de bekendste openbaar beschikbare datasets bevat xView tonnen geannoteerde overheadbeelden van verschillende complexe en grote scènes. Met ongeveer 60 klassen en meer dan een miljoen objectinstanties, is het doel van deze dataset om betere rampenbestrijding te bieden met behulp van satellietbeelden.

  3. plaatsen (Link)

    Places, een dataset die is bijgedragen door MIT, bevat meer dan 1.8 miljoen afbeeldingen uit 365 verschillende scènecategorieën. Er zijn ongeveer 50 afbeeldingen in elk van deze categorieën voor validatie en 900 afbeeldingen om te testen. Het is mogelijk om diepe scènefuncties te leren om scèneherkenning of visuele herkenningstaken tot stand te brengen.

Entertainment:

  1. IMDB WIKI-gegevensset (Link)

    IMDB - Wiki is een van de meest populaire openbare databases van gezichten die adequaat zijn gelabeld met leeftijd, geslacht en namen. Het heeft ook ongeveer 20 duizend gezichten van beroemdheden en 62 duizend van Wikipedia.

  2. Gezichten van beroemdheden (Link)

    Celeb Faces is een grootschalige database met 200,000 geannoteerde afbeeldingen van beroemdheden. De afbeeldingen worden geleverd met achtergrondruis en posevariaties, waardoor ze waardevol zijn voor het trainen van testsets bij computervisietaken. Het is zeer gunstig voor het bereiken van een hogere nauwkeurigheid bij gezichtsherkenning, bewerking, lokalisatie van gezichtsdelen en meer.

Nu je een enorme lijst met open-source afbeeldingsdatasets hebt om je kunstmatige intelligentie-machines van brandstof te voorzien. De uitkomst van uw AI- en machine learning-modellen hangt voornamelijk af van de kwaliteit van de datasets die u voedt en traint. Als u wilt dat uw AI-model nauwkeurige voorspellingen geeft, heeft het hoogwaardige datasets nodig die tot in de perfectie worden geaggregeerd, getagd en gelabeld. Om het succes van uw computervisiesysteem te vergroten, moet u hoogwaardige beelddatabases gebruiken die relevant zijn voor uw projectvisie. Als u op zoek bent naar meer van dergelijke datasets Klik Hier

Sociale Share

Dit vind je misschien ook leuk