Computer visie (CV) is een niche-subset van kunstmatige intelligentie die de kloof tussen sciencefiction en realiteit overbrugt. Romans, films en hoorspelen uit de vorige eeuw hadden boeiende saga's van machines die hun omgeving zagen zoals mensen dat zouden doen en ermee interacteerden. Maar vandaag de dag is dit allemaal realiteit dankzij CV-modellen.
Of het nu gaat om een eenvoudige taak als het ontgrendelen van uw smartphone via gezichtsherkenning of een complex gebruiksvoorbeeld van het diagnosticeren van machines in Industrie 4.0-omgevingen, computer visie verandert het spel als het gaat om het herijken van conventionele operationele methodologieën. Het baant de weg voor betrouwbaarheid, snelle conflictoplossing en gedetailleerde rapportage over de use cases heen.
Hoe precies en accuraat de uitkomsten van een CV-model zijn, hangt echter af van de kwaliteit van de trainingsdata. Laten we dit eens wat verder uitdiepen.
De kwaliteit van AI-trainingsgegevens is direct evenredig met de output van CV-modellen
At Shaip, hebben we de betekenis en criticaliteit van kwaliteitsdatasets bij het trainen van AI-modellen herhaald. Als het gaat om nichetoepassingen met betrekking tot computer vision, met name mensen, wordt het des te belangrijker.
Diversiteit in datasets is essentieel om ervoor te zorgen dat computer vision-modellen wereldwijd op dezelfde manier functioneren en geen vooringenomenheid of oneerlijke uitkomsten vertonen voor specifieke rassen, geslachten, geografie of andere factoren vanwege het gebrek aan beschikbare datasets voor training.
Om het belang van diversiteit bij mensen in de training verder te onderbouwen CV-modellen, hier zijn dwingende redenen.
- Om historische vooringenomenheid te voorkomen en de eerlijkheid bij de verwerking van mensen te verbeteren, zonder enige discriminatie of vooringenomenheid.
- Voor de robuuste prestaties van modellen om ervoor te zorgen dat computer vision perfect werkt, zelfs bij afbeeldingen met weinig licht, weinig contrast, verschillende gezichtsuitdrukkingen en meer
- Om een inclusieve functionaliteit van het model te bevorderen voor mensen met verschillende levensstijl- en uiterlijkkeuzes
- Om juridische of reputatieschade door gevolgen zoals verkeerde identificatie te voorkomen
- Om de verantwoordelijkheid bij AI-gestuurde besluitvorming te verbeteren en meer
Hoe je diversiteit bereikt bij het verkrijgen van menselijke gezichten voor computer vision-modellen
Bias in trainingsgegevens komt vaak voor door factoren die aangeboren zijn of door het gebrek aan beschikbaarheid van representatieve gegevens van over geografie, ras en etniciteit. Er zijn echter bewezen strategieën om vooringenomenheid te verminderen en eerlijkheid te garanderen in Datasets voor AI-trainingLaten we eens kijken naar de beste manieren om dit te bereiken.

Geplande gegevensverzameling
Elke computer visie model heeft een probleem dat het moet oplossen of een doel dat het moet dienen. De identificatie hiervan biedt u inzicht in wie de uiteindelijke doelgroepen zijn. Wanneer u ze in verschillende persona's classificeert, krijgt u een spiekbriefje met tips om strategieën voor gegevensverzameling te begrijpen.
Zodra u deze hebt geïdentificeerd, kunt u beslissen of u de voorkeur geeft aan openbare databases of dit uitbesteedt aan experts zoals Shaip, die op ethische wijze kwaliteitsinformatie zullen inkopen. AI-trainingsgegevens voor uw wensen.
Maak gebruik van de verschillende soorten sourcingtechnieken
Menselijke diversiteit in datasets kan verder worden bereikt door de verschillende soorten data-sourcing methodologieën te benutten. We gaan deze aanpak eenvoudiger voor u maken door ze op te sommen:
Datasets met één afbeelding
Waar een frontale afbeelding van een persoon wordt samengesteld en geannoteerd op demografie, leeftijd, etniciteit, expressie en meer
Datasets met meerdere afbeeldingen
Met meerdere profielfoto's van hetzelfde individu vanuit verschillende hoeken en emoties. Dit is een uitgebreidere dataset met een groot aantal identificatiepunten, zodat u ze voor diverse use cases kunt gebruiken.
Videodatasets
met video's van personen die specifieke acties uitvoeren. Dit is ideaal voor gebruik in gezondheidszorgtoepassingen, waar mHealth-modules kunnen helpen bij het detecteren en begeleiden van patiënten naar de juiste gezondheidszorgexperts of voorlopige suggesties kunnen bieden.
Gegevensvergroting
Voor niche-industrieën, waar het een lastige uitdaging is om op verantwoorde wijze diverse menselijke datasets te sourcen, is data augmentation een ideale alternatieve oplossing. Door technieken zoals synthetische datageneratie kunnen nieuwe en diverse menselijke beelden worden gegenereerd met bestaande datasets als referentie. Hoewel dit specifieke en waterdichte instructies vereist om modellen te trainen, is het een goede strategie om uw trainingsdatavolume te vergroten.
Gegevenscuratie
Hoewel het verkrijgen van kwaliteitsafbeeldingen één aspect is, kan het verfijnen van bestaande gegevens ook een positieve impact hebben op resultaten en modeltraining optimaliseren. Dit kan worden gedaan door middel van eenvoudige technieken zoals:
- Strikte kwaliteitscontrolemaatregelen, waaronder het uitfilteren van afbeeldingen van lage kwaliteit, gegevens die moeilijk te labelen zijn en dergelijke
- Luchtdichte annotatiestrategieën om zoveel mogelijk informatie in een afbeelding te presenteren
- Betrek specialisten en mensen bij de lus om de nauwkeurigheid van de datakwaliteit en meer te garanderen
De weg voorwaarts
Data diversiteit is een bewezen aanpak om computer vision-modellen te verbeteren. Hoewel niet-menselijke afbeeldingen op verschillende manieren kunnen worden verkregen, vereisen datasets van mensen een cruciaal aspect genaamd toestemming. Dit is waar ethische en verantwoorde AI ook in beeld komt.
Daarom raden wij aan om de moeilijke stappen van het verzekeren van menselijke diversiteit in datasets voor ons. Met tientallen jaren aan expertise en ervaring in dit veld, zijn onze bronnen divers, zijn onze technieken meesterlijk en is onze domeinkennis diepgaand.
Contact opnemen vandaag nog om erachter te komen hoe wij uw computer visie doelstellingen en trainingsvereisten.


