Recente berichten dat Meta de samenwerking met Mercor heeft stopgezet nadat Mercor een beveiligingsincident had gemeld dat verband hield met het open-sourceproject LiteLLM, hebben de aandacht gevestigd op een onderdeel van de AI-stack dat veel bedrijven nog steeds onderschatten: de data- en workflowlaag achter de training en evaluatie van modellen.
Voor AI-teams binnen bedrijven gaat de les verder dan één startup of één datalek. Het is een herinnering dat AI-programma's slechts zo veerkrachtig zijn als de leveranciers, tools, datapijplijnen en governance-mechanismen die erachter zitten. Wanneer organisaties afhankelijk zijn van externe partners voor dataverzameling, annotatie, evaluatie of expertworkflows, verandert het risico van de leverancier al snel in een risico voor het model zelf. Deze bredere context is nu extra relevant, omdat Mercor heeft aangegeven een van de duizenden bedrijven te zijn die getroffen zijn door een supply chain-aanval gerelateerd aan LiteLLM en dat het een forensisch onderzoek is gestart.
Waarom het risico van AI-leveranciers nu dichter bij het modelrisico ligt.
De moderne AI-toeleveringsketen is zelden eenvoudig. Een enkele workflow kan externe dataleveranciers, annotatieteams, netwerken van aannemers, API's, open-source middleware, benchmarkpipelines en interne finetuning- of evaluatieomgevingen omvatten. Als één laag uitvalt, beperkt de impact zich niet tot de uptime. Het kan eigen prompts, workflowmetadata, benchmarklogica, klantgegevens of interne evaluatieprocessen beïnvloeden. Het verhaal van Mercor is een nuttige herinnering dat snelheid zonder goed beheer verborgen kwetsbaarheden kan creëren.
Bedrijven hebben een sterker due diligence-model voor AI-leveranciers nodig.

De lat voor leveranciers van AI-data wordt steeds hoger. Bedrijven beoordelen partners niet langer alleen op snelheid of schaal, maar ook op hoe goed ze betrouwbare datapijplijnen, meetbare kwaliteit en veilige, conforme bedrijfsvoering kunnen ondersteunen.
Een leveranciersbeoordeling moet meer omvatten dan alleen de oppervlakkige aspecten.
Een van de belangrijkste lessen uit het Mercor-incident is dat het risico verband hield met een inbreuk op de toeleveringsketen waarbij LiteLLM betrokken was, en niet zomaar met een simpel verhaal over een gehackte leverancier. In de AI-wereld omvat het risicooppervlak steeds vaker orchestratielagen, connectoren, evaluatietools en middleware. Zelfs een ogenschijnlijk veilige leverancier kan risico's in de toeleveringsketen introduceren als deze afhankelijkheden niet goed worden beheerd.
Datakwaliteit en -beheer zijn onlosmakelijk met elkaar verbonden.
Beveiligingsfouten domineren de krantenkoppen, maar zwak beheer kan net zo kostbaar zijn, zelfs zonder een inbreuk. Slechte instructies, inconsistente labels, vage afhandeling van uitzonderlijke gevallen en ongedocumenteerde herkomst van datasets verminderen allemaal de prestaties van modellen in de loop van de tijd.
Daarom hechten volwassen AI-teams steeds meer waarde aan de structuur van menselijke beoordelingen, de kwaliteitsmeting en de documentatie van beslissingen met betrekking tot datasets. De openbare content van Shaip benadrukt dezezelfde richting. kwaliteitsworkflows met menselijke tussenkomst, Richtlijnen voor het verzamelen van AI-gegevensen domeinspecifiek LLM-opleidingsgegevensservices.
Ontwikkel AI op basis van betrouwbare data.
Wat bedrijven nu aan elke AI-dataleverancier zouden moeten vragen

Hoe worden gegevens verkregen, gelicentieerd, gevalideerd en beheerd?
Een geloofwaardige leverancier moet de herkomst, de verzamelpraktijken, de documentatiestandaarden, de toestemmingsprocedures en de bewaarregels kunnen toelichten. De openbare richtlijnen voor kopers van Shaip leggen sterk de nadruk op herkomst, kwaliteitsborging en conforme verzamelpraktijken.
Welke menselijke kwaliteitscontroles zijn er?
Bedrijven hebben meer nodig dan alleen "we hebben kwaliteitscontrole". Ze hebben behoefte aan een meerlaagse beoordeling, duidelijke besluitvorming, meetbare nauwkeurigheid en feedbackloops. Shaips openbare materialen benadrukken deskundige beoordeling en door mensen begeleide evaluatie voor LLM-workflows.
Welke open-source en externe tools worden in de workflow gebruikt?
Als een leverancier zijn afhankelijkheidsstructuur niet kan uitleggen, is dat een governanceprobleem. Het verhaal van Mercor laat zien waarom.
Welk bewijsmateriaal ondersteunt de naleving van de regels en de gereedheid voor audits?
Een goede beveiligingsaanpak vereist bewijs, geen loze kreten. Shaip benadrukt openlijk de naleving van ISO 27001:2022, HIPAA en SOC 2 op de compliancepagina.
Laatste afhaalmaaltijden
De pauze tussen Meta en Mercor is niet zomaar een krantenkop. Het is een signaal dat de inkoop van AI-oplossingen volwassener wordt. De kernvraag is niet langer alleen of een leverancier je kan helpen sneller te werken. Het gaat erom of die leverancier je kan helpen sneller te werken zonder afbreuk te doen aan governance, datakwaliteit of het vertrouwen binnen de organisatie.
Shaip helpt bedrijven bij het bouwen van sterkere AI-pipelines door AI-trainingsgegevens, Diensten gericht op LLM-studentenen geschikt voor gebruik binnen bedrijven Beveiliging en naleving.
Wat is het risico voor leveranciers van AI-data?
Het risico van AI-dataleveranciers omvat de operationele, beveiligings-, compliance- en kwaliteitsrisico's die worden veroorzaakt door externe leveranciers die betrokken zijn bij het verzamelen, annoteren, evalueren of ontwikkelen van workflowtools voor AI-data.
Waarom is de beveiliging van de toeleveringsketen belangrijk in AI?
Omdat AI-workflows vaak afhankelijk zijn van open-sourcebibliotheken, orchestratielagen en connectoren die gevoelige gegevens tussen systemen verplaatsen, kan een zwakke plek in één van deze afhankelijkheden de gehele pipeline beïnvloeden.
Waar moeten bedrijven op letten bij het kiezen van een leverancier van AI-data?
Bedrijven moeten de herkomst, menselijke kwaliteitsborging, toegangscontrole, controleerbaarheid, bewijs van naleving, transparantie van afhankelijkheden en paraatheid voor incidentafhandeling evalueren. De openbare richtlijnen voor kopers en de pagina's over naleving van Shaip weerspiegelen deze prioriteiten.
Waarom is menselijke beoordeling nog steeds belangrijk voor AI in het bedrijfsleven?
Omdat taken die ambigu of domeinspecifiek zijn nog steeds beoordelingsvermogen, context en verantwoording vereisen. De openbare HITL-richtlijnen van Shaip beschouwen menselijke beoordeling als een essentieel controlepunt voor datakwaliteit.