Datalabeling — wat is het?

← AI-begrippenlijst

Datalabeling — Datalabeling is het handmatig annoteren van data — tekst, afbeeldingen of audio — met de juiste antwoorden, zodat een model erop kan trainen.

Achter veel AI-systemen zit een grote hoeveelheid menselijk labelerwerk: mensen die aangeven welke e-mails spam zijn, welke foto's een kat bevatten of welk AI-antwoord beter was. Dat labelerwerk wordt wereldwijd deels uitbesteed aan grootschalige annotatiebedrijven. De kwaliteit, consistentie en eerlijkheid van labels hebben direct invloed op het gedrag van het getrainde model.

Verder lezen: Bias en eerlijkheid

Bekijk de cursussen Lees module 1 gratis