Synthetische data — wat is het?

← AI-begrippenlijst

Synthetische data — Synthetische data is kunstmatig gegenereerde data die echte data nabootst en wordt gebruikt om AI-modellen te trainen of te testen.

Echte gelabelde data is schaars, duur of privacygevoelig. Synthetische data biedt een uitweg: genereer voorbeelden die op echte data lijken, inclusief gewenste labels. Taalmodellen worden steeds vaker ingezet om synthetische trainingsdialogen te maken voor hun opvolgers. Het risico is dat modellen die op synthetische data getraind zijn, patronen van de generator overnemen in plaats van de werkelijkheid.

Verder lezen: Klassieke machine learning vs. deep learning

Bekijk de cursussen Lees module 1 gratis