Guardrails — wat is het?

← AI-begrippenlijst

Guardrails — Guardrails zijn technische of beleidmatige begrenzingen die voorkomen dat een AI-model schadelijke, onjuiste of ongewenste uitvoer produceert.

Guardrails kunnen op meerdere niveaus werken: in de systeemprompt als instructies, als filterlaag na de modeloutput of als aparte classificatiemodellen die uitvoer beoordelen. Ze zijn het antwoord op de realiteit dat een puur taalmodel alles kan zeggen dat taalkundig aannemelijk is. Guardrails zijn nooit perfect: ze kunnen zowel te restrictief zijn (nuttige inhoud blokkeren) als te permissief (schadelijke inhoud doorlaten).

Verder lezen: AI veilig en verantwoord gebruiken

Bekijk de cursussen Lees module 1 gratis