Interpreteerbaarheid (explainability) — wat is het?

← AI-begrippenlijst

Interpreteerbaarheid (explainability) — Interpreteerbaarheid is de mate waarin mensen kunnen begrijpen waarom een AI-model een bepaalde uitkomst produceert.

Moderne neurale netwerken zijn zo complex dat zelfs hun makers niet precies kunnen zeggen waarom een model een specifiek antwoord geeft. Interpreteerbaarheidsonderzoek ontwikkelt methoden om toch inzicht te krijgen: welke invoerelementen waren doorslaggevend, welke neuronen activeren bij welk concept. Dit is cruciaal in toepassingen met hoge stakes, zoals medische diagnose of kredietbeoordeling, waar een uitleg wettelijk verplicht kan zijn.

Verder lezen: Bias en eerlijkheid

Bekijk de cursussen Lees module 1 gratis