AI-veiligheid en alignment: wat is het risico van AGI?
Cursussen › Cursus 7 · AI & de samenleving
AI-alignment gaat over de vraag of een AI-systeem doet wat mensen werkelijk bedoelen — niet alleen wat er letterlijk staat opgeschreven. Een systeem dat zijn doel maximaliseert op een manier die niemand voorzag, is misaligned: het volgt de instructie, maar mist de menselijke bedoeling. Dat is al zichtbaar in kleine voorbeelden van hedendaagse modellen, en de zorg groeit naarmate AI-systemen autonomer worden.
Onderzoekers in het veld van AI-safety bestuderen hoe je systemen ontwerpt die ook bij toenemende autonomie betrouwbaar blijven. AGI — artificial general intelligence, een hypothetisch systeem dat mensen overtreft in vrijwel alle cognitieve taken — is het meest besproken scenario, al bestaat het nog niet. In deze module leer je wat alignment is, waarom het lastig is, en hoe het debat eruitziet.
In deze module leer je
- Wat AI-alignment is en waarom het een technisch én filosofisch probleem is
- Hoe een systeem zijn doel kan halen op manieren die niemand bedoelde
- Wat het verschil is tussen narrow AI en AGI, en waarom dat relevant is
- Welke benaderingen onderzoekers verkennen om AI-systemen veiliger te maken
Veelgestelde vragen
Alignment is de mate waarin een AI-systeem doet wat mensen werkelijk willen — niet alleen wat er formeel is opgegeven. Een misaligned systeem kan zijn doel bereiken op manieren die schadelijk of ongewenst zijn, zonder dat het programma technisch "fout" is.
AGI (Artificial General Intelligence) is een hypothetisch type AI dat mensen overtreft of evenaart in vrijwel alle cognitieve taken. Het bestaat nog niet; de huidige taalmodellen zijn narrow AI: indrukwekkend op specifieke taken, maar zonder algemene redeneer- of leercapaciteit.
Er zijn twee kampen: een groep die urgentie ziet in de lange-termijnrisico's van steeds autonomere systemen, en een groep die de huidige concrete risico's — bias, misbruik, concentratie van macht — als urgenter beschouwt. Beide perspectieven zijn zinvol om te kennen.
Deze module zit in de cursus AI & de samenleving. Module 1 van AILogica is gratis.
Meer uit deze cursus: Bias en eerlijkheid · Privacy en jouw data · Deepfakes en desinformatie