AI-veiligheid en alignment: wat is het risico van AGI?

CursussenCursus 7 · AI & de samenleving

AI-alignment gaat over de vraag of een AI-systeem doet wat mensen werkelijk bedoelen — niet alleen wat er letterlijk staat opgeschreven. Een systeem dat zijn doel maximaliseert op een manier die niemand voorzag, is misaligned: het volgt de instructie, maar mist de menselijke bedoeling. Dat is al zichtbaar in kleine voorbeelden van hedendaagse modellen, en de zorg groeit naarmate AI-systemen autonomer worden.

Onderzoekers in het veld van AI-safety bestuderen hoe je systemen ontwerpt die ook bij toenemende autonomie betrouwbaar blijven. AGI — artificial general intelligence, een hypothetisch systeem dat mensen overtreft in vrijwel alle cognitieve taken — is het meest besproken scenario, al bestaat het nog niet. In deze module leer je wat alignment is, waarom het lastig is, en hoe het debat eruitziet.

In deze module leer je

Onderdeel van AI & de samenleving · vanaf €49 Volg deze les →

Veelgestelde vragen

Wat is AI-alignment?

Alignment is de mate waarin een AI-systeem doet wat mensen werkelijk willen — niet alleen wat er formeel is opgegeven. Een misaligned systeem kan zijn doel bereiken op manieren die schadelijk of ongewenst zijn, zonder dat het programma technisch "fout" is.

Wat is AGI?

AGI (Artificial General Intelligence) is een hypothetisch type AI dat mensen overtreft of evenaart in vrijwel alle cognitieve taken. Het bestaat nog niet; de huidige taalmodellen zijn narrow AI: indrukwekkend op specifieke taken, maar zonder algemene redeneer- of leercapaciteit.

Moeten we ons nu al zorgen maken over AI-veiligheid?

Er zijn twee kampen: een groep die urgentie ziet in de lange-termijnrisico's van steeds autonomere systemen, en een groep die de huidige concrete risico's — bias, misbruik, concentratie van macht — als urgenter beschouwt. Beide perspectieven zijn zinvol om te kennen.

Wil je dit écht snappen?
Deze module zit in de cursus AI & de samenleving. Module 1 van AILogica is gratis.
Bekijk de cursussen

Meer uit deze cursus: Bias en eerlijkheid · Privacy en jouw data · Deepfakes en desinformatie