Wat is een embedding? Uitleg zonder wiskunde

Cursussen › Cursus 2 · Hoe taal-AI denkt

Een embedding is de manier waarop een AI-model een woord (of een zin, beeld of geluid) omzet naar getallen: een lange rij coördinaten die de positie van dat woord bepaalt in een abstracte "ruimte van betekenis". Woorden die op elkaar lijken — zoals hond, kat en huisdier — komen in die ruimte dicht bij elkaar te liggen.

Dat is de sleutel tot waarom moderne taalmodellen zo goed met taal omgaan: niet omdat ze woorden "begrijpen", maar omdat ze betekenis hebben vertaald naar afstand en richting tussen punten. In deze module ontdek je stap voor stap hoe die landkaart ontstaat, waarom hij werkt, en waar het beeld tekortschiet.

In deze module leer je

Hoe een woord een positie wordt in een betekenisruimte
Waarom verwante woorden dicht bij elkaar liggen — en wat "afstand" hier betekent
Hoe richtingen in die ruimte relaties vangen (en waarom dat lang niet altijd netjes klopt)
Waarom dit statistiek over tekst is, geen echt begrip

Onderdeel van Hoe taal-AI denkt · vanaf €39 Volg deze les →

Veelgestelde vragen

Wat is een embedding in AI?

Een embedding is een woord (of zin, beeld of geluid) omgezet naar een rij getallen die een positie aangeven in een ruimte van betekenis. Verwante begrippen liggen daarin dicht bij elkaar.

Hoe "begrijpt" een AI woorden via embeddings?

Het model begrijpt niets in menselijke zin. Het leert uit enorme hoeveelheden tekst welke woorden in vergelijkbare contexten voorkomen, en plaatst die dicht bij elkaar. Nabijheid is een statistisch surrogaat voor betekenis.

Werkt het beroemde "koning − man + vrouw = koningin" altijd?

Nee. Dat voorbeeld werkt in zorgvuldig gekozen gevallen (en alleen als je het startwoord uitsluit). Het is een illustratie van een idee, geen bewijs dat embeddings nette wiskunde volgen.

Wil je dit écht snappen?
Deze module zit in de cursus Hoe taal-AI denkt. Module 1 van AILogica is gratis.

Bekijk de cursussen

Meer uit deze cursus: Van GPT naar ChatGPT · Waarom hallucineert AI?