Wat is een embedding? Uitleg zonder wiskunde
Cursussen › Cursus 2 · Hoe taal-AI denkt
Een embedding is de manier waarop een AI-model een woord (of een zin, beeld of geluid) omzet naar getallen: een lange rij coördinaten die de positie van dat woord bepaalt in een abstracte "ruimte van betekenis". Woorden die op elkaar lijken — zoals hond, kat en huisdier — komen in die ruimte dicht bij elkaar te liggen.
Dat is de sleutel tot waarom moderne taalmodellen zo goed met taal omgaan: niet omdat ze woorden "begrijpen", maar omdat ze betekenis hebben vertaald naar afstand en richting tussen punten. In deze module ontdek je stap voor stap hoe die landkaart ontstaat, waarom hij werkt, en waar het beeld tekortschiet.
In deze module leer je
- Hoe een woord een positie wordt in een betekenisruimte
- Waarom verwante woorden dicht bij elkaar liggen — en wat "afstand" hier betekent
- Hoe richtingen in die ruimte relaties vangen (en waarom dat lang niet altijd netjes klopt)
- Waarom dit statistiek over tekst is, geen echt begrip
Veelgestelde vragen
Een embedding is een woord (of zin, beeld of geluid) omgezet naar een rij getallen die een positie aangeven in een ruimte van betekenis. Verwante begrippen liggen daarin dicht bij elkaar.
Het model begrijpt niets in menselijke zin. Het leert uit enorme hoeveelheden tekst welke woorden in vergelijkbare contexten voorkomen, en plaatst die dicht bij elkaar. Nabijheid is een statistisch surrogaat voor betekenis.
Nee. Dat voorbeeld werkt in zorgvuldig gekozen gevallen (en alleen als je het startwoord uitsluit). Het is een illustratie van een idee, geen bewijs dat embeddings nette wiskunde volgen.
Deze module zit in de cursus Hoe taal-AI denkt. Module 1 van AILogica is gratis.
Meer uit deze cursus: Van GPT naar ChatGPT · Waarom hallucineert AI?