Tekst-naar-spraak (TTS) — wat is het?

← AI-begrippenlijst

Tekst-naar-spraak (TTS) — Tekst-naar-spraak zet geschreven tekst om naar gesproken audio en produceert tegenwoordig stemmen die nauwelijks van echt te onderscheiden zijn.

Vroege TTS-systemen klonken robotachtig; moderne neurale modellen produceren vloeiende, expressieve spraak inclusief pauzes, intonatie en emotie. Ze kunnen worden gekloond op basis van enkele seconden voorbeeldgeluid. Toepassingen zijn audioboeken, spraakassistenten, toegankelijkheidstools en — met groeiende zorgen — stem-deepfakes. De kwaliteitssprong van de afgelopen jaren heeft de technologie toegankelijker maar ook riskanter gemaakt.

Verder lezen: Spraak: hoe AI luistert en praat

Bekijk de cursussen Lees module 1 gratis