Latentní prostor

Latentní prostor je v kontextu strojového učení abstraktní, vícedimenzionální prostor, který slouží jako komprimovaná reprezentace komplexních dat. Tento prostor není přímo pozorovatelný, ale je naučen neuronovou sítí, typicky enkodérem, který mapuje vysokodimenzionální vstupní data (například obrázek nebo zvuk) do jediného bodu neboli vektoru v tomto prostoru. Hlavní vlastností latentního prostoru je jeho organizace – sémanticky podobné vstupy jsou v něm reprezentovány body, které leží blízko sebe. Tato struktura odhaluje skryté vztahy v datech a umožňuje nejen efektivní redukci dimenzionality, ale i generování nových datových vzorků.


Představte si obrovskou sbírku fotografií lidských tváří. Místo toho, aby si je počítač pamatoval pixel po pixelu, vytvoří si pro ně jakousi přehlednou „mapu“. Latentní prostor je přesně taková chytrá mapa. Každá tvář na ní dostane své vlastní souřadnice. Model se naučí mapu uspořádat tak, aby fotografie podobných tváří (například usmívajících se žen s brýlemi) ležely na mapě blízko sebe. Díky tomu může model nejen porovnávat podobnost, ale dokonce i tvořit nové tváře – jednoduše tím, že si na mapě vybere dosud neobsazené místo a podívá se, jaká tvář by tam logicky měla vzniknout.