Deep Learning

Hluboké učení je pokročilá metoda umělé inteligence, která využívá neuronové sítě s mnoha vrstvami ke zpracování dat. Díky této hluboké struktuře se systém dokáže postupně učit stále složitější a abstraktnější vlastnosti z velkého množství informací.1 Tento přístup umožňuje řešit komplexní úlohy, které byly pro starší metody příliš náročné, jako je přesné rozpoznávání objektů v obrazech nebo plynulý překlad mezi jazyky.2

Zjednodušeně řečeno, hluboké učení funguje jako učení ve vrstvách.3 Představte si, že učíte počítač rozpoznat kočku. V první vrstvě se naučí identifikovat základní tvary, jako jsou hrany a rohy. V další vrstvě tyto tvary spojí do složitějších celků, například očí nebo uší. V ještě hlubších vrstvách pak skládá tyto části dohromady, dokud není schopen rozpoznat celou kočku.4 Právě tato „hloubka“ mu umožňuje chápat data podobně jako člověk.5


Hluboké učení (angl. deep learning)

Odborná definice: Hluboké učení je podkategorií strojového učení založenou na umělých neuronových sítích s více skrytými vrstvami, označovaných jako hluboké neuronové sítě (Deep Neural Networks, DNN).6 Charakteristickým rysem je hierarchické učení reprezentací dat.7 Zatímco první vrstvy sítě extrahují z dat nízkoúrovňové rysy (např. hrany v obraze), každá následující vrstva se učí abstraktnější a komplexnější rysy na základě výstupů z vrstvy předchozí.8 K tréninku těchto sítí se typicky využívá algoritmus zpětného šíření chyby (backpropagation) a velké objemy dat (big data).9 Přítomnost mnoha vrstev umožňuje modelu zachytit velmi složité a nelineární vztahy v datech.10

Etymologie a kontext: Termín „hluboké“ se vztahuje k počtu (hloubce) vrstev v neuronové síti – sítě s jednotkami (od tří) až stovkami vrstev jsou považovány za hluboké. Ačkoliv teoretické základy existují již od 80. let 20. století, k masivnímu rozvoji hlubokého učení došlo až po roce 2010 díky dostupnosti velkých datových sad a výraznému nárůstu výpočetního výkonu, zejména s využitím grafických procesorových jednotek (GPU). Hluboké učení je dnes dominantním přístupem v oblastech, jako je počítačové vidění (např. detekce objektů, segmentace obrazu), zpracování přirozeného jazyka (strojový překlad, generování textu) a rozpoznávání řeči.