Hluboké učení

Deep learning

Hluboké učení je pokročilá forma strojového učení, která využívá neuronové sítě s mnoha vrstvami. Tyto sítě, známé jako hluboké neuronové sítě, jsou schopné analyzovat obrovské množství dat a automaticky v nich rozpoznávat složité vzory a hierarchické struktury. Každá vrstva neuronů v síti se učí rozpoznávat specifické rysy – od jednoduchých, jako jsou hrany a barvy v obrázku, až po komplexní, jako jsou celé objekty nebo tváře. Tento proces umožňuje dosahovat vysoké přesnosti v úlohách, jako je rozpoznávání řeči, překlad jazyků a autonomní řízení.

Zjednodušeně si hluboké učení můžete představit jako trénování velmi výkonného „mozku“ počítače. Místo toho, aby se učil z několika příkladů, projde miliony dat, třeba fotek zvířat. První vrstva se naučí rozpoznat jen základní linky a tvary. Další vrstva na to naváže a naučí se rozpoznat srst, oči nebo uši. Poslední vrstvy už dokáží všechny tyto dílčí informace složit dohromady a s vysokou jistotou určit, že na obrázku je kočka, a ne pes. Je to jako učení krok za krokem, od nejmenšího detailu až po celkový obraz.


Hluboké učení (angl. deep learning)

Odborná definice: Hluboké učení je podkategorií strojového učení založená na umělých neuronových sítích s více skrytými vrstvami (tzv. hluboké neuronové sítě, deep neural networks). Charakteristickým rysem je hierarchické učení reprezentací dat. Zatímco první vrstvy sítě extrahují z dat nízkoúrovňové rysy (např. hrany v obraze), každá následující vrstva kombinuje výstupy té předchozí a učí se abstraktnější a komplexnější reprezentace (např. textury, části objektů, celé objekty). K tréninku těchto modelů se využívají algoritmy jako zpětné šíření chyby (backpropagation) a optimalizační metody (např. gradientní sestup) na rozsáhlých datových souborech. Mezi typické architektury patří konvoluční neuronové sítě (CNN) pro zpracování obrazu a rekurentní neuronové sítě (RNN) pro sekvenční data.

Etymologie a kontext: Termín „hluboké“ (deep) odkazuje na počet vrstev v neuronové síti – sítě s více než jednou skrytou vrstvou jsou považovány za hluboké. Přestože myšlenky vrstvených modelů existovaly již dříve, pojem „deep learning“ zpopularizovali Geoffrey Hinton a další výzkumníci kolem roku 2006. Rozmach oboru v posledním desetiletí byl umožněn dostupností velkých objemů dat (big data) a významným nárůstem výpočetního výkonu, zejména díky grafickým procesorovým jednotkám (GPU). Hluboké učení dnes dominuje v mnoha oblastech umělé inteligence a nachází uplatnění v počítačovém vidění, zpracování přirozeného jazyka, autonomních systémech a bioinformatice.