Neuron

Umělý neuron je základní výpočetní jednotka neuronové sítě, inspirovaná funkcí biologických neuronů v mozku. Jeho úkolem je přijmout jeden nebo více vstupních signálů, zpracovat je a poslat výstupní signál dál. Každý vstup má přiřazenou váhu, která určuje jeho důležitost. Neuron sečte všechny tyto vážené vstupy a na výsledek aplikuje aktivační funkci. Ta rozhodne, zda a s jakou intenzitou bude signál předán dalším neuronům v síti.

Zjednodušeně si lze umělý neuron představit jako malého rozhodovacího úředníka. Tento úředník dostane několik informací (vstupů), přičemž každá má jinou důležitost (váhu). Na základě součtu těchto zvážených informací se pak rozhodne, jestli je zpráva natolik podstatná, aby ji poslal dál svému nadřízenému. Celá neuronová síť je pak jako velká firma plná takových úředníků, kteří si vzájemně předávají informace, aby společně dospěli ke konečnému rozhodnutí.

Odborná definice: Umělý neuron je matematická funkce, která představuje základní stavební prvek umělých neuronových sítí. Jedná se o model inspirovaný biologickým neuronem. Neuron přijímá množinu vstupních hodnot x1,x2,…,xn, kde každému vstupu xi je přiřazena synaptická váha wi. V těle neuronu dojde k výpočtu váženého součtu vstupů, často s přičtením prahové hodnoty (bias, b). Výsledná hodnota, tzv. vnitřní potenciál, je následně transformována aktivační funkcí ϕ. Ta určí výstupní hodnotu neuronu y=ϕ(∑i=1nwixi+b). Aktivační funkce může být lineární i nelineární (např. skoková, sigmoidální, ReLU) a zásadně ovlivňuje výpočetní schopnosti sítě.

Etymologie a kontext: Název je přímou analogií k biologickému neuronu, jehož funkci se snaží zjednodušeně napodobit. Vstupy modelu odpovídají dendritům, váhy reprezentují synaptickou sílu, tělo neuronu provádí sumaci a axon s aktivační funkcí rozhoduje o přenosu signálu. První formální model neuronu, známý jako McCulloch-Pitts neuron, byl představen v roce 1943. Dnes jsou umělé neurony, uspořádané do složitých architektur (vrstev), klíčovým prvkem pro algoritmy strojového učení a hlubokého učení (deep learning), kde umožňují řešit úlohy jako klasifikace, regrese a rozpoznávání vzorů.

Související články