Logistická Regrese je statistická metoda a jeden ze základních algoritmů strojového učení, který se používá pro klasifikační úlohy. Navzdory svému názvu tedy neslouží k regresi (předpovídání spojité hodnoty), ale k předpovídání pravděpodobnosti, že daný vstupní bod patří do určité kategorie.
Jak logistická Regrese funguje
Jádrem logistické Regrese je logistická funkce, známá také jako sigmoidní funkce sigmoid 𝑓(𝑥) = 1/(1+e⁻ˣ). Tato funkce má charakteristický tvar písmene „S“ a jakýkoli vstup převede na výstup v rozmezí od 0 do 1. Tento výstup lze interpretovat jako pravděpodobnost.
Proces probíhá ve dvou hlavních krocích:
- Výpočet skóre: Model nejprve spočítá vážený součet vstupních rysů, podobně jako u lineární Regrese. Výsledkem je jedno číslo, které může být libovolně velké nebo malé.
- Aplikace logistické funkce: Toto číslo se vloží do logistické funkce, která ho „stlačí“ do intervalu (0, 1). Výsledkem je pravděpodobnost.
Pro finální rozhodnutí se použije hraniční hodnota (threshold), obvykle 0.5. Pokud je vypočítaná pravděpodobnost vyšší než 0.5, datový bod je zařazen do třídy 1 (např. „spam“). Pokud je nižší, patří do třídy 0 (např. „ne-spam“).
Typy logistické Regrese
Podle počtu a povahy kategorií rozlišujeme tři hlavní typy:
- Binární logistická Regrese: Nejběžnější typ, který řeší problémy se dvěma možnými výsledky (Ano/Ne, Pravda/Nepravda).
- Příklad: Předpověď, zda zákazník splatí úvěr, nebo nesplatí.
- Multinomiální logistická Regrese: Používá se pro problémy s více než dvěma kategoriemi, které na sobě nejsou závislé a nemají žádné přirozené uspořádání.
- Příklad: Klasifikace„>Klasifikace obrázku zvířete do kategorií pes, kočka, nebo pták.
- Ordinální logistická Regrese: Využívá se v situacích, kde existuje více než dvě kategorie, které ale mají smysluplné uspořádání nebo pořadí.
- Příklad: Hodnocení spokojenosti zákazníka na škále nízká, střední, vysoká.
Výhody a nevýhody
Logistická Regrese je i přes existenci pokročilejších metod stále velmi populární, a to z několika důvodů.
Výhody
- Jednoduchost a rychlost: Je výpočetně velmi efektivní, rychlá na trénování a nevyžaduje velké množství zdrojů.
- Interpretovatelnost: Výsledky modelu jsou snadno pochopitelné. Je možné přesně vidět, jaký vliv (váhu) má každý vstupní rys na konečný výsledek, což je klíčové v oblastech jako medicína nebo finance.
- Dobrá jako základní model: Díky své jednoduchosti slouží jako skvělý výchozí bod (baseline) pro testování a porovnávání s komplexnějšími modely.
Nevýhody
- Předpoklad linearity: Model předpokládá, že mezi vstupními rysy a výsledkem existuje lineární vztah. Pokud je vztah složitý a nelineární, výkon modelu může být slabý.
- Náchylnost na odlehlé hodnoty: Extrémní hodnoty (outliery) v datech mohou významně ovlivnit výsledky.
- Omezený výkon: Na složitých problémech, jako je rozpoznávání obrazu, obvykle nedosahuje takové přesnosti jako pokročilejší modely (např. neuronové sítě).