konzultace

Klasifikace algoritmů strojového učení: lineární regrese, klasifikace a shlukování

Strojové učení má velké podobnosti s matematickou optimalizací, která poskytuje metody, teorie a aplikační domény. 

Strojové učení je formulováno jako „problémy s minimalizací“ ztrátové funkce proti dané sadě příkladů (tréninková sada). Tato funkce vyjadřuje nesoulad mezi hodnotami předpovězenými modelem, který je školen, a očekávanými hodnotami pro každý příklad. 

Konečným cílem je naučit model schopnost správně předpovídat na souboru případů, které nejsou v tréninkové sadě přítomny.

Metodou, podle které je možné rozlišit různé kategorie algoritmu, je typ výstupu očekávaný od určitého systému strojové učení

Mezi hlavní kategorie najdeme:

  • La klasifikace: vstupy jsou rozděleny do dvou nebo více tříd a vzdělávací systém musí vytvořit model schopný přiřadit jednu nebo více tříd mezi ty, které jsou k dispozici pro vstup.Tyto typy úkolů se obvykle řeší pomocí technik učení pod dohledem. 

    Příkladem klasifikace je přiřazení jednoho nebo více štítků k obrazu na základě objektů nebo předmětů v něm obsažených;

  • La regrese: koncepčně podobné klasifikaci s tím rozdílem, že výstup má spojitou a nespojitou doménu.Obvykle se to řídí učením pod dohledem. 

    Příkladem regrese je odhad hloubky scény z její reprezentace ve formě barevného obrazu. 

    Ve skutečnosti je doména dotyčného výstupu prakticky nekonečná a neomezuje se na určitý diskrétní soubor možností;

  • Il Shlukování: kde to je soubor dat je rozdělen do skupin, které však na rozdíl od klasifikace nejsou apriorně známy.Samotná povaha problémů, které patří do této kategorie, z nich obvykle činí nedohledávané vzdělávací úkoly.
Jednoduchý lineární regresní model

Lineární regrese je amširoce používaný model používaný k odhadu reálných hodnot, jako například:

  • náklady na domy,
  • počet hovorů,
  • celkový prodej na osobu,

a následuje kritérium spojitých proměnných:

  • metrů čtverečních,
  • přihlášení k běžnému účtu,
  • vzdělání osoby

V lineární regresi je vztah mezi nezávislými proměnnými a závislými proměnnými sledován přímkou, která obvykle představuje vztah mezi těmito dvěma proměnnými.

Přizpůsobovací čára je známá jako regresní přímka a je reprezentována lineární rovnicí typu Y = a * X + b.

Vzorec je založen na interpolačních datech, aby se k sobě spojily dvě nebo více charakteristik. Když zadáte algoritmu vstupní charakteristiku, regrese vrátí druhou charakteristiku.

Více lineární regresní model

Když máme více než jednu nezávislou proměnnou, mluvíme o vícenásobné lineární regresi, za předpokladu modelu jako je tento:


y = b.0 + B1x1 + B2x2 +… + Bnxn

  • y je odezva na hodnoty, to znamená, že představuje výsledek předpovídaný modelem;
  • b0 je přestávka, to je hodnota y, když xi všechny jsou rovny 0;
  • první charakteristika b1 je koeficient x1;
  • ještě další rys bn je koeficient xn;
  • x1,x2,…, Xn jsou nezávislé proměnné modelu.

V podstatě rovnice vysvětluje vztah mezi spojitou závislou proměnnou (y) a dvěma nebo více nezávislými proměnnými (x1, x2, x3…). 

Pokud bychom například chtěli odhadnout emise CO2 z automobilu (závislá proměnná y) s ohledem na výkon motoru, počet válců a spotřebu paliva. Posledně jmenované faktory jsou nezávislé proměnné x1, x2 a x3. Konstanty bi jsou reálná čísla a nazývají se odhadované regresní koeficienty modelu. Y je spojitá závislá proměnná, tj. Je součet b0, b1 x1, b2 x2 atd. y bude skutečné číslo.

Analýza více regresí je metoda používaná k identifikaci účinku nezávislých proměnných na závislou proměnnou.

Pochopení toho, jak se závislá proměnná mění s tím, jak se mění nezávislé proměnné, nám umožňuje předpovídat účinky nebo dopady změn v reálných situacích.

Použitím vícenásobné lineární regrese je možné pochopit, jak se mění krevní tlak s tím, jak se mění index tělesné hmotnosti, s přihlédnutím k faktorům, jako je věk, pohlaví atd., A tedy za předpokladu, co by se mohlo stát.

S vícenásobnou regresí můžeme získat odhady cenových trendů, jako je budoucí trend ropy nebo zlata.

Konečně, vícenásobná lineární regrese nachází větší zájem v oblasti strojového učení a umělé inteligence, protože umožňuje získat prováděcí modely učení i v případě velkého počtu analyzovaných záznamů.

Logistický regresní model

Logistická regrese je statistický nástroj, jehož cílem je modelovat binomický výsledek s jednou nebo více vysvětlujícími proměnnými.

Obvykle se používá pro binární problémy, kde existují pouze dvě třídy, například Ano nebo Ne, 0 nebo 1, muž nebo žena atd ...

Tímto způsobem je možné popsat data a vysvětlit vztah mezi binární závislou proměnnou a jednou nebo více nominálními nebo ordinálně nezávislými proměnnými.

Výsledek je určen díky využití logistické funkce, která odhadne pravděpodobnost a následně defikončí třída nejbližší (kladná nebo záporná) k získané hodnotě pravděpodobnosti.

Logistickou regresi můžeme považovat za metodu klasifikace rodiny dohlížející algoritmy učení.

Pomocí statistických metod umožňuje logistická regrese generovat výsledek, který ve skutečnosti představuje pravděpodobnost, že daná vstupní hodnota patří do dané třídy.

V binomických logistických regresních problémech bude pravděpodobnost, že výstup patří do jedné třídy, P, zatímco že patří do druhé třídy 1-P (kde P je číslo mezi 0 a 1, protože vyjadřuje pravděpodobnost).

Binomická logistická regrese funguje dobře ve všech případech, ve kterých proměnná, kterou se snažíme předpovídat, je binární, to znamená, že může předpokládat pouze dvě hodnoty: hodnotu 1, která představuje kladnou třídu, nebo hodnotu 0, která představuje zápornou třídu.

Příklady problémů, které lze vyřešit logistickou regresí, jsou:

  • e-mail je spam nebo ne;
  • online nákup je podvodný nebo ne, vyhodnocuje podmínky nákupu;
  • pacient má zlomeninu, vyhodnocuje jeho poloměry.

S logistickou regresí můžeme provádět prediktivní analýzu, která měří vztah mezi tím, co chceme predikovat (závislá proměnná) a jednou nebo více nezávislými proměnnými, tj. Charakteristikami. Odhad pravděpodobnosti se provádí pomocí logistické funkce.

Pravděpodobnosti jsou následně transformovány do binárních hodnot, a aby se předpověď stala skutečností, je tento výsledek přiřazen ke třídě, do níž náleží, na základě toho, zda je nebo není blízko samotné třídě.

Například pokud aplikace logistické funkce vrátí 0,85, znamená to, že vstup vygeneroval kladnou třídu přiřazením ke třídě 1. Naopak, pokud by získal hodnotu jako 0,4 nebo obecněji <0,5 ..

Inovační zpravodaj
Nenechte si ujít nejdůležitější novinky o inovacích. Přihlaste se k jejich odběru e-mailem.

Logistická regrese používá logistickou funkci k vyhodnocení klasifikace vstupních hodnot.

Logistická funkce, nazývaná také sigmoid, je křivka schopná vzít libovolný počet reálných hodnot a mapovat je na hodnotu mezi 0 a 1, s vyloučením extrémů. Funkce je:

kde to je:

  • e: základ přirozených logaritmů (Eulerovo číslo nebo excel funkce exp ())
  • b0 + b1 * x: je skutečná číselná hodnota, kterou chcete transformovat.

Reprezentace použitá pro logistickou regresi

Logistická regrese používá rovnici jako reprezentaci, podobně jako lineární regrese

Vstupní hodnoty (x) jsou lineárně kombinovány pomocí hmotností nebo hodnot koeficientů, aby se předpovídala výstupní hodnota (y). Klíčový rozdíl od lineární regrese spočívá v tom, že modelovaná výstupní hodnota je binární hodnota (0 nebo 1), nikoli číselná hodnota.

Zde je příklad logistické regresní rovnice:

y = e^(b0 + b1 * x) / (1 + e^(b0 + b1 * x))

Kde:

  • y je závislá proměnná, tj. predikovaná hodnota;
  • b0 je polarizační nebo zachycovací člen;
  • b1 je koeficient pro jednu vstupní hodnotu (x).

Každý sloupec ve vstupních datech má přiřazený koeficient b (konstantní skutečná hodnota), který je třeba se naučit z tréninkových dat.

Skutečná reprezentace modelu, který byste uložili do paměti nebo do souboru, jsou koeficienty v rovnici (hodnota beta nebo b).

Logistická regrese předpovídá pravděpodobnosti (technický rozsah)

Logistická regrese modeluje pravděpodobnost výchozí třídy.

Předpokládejme například, že modelujeme pohlaví lidí jako muže nebo ženu z jejich výšky, první třídou může být muž a logistický regresní model lze psát jako pravděpodobnost, že muž bude mít výšku člověka nebo více. formálně:

P (sex = muž | výška)

Jinak řečeno, modelujeme pravděpodobnost, že vstup (X) patří do třídy predefinite (Y = 1), můžeme to napsat jako:

P (x) = p (y = 1 | x)

Predikce pravděpodobnosti musí být transformována do binárních hodnot (0 nebo 1), aby mohla být skutečně vytvořena předpověď pravděpodobnosti.

Logistická regrese je lineární metoda, ale předpovědi jsou transformovány pomocí logistické funkce. Dopad tohoto je to, že už nemůžeme chápat předpovědi jako lineární kombinaci vstupů, jak můžeme s lineární regresí, například při pokračování shora, model lze vyjádřit jako:

p (X) = e ^ (b + b0 * X) / (1 + e ^ (b + b1 * X))

Nyní můžeme vrátit rovnici následujícím způsobem. K jeho obrácení můžeme přistoupit odstraněním e na jedné straně přidáním přirozeného logaritmu na druhé straně.

ln (p (X) / 1 - p (X)) = bl + b0 * X

Tímto způsobem získáme skutečnost, že výpočet výstupu vpravo je opět lineární (stejně jako lineární regrese) a vstup vlevo je logaritmus pravděpodobnosti výchozí třídy.

Pravděpodobnosti se počítají jako poměr pravděpodobnosti události dělený pravděpodobností žádné události, např. 0,8 / (1-0,8), jehož výsledek je 4. Takže bychom mohli místo toho napsat:

ln (kurzy) = b0 + b1 * X

Protože pravděpodobnosti jsou log-transformovány, nazýváme to levostranné log-kurzy nebo probit.

Můžeme vrátit exponent doprava a napsat jako:

pravděpodobnost = e ^ (b0 + b1 * X)

To vše nám pomáhá pochopit, že model je skutečně stále lineární kombinací vstupů, ale že tato lineární kombinace odkazuje na logaritmické pravděpodobnosti předtřídy.definita.

Seznámení s logistickým regresním modelem

Koeficienty (hodnoty beta nebo b) algoritmu logistické regrese se odhadují ve fázi učení. K tomu používáme odhad maximální pravděpodobnosti.

Odhad maximální pravděpodobnosti je algoritmus učení používaný několika algoritmy strojového učení. Koeficienty vyplývající z modelu predikují hodnotu velmi blízkou 1 (např. muž) pro předškolní třídudefinite a hodnotu velmi blízkou 0 (např. žena) pro druhou třídu. Maximální pravděpodobnost pro logistickou regresi je postup hledání hodnot pro koeficienty (hodnoty Beta nebo ob), které minimalizují chybu v pravděpodobností předpovězených modelem vzhledem k pravděpodobnosti v datech (např. pravděpodobnost 1, pokud jsou data primární třídou) .

K optimalizaci nejlepších hodnot koeficientů pro tréninková data použijeme algoritmus minimalizace. To se v praxi často provádí pomocí efektivního algoritmu numerické optimalizace.

Ercole Palmeri


Inovační zpravodaj
Nenechte si ujít nejdůležitější novinky o inovacích. Přihlaste se k jejich odběru e-mailem.

Nedávné články

Budoucnost je tady: Jak lodní průmysl revolucionizuje globální ekonomiku

Námořní sektor je skutečnou globální ekonomickou velmocí, která se dostala na 150miliardový trh...

1. května 2024

Vydavatelé a OpenAI podepisují dohody o regulaci toku informací zpracovávaných umělou inteligencí

Minulé pondělí Financial Times oznámily dohodu s OpenAI. FT licencuje svou prvotřídní žurnalistiku…

30. dubna 2024

Online platby: Zde je návod, jak vám streamovací služby umožňují platit navždy

Miliony lidí platí za streamovací služby a platí měsíční předplatné. Je obecný názor, že jste…

29. dubna 2024

Veeam nabízí nejkomplexnější podporu pro ransomware, od ochrany po reakci a obnovu

Společnost Coveware od společnosti Veeam bude i nadále poskytovat služby reakce na incidenty v oblasti kybernetického vydírání. Coveware nabídne forenzní a sanační schopnosti…

23. dubna 2024