oppitunti

Koneoppimisen algoritmien luokittelu: Lineaarinen regressio, luokittelu ja ryhmittely

Koneoppimisella on suuria yhtäläisyyksiä matemaattisen optimoinnin kanssa, joka tarjoaa menetelmiä, teorioita ja sovellusalueita.

Koneoppiminen on muotoiltu häviöfunktion "minimointiongelmiksi" tiettyyn esimerkkijoukkoon nähden (harjoittelujoukko). Tämä ominaisuus ilmaisee eroa koulutettavan mallin ennustamien arvojen ja kussakin esimerkissä odotettavissa olevien arvojen välillä.

Perimmäisenä tavoitteena on opettaa mallille kyky ennustaa oikein tapauksille, joita ei ole harjoitusjoukossa.

Menetelmä, jonka mukaan on mahdollista erottaa eri algoritmikategoriat, on tietyltä järjestelmältä odotettavissa olevan tulosteen tyyppi. koneoppiminen.

Tärkeimmistä kategorioista löydämme:

La luokitus: sisääntulot jaetaan kahteen tai useampaan luokkaan ja oppimisjärjestelmän on tuotettava malli, joka kykenee osoittamaan yhden tai useamman luokan syötteen käytettävissä olevien luokkien joukkoon.Tämän tyyppiset tehtävät hoidetaan tyypillisesti ohjatulla oppimistekniikalla.
Esimerkki luokituksesta on yhden tai useamman tarran osoittaminen kuvalle sen sisältämien esineiden tai aiheiden perusteella;
La regressio: käsitteellisesti samanlainen kuin luokittelu sillä erolla, että lähdöllä on jatkuva ja ei-diskreetti alue.Sitä hoidetaan tyypillisesti ohjatulla oppimisella.
Esimerkki regressiosta on kohtauksen syvyyden arviointi sen esityksestä värikuvan muodossa.

Itse asiassa kyseessä olevan tuotoksen alue on käytännössä ääretön eikä rajoitu tiettyyn erilliseen mahdollisuuksien joukkoon;
Il klustereiden: missä se on tietoryhmä on jaettu ryhmiin, joita, toisin kuin luokitusta, ei kuitenkaan tunneta etukäteen.Tähän luokkaan kuuluvien ongelmien luonne tekee niistä tyypillisesti valvomattomia oppimistehtäviä.

Yksinkertainen lineaarinen regressiomalli

Lineaarinen regressio on amlaajalti käytetty malli, jota käytetään todellisten arvojen arviointiin, kuten:

talojen kustannukset,
puhelujen määrä,
kokonaismyynti per henkilö,

ja seuraa jatkuvien muuttujien kriteeriä:

neliömetriä,
tilaaminen tilille,
henkilön koulutus

Lineaarisessa regressiossa riippumattomien muuttujien ja riippuvien muuttujien välistä suhdetta seurataan linjan kautta, joka yleensä edustaa kahden muuttujan välistä suhdetta.

Sovituslinja tunnetaan regressioviivana ja sitä edustaa tyypin Y = a * X + b lineaarinen yhtälö.

Kaava perustuu tietojen interpolointiin kahden tai useamman ominaisuuden yhdistämiseksi toisiinsa. Kun annat algoritmille syöteominaisuuden, regressio palauttaa toisen ominaisuuden.

Useita lineaarisia regressiomalleja

Kun meillä on enemmän kuin yksi riippumaton muuttuja, puhumme useasta lineaarisesta regressiosta olettaen seuraavan mallin:

y=b₀ + B₁x₁ + B₂x₂ +… + B_nx_n

y on vastaus arvoihin, ts. se edustaa mallin ennustamaa tulosta;
b₀ on leikkaus, eli y: n arvo, kun x_ine kaikki ovat yhtä kuin 0;
ensimmäinen ominaisuus b₁ on kerroin x₁;
vielä yksi ominaisuus b_n on kerroin x_n;
x₁,x₂,…, X_n ovat mallin riippumattomia muuttujia.

Pohjimmiltaan yhtälö selittää jatkuvasti riippuvan muuttujan (y) ja kahden tai useamman riippumattoman muuttujan (x1, x2, x3…) välisen suhteen.

Jos esimerkiksi haluaisimme arvioida auton hiilidioksidipäästöt (riippuvainen muuttuja y) moottorin tehon, sylinterien lukumäärän ja polttoaineen kulutuksen perusteella. Viimeksi mainitut tekijät ovat riippumattomia muuttujia x2, x1 ja x2. Vakiot bi ovat reaalilukuja ja niitä kutsutaan mallin estimoiduiksi regressiokertoimiksi.Y on jatkuvasti riippuvainen muuttuja, ts. Se on arvojen b3, b0 x1, b1 x2 jne. y on todellinen luku.

Moninkertainen regressioanalyysi on menetelmä, jota käytetään tunnistamaan vaikutus, joka riippumattomilla muuttujilla on riippuvaiseen muuttujaan.

Ymmärtäminen, kuinka riippuvainen muuttuja muuttuu riippumattomien muuttujien muuttuessa, antaa meille mahdollisuuden ennustaa muutosten vaikutuksia tai vaikutuksia todellisissa tilanteissa.

Useita lineaarisia regressioita käyttämällä on mahdollista ymmärtää kuinka verenpaine muuttuu kehon massaindeksin muuttuessa ottaen huomioon tekijät, kuten ikä, sukupuoli jne., Olettaen siten, mitä voisi tapahtua.

Usean regression avulla voimme saada arvioita hintakehityksestä, kuten öljyn tai kullan tulevaisuuden kehityksestä.

Viimeinkin moninkertaisella lineaarisella regressiolla on enemmän kiinnostusta koneoppimiseen ja tekoälyyn, koska sen avulla voidaan saada suorittavia oppimismalleja, jopa silloin, kun on olemassa suuri määrä analysoitavia tietueita.

Logistinen regressiomalli

Logistinen regressio on tilastollinen työkalu, jonka tavoitteena on mallintaa binomitulos yhdellä tai useammalla selittävällä muuttujalla.

Sitä käytetään yleensä binaarisiin ongelmiin, joissa on vain kaksi luokkaa, esimerkiksi Kyllä tai Ei, 0 tai 1, mies tai nainen jne. ...

Tällä tavalla on mahdollista kuvata data ja selittää binääri-riippuvaisen muuttujan ja yhden tai useamman nimellisen tai ordinaalisen riippumattoman muuttujan välinen suhde.

Tulos määräytyy logistisen funktion avulla, joka arvioi todennäköisyyden ja sitten defipäättää lähimmän luokan (positiivinen tai negatiivinen) saatua todennäköisyysarvoa.

Voimme pitää logistista taantumista menetelmänä luokittelemaan ohjatut oppimisalgoritmit.

Tilastollisia menetelmiä käyttämällä logistinen regressio antaa mahdollisuuden tuottaa tuloksen, joka itse asiassa edustaa todennäköisyyttä, että annettu syötearvo kuuluu tiettyyn luokkaan.

Binomisissa logistisissa regressio-ongelmissa todennäköisyys, että lähtö kuuluu johonkin luokkaan, on P, kun taas se kuuluu toiseen luokkaan 1-P (missä P on luku välillä 0 ja 1, koska se ilmaisee todennäköisyyden).

Binomilogistinen regressio toimii hyvin kaikissa niissä tapauksissa, joissa muuttuja, jota yritämme ennustaa, on binaarinen, ts. Se voi olettaa vain kaksi arvoa: arvo 1, joka edustaa positiivista luokkaa, tai arvo 0, joka edustaa negatiivista luokkaa.

Esimerkkejä ongelmista, jotka voidaan ratkaista logistisella regressiolla, ovat:

sähköposti on roskapostia vai ei;
verkkokauppa on vilpillinen tai ei, arvioi osto-olosuhteet;
potilaalla on murtuma, arvioidessaan sen säteet.

Logistisella regressiolla voimme tehdä ennustavan analyysin, mittaamalla ennustettavan (riippuvainen muuttuja) ja yhden tai useamman riippumattoman muuttujan, ts. Ominaisuuksien, suhdetta. Todennäköisyyden arviointi suoritetaan logistisen funktion avulla.

Todennäköisyydet muutetaan myöhemmin binaariarvoiksi, ja ennusteen tekemiseksi todelliseksi tämä tulos osoitetaan luokkaan, johon se kuuluu, sen perusteella, onko se lähellä luokkaa.

Esimerkiksi, jos logistisen funktion sovellus palauttaa arvon 0,85, se tarkoittaa, että tulo on luonut positiivisen luokan osoittamalla sen luokalle 1. Käänteisesti, jos se olisi saanut arvon, kuten 0,4 tai yleisemmin <0,5 ..

Logistinen regressio käyttää logistista toimintoa tuloarvojen luokituksen arvioimiseen.

Logistiikkafunktio, jota kutsutaan myös sigmoidiksi, on käyrä, joka pystyy ottamaan minkä tahansa määrän todellista arvoa ja kartoittamaan sen arvoon 0 - 1, lukuun ottamatta ääripäätä. Toiminto on:

missä se on:

e: luonnollisten logaritmien perusta (Eulerin lukumäärä tai excel-funktio exp ())
b0 + b1 * x: on todellinen numeerinen arvo, jonka haluat muuttaa.

Esitys, jota käytetään logistiseen regressioon

Logistinen regressio käyttää yhtälöä esityksenä, aivan kuten lineaarinen regressio

Tuloarvot (x) yhdistetään lineaarisesti käyttämällä painoja tai kertoimien arvoja lähtöarvon (y) ennustamiseksi. Avainero lineaarisesta regressiosta on, että mallinnettu lähtöarvo on binääriarvo (0 tai 1) pikemmin kuin numeerinen arvo.

Tässä on esimerkki logistisesta regressioyhtälöstä:

y = e^(b0 + b1 * x) / (1 + e^(b0 + b1 * x))

Kyyhkynen:

y on riippuvainen muuttuja, ts. ennustettu arvo;
b0 on polarisaatio- tai sieppaustermi;
b1 on kerroin yksittäiselle tuloarvolle (x).

Jokaisella syöttötiedon sarakkeella on liittyvä b-kerroin (vakio reaaliarvo), joka on opittava harjoitustiedoista.

Mallin, jonka tallennat muistiin tai tiedostoon, todellinen esitys on yhtälön kertoimet (beeta- tai b-arvo).

Logistinen regressio ennustaa todennäköisyydet (tekninen alue)

Logistinen regressio mallii oletusluokan todennäköisyyden.

Oletetaan esimerkiksi, että mallintamme ihmisten sukupuolta miehinä tai naisina heidän korkeudeltaan, ensimmäinen luokka voisi olla mies, ja logistinen regressiomalli voitaisiin kirjoittaa todennäköisyydeksi siitä, että mieheksi annetaan henkilön pituus tai enemmän. muodollisesti:

P (sukupuoli = uros | korkeus)

Toisella tavalla kirjoitettuna mallinnetaan todennäköisyys, että syöte (X) kuuluu luokkaan predefinite (Y = 1), voimme kirjoittaa sen seuraavasti:

P(X) = P(Y = 1 | X)

Todennäköisyysennuste on muunnettava binaariarvoiksi (0 tai 1) todellisuuden ennusteen tekemiseksi.

Logistinen regressio on lineaarinen menetelmä, mutta ennusteet muunnetaan logistista funktiota käyttämällä. Tämän vaikutuksena on, että emme voi enää ymmärtää ennusteita syötteiden lineaarisena yhdistelmänä, koska voimme esimerkiksi lineaarisella regressiolla, jatkaen esimerkiksi ylhäältä, malli voidaan ilmaista seuraavasti:

p(X) = e ^ (b0 + b1 * X) / (1 + e ^ (b0 + b1 * X))

Nyt voimme kääntää yhtälön seuraavasti. Sen kääntämiseksi voimme edetä poistamalla e: n toiselta puolelta lisäämällä luonnollisen logaritmin toiselle puolelle.

ln (p (X) / 1 - p (X)) = b0 + b1 * X

Tällä tavoin saadaan tosiasia, että oikealla olevan ulostulon laskenta on jälleen lineaarista (aivan kuten lineaarinen regressio) ja vasemmalla oleva sisääntulo on logaritmi oletusluokan todennäköisyydestä.

Todennäköisyydet lasketaan suhteena tapahtuman todennäköisyyteen jaettuna todennäköisyydellä, ettei tapahtumaa ole, esim. 0,8 / (1-0,8), jonka tulos on 4. Joten voisimme sen sijaan kirjoittaa:

ln (kertoimet) = b0 + b1 * X

Koska todennäköisyydet ovat log-muunnettuja, kutsumme tätä vasemmanpuoleiseksi log-kertoimeksi tai probitiksi.

Voimme palauttaa eksponentin oikealle ja kirjoittaa se seuraavasti:

todennäköisyys = e ^ (b0 + b1 * X)

Kaikki tämä auttaa meitä ymmärtämään, että malli on todellakin edelleen syötteiden lineaarinen yhdistelmä, mutta että tämä lineaarinen yhdistelmä viittaa esiluokan logarin todennäköisyyksiin.definita.

Logistisen regression mallin oppiminen

Logistisen regressioalgoritmin kertoimet (beeta- tai b-arvot) arvioidaan oppimisvaiheessa. Tätä varten käytämme suurimman todennäköisyyden estimointia.

Suurimman todennäköisyyden estimointi on useiden koneoppimisalgoritmien käyttämä oppimisalgoritmi. Mallista saadut kertoimet ennustavat esikoululuokalle arvon, joka on hyvin lähellä yhtä (esim. mies).definite ja arvo, joka on hyvin lähellä nollaa (esim. nainen) toiselle luokalle. Logistisen regression maksimitodennäköisyys on menetelmä, jossa etsitään kertoimille (Beta- tai ob-arvot), jotka minimoivat mallin ennustamien todennäköisyyksien virheen suhteessa datan todennäköisyyksiin (esim. todennäköisyys 0, jos data on ensisijainen luokka). .

Käytämme minimointialgoritmia optimoidaksesi parhaat kertoimien arvot harjoitustiedoille. Tämä toteutetaan usein käytännössä käyttämällä tehokasta numeerista optimointialgoritmia.

Ercole Palmeri