Koneoppiminen on muotoiltu häviöfunktion "minimointiongelmiksi" tiettyyn esimerkkijoukkoon nähden (harjoittelujoukko). Tämä ominaisuus ilmaisee eroa koulutettavan mallin ennustamien arvojen ja kussakin esimerkissä odotettavissa olevien arvojen välillä.
Perimmäisenä tavoitteena on opettaa mallille kyky ennustaa oikein tapauksille, joita ei ole harjoitusjoukossa.
Menetelmä, jonka mukaan on mahdollista erottaa eri algoritmikategoriat, on tietyltä järjestelmältä odotettavissa olevan tulosteen tyyppi. koneoppiminen.
Tärkeimmistä kategorioista löydämme:
Esimerkki luokituksesta on yhden tai useamman tarran osoittaminen kuvalle sen sisältämien esineiden tai aiheiden perusteella;
Esimerkki regressiosta on kohtauksen syvyyden arviointi sen esityksestä värikuvan muodossa.
Itse asiassa kyseessä olevan tuotoksen alue on käytännössä ääretön eikä rajoitu tiettyyn erilliseen mahdollisuuksien joukkoon;
Lineaarinen regressio on amlaajalti käytetty malli, jota käytetään todellisten arvojen arviointiin, kuten:
ja seuraa jatkuvien muuttujien kriteeriä:
Lineaarisessa regressiossa riippumattomien muuttujien ja riippuvien muuttujien välistä suhdetta seurataan linjan kautta, joka yleensä edustaa kahden muuttujan välistä suhdetta.
Sovituslinja tunnetaan regressioviivana ja sitä edustaa tyypin Y = a * X + b lineaarinen yhtälö.
Kaava perustuu tietojen interpolointiin kahden tai useamman ominaisuuden yhdistämiseksi toisiinsa. Kun annat algoritmille syöteominaisuuden, regressio palauttaa toisen ominaisuuden.
Kun meillä on enemmän kuin yksi riippumaton muuttuja, puhumme useasta lineaarisesta regressiosta olettaen seuraavan mallin:
y=b0 + B1x1 + B2x2 +… + Bnxn
Pohjimmiltaan yhtälö selittää jatkuvasti riippuvan muuttujan (y) ja kahden tai useamman riippumattoman muuttujan (x1, x2, x3…) välisen suhteen.
Jos esimerkiksi haluaisimme arvioida auton hiilidioksidipäästöt (riippuvainen muuttuja y) moottorin tehon, sylinterien lukumäärän ja polttoaineen kulutuksen perusteella. Viimeksi mainitut tekijät ovat riippumattomia muuttujia x2, x1 ja x2. Vakiot bi ovat reaalilukuja ja niitä kutsutaan mallin estimoiduiksi regressiokertoimiksi.Y on jatkuvasti riippuvainen muuttuja, ts. Se on arvojen b3, b0 x1, b1 x2 jne. y on todellinen luku.
Moninkertainen regressioanalyysi on menetelmä, jota käytetään tunnistamaan vaikutus, joka riippumattomilla muuttujilla on riippuvaiseen muuttujaan.
Ymmärtäminen, kuinka riippuvainen muuttuja muuttuu riippumattomien muuttujien muuttuessa, antaa meille mahdollisuuden ennustaa muutosten vaikutuksia tai vaikutuksia todellisissa tilanteissa.
Useita lineaarisia regressioita käyttämällä on mahdollista ymmärtää kuinka verenpaine muuttuu kehon massaindeksin muuttuessa ottaen huomioon tekijät, kuten ikä, sukupuoli jne., Olettaen siten, mitä voisi tapahtua.
Usean regression avulla voimme saada arvioita hintakehityksestä, kuten öljyn tai kullan tulevaisuuden kehityksestä.
Viimeinkin moninkertaisella lineaarisella regressiolla on enemmän kiinnostusta koneoppimiseen ja tekoälyyn, koska sen avulla voidaan saada suorittavia oppimismalleja, jopa silloin, kun on olemassa suuri määrä analysoitavia tietueita.
Logistinen regressio on tilastollinen työkalu, jonka tavoitteena on mallintaa binomitulos yhdellä tai useammalla selittävällä muuttujalla.
Sitä käytetään yleensä binaarisiin ongelmiin, joissa on vain kaksi luokkaa, esimerkiksi Kyllä tai Ei, 0 tai 1, mies tai nainen jne. ...
Tällä tavalla on mahdollista kuvata data ja selittää binääri-riippuvaisen muuttujan ja yhden tai useamman nimellisen tai ordinaalisen riippumattoman muuttujan välinen suhde.
Tulos määräytyy logistisen funktion avulla, joka arvioi todennäköisyyden ja sitten defipäättää lähimmän luokan (positiivinen tai negatiivinen) saatua todennäköisyysarvoa.
Voimme pitää logistista taantumista menetelmänä luokittelemaan ohjatut oppimisalgoritmit.
Tilastollisia menetelmiä käyttämällä logistinen regressio antaa mahdollisuuden tuottaa tuloksen, joka itse asiassa edustaa todennäköisyyttä, että annettu syötearvo kuuluu tiettyyn luokkaan.
Binomisissa logistisissa regressio-ongelmissa todennäköisyys, että lähtö kuuluu johonkin luokkaan, on P, kun taas se kuuluu toiseen luokkaan 1-P (missä P on luku välillä 0 ja 1, koska se ilmaisee todennäköisyyden).
Binomilogistinen regressio toimii hyvin kaikissa niissä tapauksissa, joissa muuttuja, jota yritämme ennustaa, on binaarinen, ts. Se voi olettaa vain kaksi arvoa: arvo 1, joka edustaa positiivista luokkaa, tai arvo 0, joka edustaa negatiivista luokkaa.
Esimerkkejä ongelmista, jotka voidaan ratkaista logistisella regressiolla, ovat:
Logistisella regressiolla voimme tehdä ennustavan analyysin, mittaamalla ennustettavan (riippuvainen muuttuja) ja yhden tai useamman riippumattoman muuttujan, ts. Ominaisuuksien, suhdetta. Todennäköisyyden arviointi suoritetaan logistisen funktion avulla.
Todennäköisyydet muutetaan myöhemmin binaariarvoiksi, ja ennusteen tekemiseksi todelliseksi tämä tulos osoitetaan luokkaan, johon se kuuluu, sen perusteella, onko se lähellä luokkaa.
Esimerkiksi, jos logistisen funktion sovellus palauttaa arvon 0,85, se tarkoittaa, että tulo on luonut positiivisen luokan osoittamalla sen luokalle 1. Käänteisesti, jos se olisi saanut arvon, kuten 0,4 tai yleisemmin <0,5 ..
Logistinen regressio käyttää logistista toimintoa tuloarvojen luokituksen arvioimiseen.
Logistiikkafunktio, jota kutsutaan myös sigmoidiksi, on käyrä, joka pystyy ottamaan minkä tahansa määrän todellista arvoa ja kartoittamaan sen arvoon 0 - 1, lukuun ottamatta ääripäätä. Toiminto on:
missä se on:
Logistinen regressio käyttää yhtälöä esityksenä, aivan kuten lineaarinen regressio
Tuloarvot (x) yhdistetään lineaarisesti käyttämällä painoja tai kertoimien arvoja lähtöarvon (y) ennustamiseksi. Avainero lineaarisesta regressiosta on, että mallinnettu lähtöarvo on binääriarvo (0 tai 1) pikemmin kuin numeerinen arvo.
Tässä on esimerkki logistisesta regressioyhtälöstä:
y = e^(b0 + b1 * x) / (1 + e^(b0 + b1 * x))
Kyyhkynen:
Jokaisella syöttötiedon sarakkeella on liittyvä b-kerroin (vakio reaaliarvo), joka on opittava harjoitustiedoista.
Mallin, jonka tallennat muistiin tai tiedostoon, todellinen esitys on yhtälön kertoimet (beeta- tai b-arvo).
Logistinen regressio mallii oletusluokan todennäköisyyden.
Oletetaan esimerkiksi, että mallintamme ihmisten sukupuolta miehinä tai naisina heidän korkeudeltaan, ensimmäinen luokka voisi olla mies, ja logistinen regressiomalli voitaisiin kirjoittaa todennäköisyydeksi siitä, että mieheksi annetaan henkilön pituus tai enemmän. muodollisesti:
P (sukupuoli = uros | korkeus)
Toisella tavalla kirjoitettuna mallinnetaan todennäköisyys, että syöte (X) kuuluu luokkaan predefinite (Y = 1), voimme kirjoittaa sen seuraavasti:
P(X) = P(Y = 1 | X)
Todennäköisyysennuste on muunnettava binaariarvoiksi (0 tai 1) todellisuuden ennusteen tekemiseksi.
Logistinen regressio on lineaarinen menetelmä, mutta ennusteet muunnetaan logistista funktiota käyttämällä. Tämän vaikutuksena on, että emme voi enää ymmärtää ennusteita syötteiden lineaarisena yhdistelmänä, koska voimme esimerkiksi lineaarisella regressiolla, jatkaen esimerkiksi ylhäältä, malli voidaan ilmaista seuraavasti:
p(X) = e ^ (b0 + b1 * X) / (1 + e ^ (b0 + b1 * X))
Nyt voimme kääntää yhtälön seuraavasti. Sen kääntämiseksi voimme edetä poistamalla e: n toiselta puolelta lisäämällä luonnollisen logaritmin toiselle puolelle.
ln (p (X) / 1 - p (X)) = b0 + b1 * X
Tällä tavoin saadaan tosiasia, että oikealla olevan ulostulon laskenta on jälleen lineaarista (aivan kuten lineaarinen regressio) ja vasemmalla oleva sisääntulo on logaritmi oletusluokan todennäköisyydestä.
Todennäköisyydet lasketaan suhteena tapahtuman todennäköisyyteen jaettuna todennäköisyydellä, ettei tapahtumaa ole, esim. 0,8 / (1-0,8), jonka tulos on 4. Joten voisimme sen sijaan kirjoittaa:
ln (kertoimet) = b0 + b1 * X
Koska todennäköisyydet ovat log-muunnettuja, kutsumme tätä vasemmanpuoleiseksi log-kertoimeksi tai probitiksi.
Voimme palauttaa eksponentin oikealle ja kirjoittaa se seuraavasti:
todennäköisyys = e ^ (b0 + b1 * X)
Kaikki tämä auttaa meitä ymmärtämään, että malli on todellakin edelleen syötteiden lineaarinen yhdistelmä, mutta että tämä lineaarinen yhdistelmä viittaa esiluokan logarin todennäköisyyksiin.definita.
Logistisen regressioalgoritmin kertoimet (beeta- tai b-arvot) arvioidaan oppimisvaiheessa. Tätä varten käytämme suurimman todennäköisyyden estimointia.
Suurimman todennäköisyyden estimointi on useiden koneoppimisalgoritmien käyttämä oppimisalgoritmi. Mallista saadut kertoimet ennustavat esikoululuokalle arvon, joka on hyvin lähellä yhtä (esim. mies).definite ja arvo, joka on hyvin lähellä nollaa (esim. nainen) toiselle luokalle. Logistisen regression maksimitodennäköisyys on menetelmä, jossa etsitään kertoimille (Beta- tai ob-arvot), jotka minimoivat mallin ennustamien todennäköisyyksien virheen suhteessa datan todennäköisyyksiin (esim. todennäköisyys 0, jos data on ensisijainen luokka). .
Käytämme minimointialgoritmia optimoidaksesi parhaat kertoimien arvot harjoitustiedoille. Tämä toteutetaan usein käytännössä käyttämällä tehokasta numeerista optimointialgoritmia.
Veeamin Coveware tarjoaa jatkossakin kyberkiristystapahtumien reagointipalveluita. Coveware tarjoaa rikosteknisiä ja korjaavia ominaisuuksia…
Ennakoiva huolto mullistaa öljy- ja kaasualan innovatiivisella ja ennakoivalla lähestymistavalla laitosten hallintaan.…
Britannian CMA on antanut varoituksen Big Techin käyttäytymisestä tekoälymarkkinoilla. Siellä…
Euroopan unionin rakennusten energiatehokkuuden parantamiseksi laatima "Green Houses" -asetus on saanut lainsäädäntöprosessinsa päätökseen…