tutorja

Klassifikazzjoni tal-Algoritmi tat-Tagħlim tal-Magni: Regressjoni Lineari, Klassifikazzjoni u Raggruppament

It-Tagħlim bil-Magni għandu xebh kbir ma 'ottimizzazzjoni matematika, li jipprovdi metodi, teoriji u oqsma ta' applikazzjoni.

It-tagħlim bil-magni huwa fformulat bħala "problemi ta 'minimizzazzjoni" ta' funzjoni ta 'telf kontra ġabra ta' eżempji (sett ta 'taħriġ). Din il-karatteristika tesprimi d-diskrepanza bejn il-valuri mbassra mill-mudell li qed jiġi mħarreġ u l-valuri mistennija għal kull eżempju.

L-għan aħħari huwa li tgħallem lill-mudell il-ħila li wieħed ibassar korrettament fuq sett ta 'każijiet mhux preżenti fis-sett ta' taħriġ.

Metodu li skontu huwa possibbli li jiġu distinti kategoriji differenti ta’ algoritmi huwa t-tip ta’ output mistenni minn ċerta sistema ta’ tagħlim magna.

Fost il-kategoriji ewlenin insibu:

La klassifikazzjoni: l-inputs huma maqsuma f'żewġ klassijiet jew iktar u s-sistema ta 'tagħlim trid tipproduċi mudell li kapaċi jassenja klassi waħda jew aktar fost dawk disponibbli għal input.Dawn it-tipi ta 'kompiti huma tipikament indirizzati bl-użu ta' tekniki ta 'tagħlim sorveljat.
Eżempju ta 'klassifikazzjoni huwa l-assenjazzjoni ta' tikketta waħda jew aktar lil immaġni bbażata fuq l-oġġetti jew is-suġġetti li hemm fiha;
La rigressjoni: kunċettwalment simili għall-klassifikazzjoni bid-differenza li l-produzzjoni għandha dominju kontinwu u mhux diskret.Ġeneralment hija mmaniġġjata permezz ta 'tagħlim sorveljat.
Eżempju ta 'rigressjoni huwa l-istima tal-fond ta' xena mir-rappreżentazzjoni tagħha fil-forma ta 'immaġni bil-kulur.

Fil-fatt, id-dominju tal-prodott inkwistjoni huwa kważi infinit, u mhux limitat għal ċertu sett diskret ta 'possibbiltajiet;
Il Raggruppament: fejn hi sett ta 'data huwa maqsum fi gruppi li, iżda, b'differenza mill-klassifikazzjoni, mhumiex magħrufa a priori.In-natura stess tal-problemi li jagħmlu parti minn din il-kategorija tipikament tagħmilhom kompiti ta 'tagħlim mhux sorveljati.

Mudell ta 'rigressjoni lineari sempliċi

Regressjoni lineari hija amMudell użat ħafna użat biex jistma valuri reali bħal:

l-ispiża tad-djar,
numru ta 'telefonati,
bejgħ totali għal kull persuna,

u jsegwi l-kriterju tal-varjabbli kontinwi:

metri kwadri,
sottoskrizzjoni għal kont kurrenti,
edukazzjoni tal-persuna

Fir-rigressjoni lineari, relazzjoni bejn varjabbli indipendenti u varjabbli dipendenti hija segwita permezz ta 'linja li normalment tirrappreżenta r-relazzjoni bejn iż-żewġ varjabbli.

Il-linja ta 'tajbin hija magħrufa bħala l-linja ta' rigressjoni u hija rappreżentata minn ekwazzjoni lineari tat-tip Y = a * X + b.

Il-formula hija bbażata fuq dejta interpolanti li tassoċja żewġ karatteristiċi jew aktar ma 'xulxin. Meta tagħti lill-algoritmu input karatteristika, ir-rigressjoni tirritorna l-karatteristika l-oħra.

Mudell ta 'rigressjoni lineari multipla

Meta jkollna aktar minn varjabbli indipendenti waħda, allura nitkellmu dwar rigressjoni lineari multipla, jekk wieħed jassumi mudell bħal dan:

y=b₀ + b₁x₁ + b₂x₂ + ... + B_nx_n

y hija r-risposta għall-valuri, jiġifieri, tirrappreżenta r-riżultat previst mill-mudell;
b₀ huwa l-interċettazzjoni, li huwa l-valur ta 'y meta x_ihuma kollha ugwali għal 0;
l-ewwel karatteristika b₁ huwa l-koeffiċjent ta 'x₁;
karatteristika oħra b_n huwa l-koeffiċjent ta 'x_n;
x₁,x₂, ..., X_n huma l-varjabbli indipendenti tal-mudell.

Bażikament l-ekwazzjoni tispjega r-relazzjoni bejn varjabbli dipendenti kontinwa (y) u żewġ varjabbli indipendenti jew aktar (x1, x2, x3 ...).

Pereżempju, jekk ridna nistmaw l-emissjoni tas-CO2 ta 'karozza (varjabbli y dipendenti) meta wieħed iqis il-qawwa tal-magna, in-numru ta' ċilindri u l-konsum tal-fjuwil. Dawn l-aħħar fatturi huma l-varjabbli indipendenti x1, x2 u x3. Il-kostanti bi huma numri reali u jissejħu l-koeffiċjenti ta 'rigressjoni stmati tal-mudell. Y hija l-varjabbli kontinwa dipendenti, i.e. hija s-somma ta' b0, b1 x1, b2 x2, eċċ. y se jkun numru reali.

Analiżi tar-rigressjoni multipla huwa metodu użat biex jidentifika l-effett li l-varjabbli indipendenti għandhom fuq varjabbli dipendenti.

Nifhmu kif il-varjabbli dipendenti tinbidel hekk kif il-varjabbli indipendenti jinbidlu jippermettilna nbassru l-effetti jew l-impatti tal-bidliet f'sitwazzjonijiet reali.

Bl-użu ta ’rigressjoni lineari multipla huwa possibbli li tifhem kif il-pressjoni tad-demm tinbidel hekk kif l-indiċi tal-massa tal-ġisem jinbidel meta jitqiesu fatturi bħall-età, is-sess, eċċ, u b’hekk wieħed jassumi x’jista’ jiġri.

B'regressjoni multipla nistgħu nibdew stimi fuq ix-xejriet tal-prezzijiet, bħax-xejra futura taż-żejt jew tad-deheb.

Finalment, rigressjoni lineari multipla qed tesperjenza interess ikbar fil-qasam tat-tagħlim tal-magni u l-intelliġenza artifiċjali peress li tippermetti li jinkisbu mudelli ta 'tagħlim li jwettqu anke fil-każ ta' numru kbir ta 'rekords li jridu jiġu analizzati.

Mudell ta ’Regressjoni Loġistika

Ir-rigressjoni loġistika hija għodda statistika li għandha l-għan li timmudella riżultat binomjali b'waħda jew aktar varjabbli ta 'spjegazzjoni.

Ġeneralment jintuża għal problemi binarji, fejn hemm żewġ klassijiet biss, pereżempju Iva jew Le, 0 jew 1, raġel jew mara eċċ ...

B'dan il-mod huwa possibbli li tiġi deskritta d-dejta u tispjega r-relazzjoni bejn varjabbli dipendenti binarja u waħda jew iktar varjabbli nominali jew ordinali indipendenti.

Ir-riżultat huwa determinat grazzi għall-użu ta 'funzjoni loġistika, li tistma probabbiltà u mbagħad defijispiċċa l-eqreb klassi (pożittiva jew negattiva) għall-valur tal-probabbiltà miksub.

Nistgħu nqisu r-rigressjoni loġistika bħala metodu għall-klassifikazzjoni tal-familja algoritmi ta ’tagħlim sorveljat.

Bl-użu ta 'metodi statistiċi, ir-rigressjoni loġistika tippermetti li jiġi ġġenerat riżultat li, fil-fatt, jirrappreżenta probabbiltà li valur ta' input partikolari jappartjeni għal klassi partikolari.

Fi problemi ta 'rigressjoni loġistika binomjali, il-probabbiltà li l-output jappartjeni għal klassi waħda tkun P, filwaqt li dik tappartjeni għall-klassi l-oħra 1-P (fejn P huwa numru bejn 0 u 1 minħabba li tesprimi probabbiltà).

Ir-rigressjoni loġistika binomjali taħdem tajjeb f'dawk il-każijiet kollha li fihom il-varjabbli li qed nippruvaw nbassru hija binarja, jiġifieri, tista 'tassumi biss żewġ valuri: il-valur 1 li jirrappreżenta l-klassi pożittiva, jew il-valur 0 li jirrappreżenta l-klassi negattiva.

Eżempji ta 'problemi li jistgħu jissolvew permezz ta' rigressjoni loġistika huma:

imejl huwa spam jew le;
xirja onlajn tkun frodulenti jew le, li tevalwa l-kundizzjonijiet tax-xiri;
pazjent ikollu ksur, jevalwa r-raġġi tiegħu.

B'regressjoni loġistika nistgħu nagħmlu analiżi ta 'tbassir, inkejlu r-relazzjoni bejn dak li rridu nbassru (varjabbli dipendenti) u varjabbli waħda jew aktar indipendenti, i.e. il-karatteristiċi. L-istima tal-probabbiltà ssir permezz ta 'funzjoni loġistika.

Il-probabbiltajiet sussegwentement jiġu mibdula f'valuri binarji, u sabiex il-previżjoni ssir reali, dan ir-riżultat huwa assenjat lill-klassi li tappartjeni għaliha, abbażi ta 'jekk hux viċin tal-klassi nnifisha jew le.

Pereżempju, jekk l-applikazzjoni tal-funzjoni loġistika tirritorna 0,85, allura dan ifisser li l-input iġġenera klassi pożittiva billi assenjaha lill-klassi 1. Bil-maqlub jekk kisbet valur bħal 0,4 jew b'mod aktar ġenerali <0,5 ..

Ir-rigressjoni loġistika tuża l-funzjoni loġistika biex tevalwa l-klassifikazzjoni tal-valuri tad-dħul.

Il-funzjoni loġistika, imsejħa wkoll sigmoid, hija kurva li tista 'tieħu kwalunkwe numru ta' valur reali u tpinġiha għal valur bejn 0 u 1, esklużi estremi. Il-funzjoni hija:

fejn hi:

e: bażi ta 'logaritmi naturali (in-numru ta' Euler, jew il-funzjoni excel exp ())
b0 + b1 * x: huwa l-valur numeriku attwali li trid tittrasforma.

Rappreżentazzjoni użata għal rigressjoni loġistika

Ir-rigressjoni loġistika tuża ekwazzjoni bħala rappreżentazzjoni, simili għal rigressjoni lineari

Il-valuri ta 'l-input (x) huma magħqudin lineari bl-użu ta' piżijiet jew valuri ta 'koeffiċjent, biex tbassar valur tal-ħruġ (y). Differenza ewlenija mir-rigressjoni lineari hija li l-valur tal-output immudellat huwa valur binarju (0 jew 1) aktar milli valur numeriku.

Hawn hu eżempju ta 'ekwazzjoni ta' rigressjoni loġistika:

y = e^(b0 + b1 * x) / (1 + e^(b0 + b1 * x))

Fejn:

y hija l-varjabbli dipendenti, i.e. il-valur previst;
b0 huwa t-terminu tal-polarizzazzjoni jew tal-interċettazzjoni;
b1 huwa l-koeffiċjent għall-valur tal-input uniku (x).

Kull kolonna fid-dejta tal-input għandha koeffiċjent assoċjat b (valur reali kostanti) li għandu jitgħallem mid-dejta tat-taħriġ.

Ir-rappreżentazzjoni reali tal-mudell li taħżen fil-memorja jew fajl huma l-koeffiċjenti fl-ekwazzjoni (il-valur beta jew b).

Regressjoni loġistika tbassar probabbiltajiet (firxa teknika)

Regressjoni loġistika timmudella l-probabbiltà tal-klassi default.

Bħala eżempju, ejja nassumu li qed immudellaw is-sess tan-nies bħala raġel jew mara mill-għoli tagħhom, l-ewwel klassi tista 'tkun maskili, u l-mudell ta' rigressjoni loġistika jista 'jinkiteb bħala l-probabbiltà li raġel jingħata l-għoli ta' persuna, jew aktar. formalment:

P (sess = maskili | għoli)

Miktub mod ieħor, qed nimudellaw il-probabbiltà li input (X) jappartjeni għall-klassi predefinite (Y = 1), nistgħu niktbuha bħala:

P(X) = P(Y = 1 | X)

Il-previżjoni tal-probabbiltà trid tiġi trasformata f'valuri binarji (0 jew 1) sabiex fil-fatt issir tbassir tal-probabbiltà.

Ir-rigressjoni loġistika hija metodu lineari, iżda l-previżjonijiet huma trasformati bl-użu tal-funzjoni loġistika. L-impatt ta 'dan huwa li ma nistgħux nifhmu aktar it-tbassir bħala kombinazzjoni lineari ta' inputs kif nistgħu b'regressjoni lineari, pereżempju, billi nkomplu minn fuq, il-mudell jista 'jiġi espress bħala:

p(X) = e ^ (b0 + b1 * X) / (1 + e ^ (b0 + b1 * X))

Issa nistgħu ndawru l-ekwazzjoni kif ġej. Biex tibdilha, nistgħu nkomplu billi nneħħu l-le fuq naħa waħda billi żżid logaritmu naturali fuq in-naħa l-oħra.

ln (p (X) / 1 - p (X)) = b0 + b1 * X

B'dan il-mod inwasslu għall-fatt li l-komputazzjoni tal-output fuq il-lemin hija lineari mill-ġdid (l-istess bħal rigressjoni lineari), u l-input fuq ix-xellug huwa logaritmu tal-probabbiltà tal-klassi default.

Il-probabbiltajiet huma kkalkulati bħala proporzjon tal-probabbiltà tal-avveniment diviż bil-probabbiltà tal-ebda avveniment, p.e. 0,8 / (1-0,8) li r-riżultat tiegħu huwa 4. Allura nistgħu minflok niktbu:

ln(odds) = b0 + b1 *

Peress li l-probabbiltajiet huma trasformati fil-log, aħna nsejħu dan il-log-odds jew probit fuq ix-xellug.

Nistgħu nirritornaw l-esponent fuq il-lemin u jiktbu bħala:

probabbiltà = e ^ (b0 + b1 * X)

Dan kollu jgħinna nifhmu li tabilħaqq il-mudell għadu kombinazzjoni lineari tal-inputs, iżda li din il-kombinazzjoni lineari tirreferi għall-probabbiltajiet log tal-klassi predefinita.

Nitgħallmu l-mudell ta ’rigressjoni loġistika

Il-koeffiċjenti (valuri beta jew b) tal-algoritmu tar-rigressjoni loġistika huma stmati fil-fażi tat-tagħlim. Biex nagħmlu dan, nużaw stima tal-probabbiltà massima.

L-istima tal-probabbiltà massima hija algoritmu ta' tagħlim użat minn diversi algoritmi ta' tagħlim tal-magni. Il-koeffiċjenti li jirriżultaw mill-mudell ibassru valur qrib ħafna ta' 1 (eż. raġel) għall-klassi ta' qabel l-iskoladefinite u valur qrib ħafna ta’ 0 (eż. mara) għall-klassi l-oħra. Il-probabbiltà massima għal rigressjoni loġistika hija proċedura biex jinstabu valuri għall-koeffiċjenti (valuri Beta jew ob) li jimminimizzaw l-iżball fil-probabbiltajiet imbassra mill-mudell relattiv għal dawk fid-dejta (eż. probabbiltà 1 jekk id-dejta hija l-klassi primarja) .

Aħna nużaw algoritmu ta 'minimizzazzjoni biex nottimizzaw l-aħjar valuri ta' koeffiċjent għad-dejta tat-taħriġ. Dan ta 'spiss jiġi implimentat fil-prattika bl-użu ta' algoritmu effiċjenti ta 'ottimizzazzjoni numerika.

Ercole Palmeri

Tags: klassifikazzjoniRaggruppamentIntelliġenza artifiċjaliTagħlim bil-Magnipythonrigressjoni lineari

16 ta’ Awwissu, 2020 4:02 pm

Li jmiss Awtomazzjoni tal-Marketing: segmentazzjoni »

Preċedenti «Intelliġenza artifiċjali u sistemi konjittivi, x'inhuma u applikazzjonijiet possibbli

Artikoli riċenti

Artikoli

Il-Futur qiegħed Hawnhekk: Kif l-Industrija tat-Tbaħħir qed tirrivoluzzjona l-Ekonomija Globali

Is-settur navali huwa qawwa ekonomika globali vera, li navigat lejn suq ta’ 150 biljun...

1 Mejju 2024

Artikoli

Il-pubblikaturi u l-OpenAI jiffirmaw ftehimiet biex jirregolaw il-fluss tal-informazzjoni pproċessata mill-Intelliġenza Artifiċjali

It-Tnejn li għadda, il-Financial Times ħabbret ftehim mal-OpenAI. FT tagħti liċenzja għall-ġurnaliżmu ta’ klassi dinjija tagħha...

April 30 2024

Artikoli

Ħlasijiet Online: Hawn Kif Is-Servizzi ta' Streaming Jagħmel Inti Tħallas Għal Dejjem

Miljuni ta 'nies iħallsu għal servizzi ta' streaming, iħallsu miżati ta 'abbonament ta' kull xahar. Hija opinjoni komuni li inti...

April 29 2024

Comunicati Stampa

Veeam għandu l-aktar appoġġ komprensiv għar-ransomware, mill-protezzjoni għar-rispons u l-irkupru

Coveware minn Veeam se jkompli jipprovdi servizzi ta' rispons għal inċidenti ta' estorsjoni ċibernetika. Coveware se joffri forensiċi u kapaċitajiet ta' rimedju...

April 23 2024