Punë praktike

Klasifikimi i algoritmeve të të mësuarit të makinerive: Regresioni linear, klasifikimi dhe grupimi

Mësimi i makinerisë ka ngjashmëri të madhe me optimizimin matematikor, i cili siguron metoda, teori dhe fusha të aplikimit.

Mësimi i makinerisë është formuluar si "probleme minimizimi" i një funksioni humbjeje ndaj një grupi të caktuar shembujsh (grup trajnimesh). Ky funksion shpreh mospërputhjen midis vlerave të parashikuara nga modeli që trajnohet dhe vlerave të pritura për secilin shembull shembull.

Qëllimi përfundimtar është t'i mësojmë modelit aftësinë për të parashikuar saktë në një seri rastesh që nuk janë të pranishme në grupin e trajnimit.

Një metodë sipas së cilës është e mundur të dallohen kategori të ndryshme të algoritmit është lloji i prodhimit që pritet nga një sistem i caktuar Mësimi makinë.

Ndër kategoritë kryesore gjejmë:

La klasifikim: inputet ndahen në dy ose më shumë klasa dhe sistemi i mësimit duhet të prodhojë një model të aftë të caktojë një ose më shumë klasa në mesin e atyre që janë në dispozicion të një informacioni.Këto lloje të detyrave zakonisht adresohen duke përdorur teknika të mbikëqyrura të të mësuarit.
Një shembull i klasifikimit është caktimi i një ose më shumë etiketave në një imazh bazuar në objektet ose subjektet që përmbahen në të;
La regres: konceptualisht i ngjashëm me klasifikimin me ndryshimin se prodhimi ka një domen të vazhdueshëm dhe jo diskret.Në mënyrë tipike menaxhohet me mësimin e mbikëqyrur.
Një shembull i regresionit është vlerësimi i thellësisë së një skene nga paraqitja e tij në formën e një imazhi me ngjyra.

Në fakt, fusha e rezultatit në fjalë është praktikisht e pafund, dhe nuk kufizohet në një grup të caktuar diskret të mundësive;
Il clustering: ku eshte një grup i të dhënave është i ndarë në grupe, të cilat, me dallim nga klasifikimi, nuk njihen apriori.Vetë natyra e problemeve që i përkasin kësaj kategorie zakonisht i bën ata detyra mësimore të mbikëqyrura.

Modeli i regresionit të thjeshtë linear

Regresioni linear është amModeli i përdorur gjerësisht i përdorur për të vlerësuar vlerat reale siç janë:

kostoja e shtëpive,
numri i thirrjeve,
shitjet totale për person,

dhe ndjek kriterin e variablave të vazhdueshëm:

metra katrorë,
pajtimi në një llogari rrjedhëse,
edukimi i personit

Në regresionin linear, një marrëdhënie midis variablave të pavarur dhe ndryshoreve të varura përcillet përmes një linje që zakonisht paraqet marrëdhënien midis dy ndryshoreve.

Linja fitore njihet si vija e regresionit dhe përfaqësohet nga një ekuacion linear i tipit Y = a * X + b.

Formula bazohet në të dhënat e ndërhyrjes për të shoqëruar dy ose më shumë karakteristika me njëra-tjetrën. Kur i jepni algoritmit një karakteristikë hyrëse, regresioni i kthen karakteristikën tjetër.

Modeli i regresionit të shumëfishtë linear

Kur kemi më shumë se një variabël të pavarur, atëherë flasim për regresion të shumëfishtë linear, duke supozuar një model si më poshtë:

y=b₀ b₁x₁ b₂x₂ +… + B_nx_n

y është përgjigja ndaj vlerave, d.m.th. ai paraqet rezultatin e parashikuar nga modeli;
b₀ është përgjimi, kjo është vlera e y kur x_itë gjithë janë të barabartë me 0;
karakteristika e parë b₁ është koeficienti i x₁;
një veçori tjetër b_n është koeficienti i x_n;
x₁,x₂,…, X_n janë variablat e pavarur të modelit.

Në thelb ekuacioni shpjegon marrëdhëniet midis një ndryshore të varur të vazhdueshme (y) dhe dy ose më shumë variablave të pavarur (x1, x2, x3 ...).

Për shembull, nëse do të donim të vlerësonim emetimin e CO2 të një makine (varur varëse y) duke marrë parasysh fuqinë e motorit, numrin e cilindrave dhe konsumin e karburantit. Këta faktorë të fundit janë ndryshoret e pavarura x1, x2 dhe x3. Konstantet bi janë numra realë dhe quhen koeficientët e vlerësuar të regresionit të modelit.Y është variabla e varur e vazhdueshme, d.m.th. është shuma e b0, b1 x1, b2 x2, etj. y do të jetë një numër real.

Analiza e regresionit të shumëfishtë është një metodë e përdorur për të identifikuar efektin që variablat e pavarur kanë në një variabël të varur.

Të kuptuarit se si ndryshimi i varur ndryshon si ndryshimi i variablave të pavarur, na lejon të parashikojmë efektet ose ndikimet e ndryshimeve në situata reale.

Duke përdorur regresionin e shumëfishtë linear është e mundur të kuptohet se si ndryshon presioni i gjakut pasi indeksi i masës së trupit ndryshon duke marrë parasysh faktorë të tillë si mosha, seksi, etj., Duke supozuar kështu se çfarë mund të ndodhë.

Me regresion të shumëfishtë mund të marrim vlerësime mbi tendencat e çmimeve, siç është tendenca e ardhshme për naftë ose ari.

Më në fund, regresioni i shumëfishtë linear po gjen interes më të madh në fushën e të mësuarit të makinerive dhe inteligjencës artificiale pasi lejon të përftohen modele të të nxënit të kryer edhe në rastin e një numri të madh të regjistrave që do të analizohen.

Modeli i regresionit logjistik

Regresioni logjistik është një mjet statistikor që synon të modelojë një rezultat binom me një ose më shumë ndryshore shpjeguese.

Përdoret në përgjithësi për probleme binare, ku ekzistojnë vetëm dy klasa, për shembull Po ose Jo, 0 ose 1, mashkull ose femër etj ...

Në këtë mënyrë është e mundur të përshkruhen të dhënat dhe të shpjegohet marrëdhënia midis një variabël të varur binar dhe një ose më shumë ndryshore nominale ose rendore të pavarura.

Rezultati përcaktohet falë përdorimit të një funksioni logjistik, i cili vlerëson një probabilitet dhe më pas defipërfundon klasën më të afërt (pozitive ose negative) me vlerën e fituar të probabilitetit.

Ne mund ta konsiderojmë regresionin logjistik si një metodë për të klasifikuar familjen e algoritme mësimore të mbikëqyrura.

Duke përdorur metodat statistikore, regresioni logjistik lejon të gjenerojë një rezultat i cili, në të vërtetë, paraqet një probabilitet që një vlerë e dhënë hyrëse e caktuar i përket një klase të caktuar.

Në problemet e regresionit logjistik binom, probabiliteti që prodhimi i përket një klase do të jetë P, ndërsa që i përket klasës tjetër 1-P (ku P është një numër midis 0 dhe 1 sepse shpreh një probabilitet).

Regresioni logjistik binomik funksionon mirë në të gjitha ato raste në të cilat variabla që ne po përpiqemi të parashikojmë është binare, domethënë mund të supozojë vetëm dy vlera: vlera 1 e cila përfaqëson klasën pozitive, ose vlerën 0 e cila përfaqëson klasën negative.

Shembuj të problemeve që mund të zgjidhen me regresion logjistik janë:

një e-mail është spam ose jo;
një blerje në internet është mashtruese ose jo, duke vlerësuar kushtet e blerjes;
një pacient ka një frakturë, duke vlerësuar rrezet e saj.

Me regresionin logjistik mund të bëjmë një analizë parashikuese, duke matur marrëdhëniet midis asaj që duam të parashikojmë (ndryshoren e varur) dhe një ose më shumë ndryshore të pavarura, d.m.th. karakteristikat. Vlerësimi i probabilitetit bëhet përmes një funksioni logjistik.

Probabilitetet më pas shndërrohen në vlera binare, dhe për ta bërë parashikimin real, ky rezultat i caktohet klasës së cilës i përket, bazuar në faktin nëse është afër vetë klasës.

Për shembull, nëse aplikimi i funksionit logjistik kthen 0,85, atëherë kjo do të thotë që hyrja ka gjeneruar një klasë pozitive duke e caktuar atë në klasën 1. Anasjelltas nëse do të kishte marrë një vlerë të tillë si 0,4 ose më përgjithësisht <0,5 ..

Regresioni logjistik përdor funksionin logjistik për të vlerësuar klasifikimin e vlerave të hyrjes.

Funksioni logjistik, i quajtur gjithashtu sigmoid, është një kurbë e aftë për të marrë çdo numër të vlerës reale dhe duke e hartuar atë në një vlerë midis 0 dhe 1, duke përjashtuar ekstremet. Funksioni është:

ku:

e: baza e logaritmave natyrorë (numri i Eulerit, ose funksioni i shkëlqyera (()))
b0 + b1 * x: është vlera aktuale numerike që dëshironi të shndërroni.

Përfaqësimi i përdorur për regresionin logjistik

Regresioni logjistik përdor një ekuacion si përfaqësim, shumë si regresioni linear

Vlerat e hyrjes (x) kombinohen në mënyrë lineare duke përdorur peshat ose vlerat e koeficientit, për të parashikuar një vlerë të prodhimit (y). Një ndryshim kryesor nga regresioni linear është se vlera e daljes së modeluar është një vlerë binare (0 ose 1) sesa një vlerë numerike.

Këtu është një shembull i një ekuacioni të regresionit logjistik:

y = e^(b0 + b1 * x) / (1 + e^(b0 + b1 * x))

ku:

y është ndryshorja e varur, d.m.th. vlera e parashikuar;
b0 është termi i polarizimit ose interceptimit;
b1 është koeficienti për vlerën e vetme të hyrjes (x).

Do kolonë në të dhënat hyrëse ka një koeficient b shoqërues (një vlerë reale konstante) që duhet të mësohet nga të dhënat e trajnimit.

Përfaqësimi aktual i modelit që do të ruanit në memorje ose një skedar janë koeficientët në ekuacion (vlera beta ose b).

Regresioni logjistik parashikon mundësitë (diapazoni teknik)

Regresioni logjistik modelon mundësinë e klasës së paracaktuar.

Si shembull, le të supozojmë se ne po modelojmë seksin e njerëzve si mashkull ose femër nga lartësia e tyre, klasa e parë mund të ishte mashkull, dhe modeli i regresionit logjistik mund të shkruhej si probabiliteti për t'u mashkull i dhënë lartësinë e një personi, ose më shumë. zyrtarisht:

P (seksi = mashkull | lartësia)

E shkruar në një mënyrë tjetër, ne po modelojmë probabilitetin që një hyrje (X) i përket klasës predefinite (Y = 1), mund ta shkruajmë si:

P(X) = P(Y = 1 | X)

Parashikimi i probabilitetit duhet të shndërrohet në vlera binare (0 ose 1) në mënyrë që të bëjë një parashikim të probabilitetit.

Regresioni logjistik është një metodë lineare, por parashikimet shndërrohen duke përdorur funksionin logjistik. Ndikimi i kësaj është se ne nuk mund të kuptojmë më parashikimet si një kombinim linear i inputeve siç mundemi me regresionin linear, për shembull, duke vazhduar nga lart, modeli mund të shprehet si:

p(X) = e ^ (b0 + b1 * X) / (1 + e ^ (b0 + b1 * X))

Tani mund ta kthejmë ekuacionin si më poshtë. Për ta kthyer atë mund të vazhdojmë duke hequr e në njërën anë duke shtuar një logaritëm natyror në anën tjetër.

ln (p (X) / 1 - p (X)) = b0 + b1 * X

Në këtë mënyrë marrim faktin se llogaritja e rezultatit në të djathtë është përsëri linear (ashtu si regresioni linear), dhe inputi në të majtë është një logaritëm i probabilitetit të klasës së paracaktuar.

Probabilitetet llogariten si një raport i probabilitetit të ngjarjes të ndarë me probabilitetin e asnjë ngjarjeje, p.sh. 0,8 / (1-0,8) rezultati i të cilit është 4. Kështu që ne mund të shkruanim:

ln (shanset) = b0 + b1 * X

Meqenëse probabilitetet janë të shndërruara në log, ne i quajmë këto shanse logjike ose provë të anës së majtë.

Ne mund ta kthejmë eksponentin në të djathtë dhe ta shkruajmë si:

probabiliteti = e ^ (b0 + b1 * X)

E gjithë kjo na ndihmon të kuptojmë se në të vërtetë modeli është ende një kombinim linear i hyrjeve, por që ky kombinim linear i referohet probabiliteteve log të klasës paraprake.definita

Mësoni modelin e regresionit logjistik

Koeficientët (vlerat beta ose b) të algoritmit të regresionit logjistik vlerësohen në fazën e mësimit. Për ta bërë këtë, ne përdorim vlerësimin maksimal të gjasave.

Vlerësimi i gjasave maksimale është një algoritëm mësimor i përdorur nga disa algoritme të mësimit të makinerive. Koeficientët që rezultojnë nga modeli parashikojnë një vlerë shumë afër 1 (p.sh. mashkull) për klasën parashkolloredefinite dhe një vlerë shumë afër 0 (p.sh. femra) për klasën tjetër. Mundësia maksimale për regresionin logjistik është një procedurë e gjetjes së vlerave për koeficientët (vlerat beta ose ob) që minimizojnë gabimin në probabilitetet e parashikuara nga modeli në lidhje me ato në të dhëna (p.sh. probabiliteti 1 nëse të dhënat janë klasa kryesore). .

Ne do të përdorim një algoritëm minimizimi për të optimizuar vlerat e koeficientit më të mirë për të dhënat e trajnimit. Kjo shpesh zbatohet në praktikë duke përdorur një algoritëm efikas numerik të optimizmit.

Ercole Palmeri