Mësimi i makinerisë është formuluar si "probleme minimizimi" i një funksioni humbjeje ndaj një grupi të caktuar shembujsh (grup trajnimesh). Ky funksion shpreh mospërputhjen midis vlerave të parashikuara nga modeli që trajnohet dhe vlerave të pritura për secilin shembull shembull.
Qëllimi përfundimtar është t'i mësojmë modelit aftësinë për të parashikuar saktë në një seri rastesh që nuk janë të pranishme në grupin e trajnimit.
Një metodë sipas së cilës është e mundur të dallohen kategori të ndryshme të algoritmit është lloji i prodhimit që pritet nga një sistem i caktuar Mësimi makinë.
Ndër kategoritë kryesore gjejmë:
Një shembull i klasifikimit është caktimi i një ose më shumë etiketave në një imazh bazuar në objektet ose subjektet që përmbahen në të;
Një shembull i regresionit është vlerësimi i thellësisë së një skene nga paraqitja e tij në formën e një imazhi me ngjyra.
Në fakt, fusha e rezultatit në fjalë është praktikisht e pafund, dhe nuk kufizohet në një grup të caktuar diskret të mundësive;
Regresioni linear është amModeli i përdorur gjerësisht i përdorur për të vlerësuar vlerat reale siç janë:
dhe ndjek kriterin e variablave të vazhdueshëm:
Në regresionin linear, një marrëdhënie midis variablave të pavarur dhe ndryshoreve të varura përcillet përmes një linje që zakonisht paraqet marrëdhënien midis dy ndryshoreve.
Linja fitore njihet si vija e regresionit dhe përfaqësohet nga një ekuacion linear i tipit Y = a * X + b.
Formula bazohet në të dhënat e ndërhyrjes për të shoqëruar dy ose më shumë karakteristika me njëra-tjetrën. Kur i jepni algoritmit një karakteristikë hyrëse, regresioni i kthen karakteristikën tjetër.
Kur kemi më shumë se një variabël të pavarur, atëherë flasim për regresion të shumëfishtë linear, duke supozuar një model si më poshtë:
y=b0 b1x1 b2x2 +… + Bnxn
Në thelb ekuacioni shpjegon marrëdhëniet midis një ndryshore të varur të vazhdueshme (y) dhe dy ose më shumë variablave të pavarur (x1, x2, x3 ...).
Për shembull, nëse do të donim të vlerësonim emetimin e CO2 të një makine (varur varëse y) duke marrë parasysh fuqinë e motorit, numrin e cilindrave dhe konsumin e karburantit. Këta faktorë të fundit janë ndryshoret e pavarura x1, x2 dhe x3. Konstantet bi janë numra realë dhe quhen koeficientët e vlerësuar të regresionit të modelit.Y është variabla e varur e vazhdueshme, d.m.th. është shuma e b0, b1 x1, b2 x2, etj. y do të jetë një numër real.
Analiza e regresionit të shumëfishtë është një metodë e përdorur për të identifikuar efektin që variablat e pavarur kanë në një variabël të varur.
Të kuptuarit se si ndryshimi i varur ndryshon si ndryshimi i variablave të pavarur, na lejon të parashikojmë efektet ose ndikimet e ndryshimeve në situata reale.
Duke përdorur regresionin e shumëfishtë linear është e mundur të kuptohet se si ndryshon presioni i gjakut pasi indeksi i masës së trupit ndryshon duke marrë parasysh faktorë të tillë si mosha, seksi, etj., Duke supozuar kështu se çfarë mund të ndodhë.
Me regresion të shumëfishtë mund të marrim vlerësime mbi tendencat e çmimeve, siç është tendenca e ardhshme për naftë ose ari.
Më në fund, regresioni i shumëfishtë linear po gjen interes më të madh në fushën e të mësuarit të makinerive dhe inteligjencës artificiale pasi lejon të përftohen modele të të nxënit të kryer edhe në rastin e një numri të madh të regjistrave që do të analizohen.
Regresioni logjistik është një mjet statistikor që synon të modelojë një rezultat binom me një ose më shumë ndryshore shpjeguese.
Përdoret në përgjithësi për probleme binare, ku ekzistojnë vetëm dy klasa, për shembull Po ose Jo, 0 ose 1, mashkull ose femër etj ...
Në këtë mënyrë është e mundur të përshkruhen të dhënat dhe të shpjegohet marrëdhënia midis një variabël të varur binar dhe një ose më shumë ndryshore nominale ose rendore të pavarura.
Rezultati përcaktohet falë përdorimit të një funksioni logjistik, i cili vlerëson një probabilitet dhe më pas defipërfundon klasën më të afërt (pozitive ose negative) me vlerën e fituar të probabilitetit.
Ne mund ta konsiderojmë regresionin logjistik si një metodë për të klasifikuar familjen e algoritme mësimore të mbikëqyrura.
Duke përdorur metodat statistikore, regresioni logjistik lejon të gjenerojë një rezultat i cili, në të vërtetë, paraqet një probabilitet që një vlerë e dhënë hyrëse e caktuar i përket një klase të caktuar.
Në problemet e regresionit logjistik binom, probabiliteti që prodhimi i përket një klase do të jetë P, ndërsa që i përket klasës tjetër 1-P (ku P është një numër midis 0 dhe 1 sepse shpreh një probabilitet).
Regresioni logjistik binomik funksionon mirë në të gjitha ato raste në të cilat variabla që ne po përpiqemi të parashikojmë është binare, domethënë mund të supozojë vetëm dy vlera: vlera 1 e cila përfaqëson klasën pozitive, ose vlerën 0 e cila përfaqëson klasën negative.
Shembuj të problemeve që mund të zgjidhen me regresion logjistik janë:
Me regresionin logjistik mund të bëjmë një analizë parashikuese, duke matur marrëdhëniet midis asaj që duam të parashikojmë (ndryshoren e varur) dhe një ose më shumë ndryshore të pavarura, d.m.th. karakteristikat. Vlerësimi i probabilitetit bëhet përmes një funksioni logjistik.
Probabilitetet më pas shndërrohen në vlera binare, dhe për ta bërë parashikimin real, ky rezultat i caktohet klasës së cilës i përket, bazuar në faktin nëse është afër vetë klasës.
Për shembull, nëse aplikimi i funksionit logjistik kthen 0,85, atëherë kjo do të thotë që hyrja ka gjeneruar një klasë pozitive duke e caktuar atë në klasën 1. Anasjelltas nëse do të kishte marrë një vlerë të tillë si 0,4 ose më përgjithësisht <0,5 ..
Regresioni logjistik përdor funksionin logjistik për të vlerësuar klasifikimin e vlerave të hyrjes.
Funksioni logjistik, i quajtur gjithashtu sigmoid, është një kurbë e aftë për të marrë çdo numër të vlerës reale dhe duke e hartuar atë në një vlerë midis 0 dhe 1, duke përjashtuar ekstremet. Funksioni është:
ku:
Regresioni logjistik përdor një ekuacion si përfaqësim, shumë si regresioni linear
Vlerat e hyrjes (x) kombinohen në mënyrë lineare duke përdorur peshat ose vlerat e koeficientit, për të parashikuar një vlerë të prodhimit (y). Një ndryshim kryesor nga regresioni linear është se vlera e daljes së modeluar është një vlerë binare (0 ose 1) sesa një vlerë numerike.
Këtu është një shembull i një ekuacioni të regresionit logjistik:
y = e^(b0 + b1 * x) / (1 + e^(b0 + b1 * x))
ku:
Do kolonë në të dhënat hyrëse ka një koeficient b shoqërues (një vlerë reale konstante) që duhet të mësohet nga të dhënat e trajnimit.
Përfaqësimi aktual i modelit që do të ruanit në memorje ose një skedar janë koeficientët në ekuacion (vlera beta ose b).
Regresioni logjistik modelon mundësinë e klasës së paracaktuar.
Si shembull, le të supozojmë se ne po modelojmë seksin e njerëzve si mashkull ose femër nga lartësia e tyre, klasa e parë mund të ishte mashkull, dhe modeli i regresionit logjistik mund të shkruhej si probabiliteti për t'u mashkull i dhënë lartësinë e një personi, ose më shumë. zyrtarisht:
P (seksi = mashkull | lartësia)
E shkruar në një mënyrë tjetër, ne po modelojmë probabilitetin që një hyrje (X) i përket klasës predefinite (Y = 1), mund ta shkruajmë si:
P(X) = P(Y = 1 | X)
Parashikimi i probabilitetit duhet të shndërrohet në vlera binare (0 ose 1) në mënyrë që të bëjë një parashikim të probabilitetit.
Regresioni logjistik është një metodë lineare, por parashikimet shndërrohen duke përdorur funksionin logjistik. Ndikimi i kësaj është se ne nuk mund të kuptojmë më parashikimet si një kombinim linear i inputeve siç mundemi me regresionin linear, për shembull, duke vazhduar nga lart, modeli mund të shprehet si:
p(X) = e ^ (b0 + b1 * X) / (1 + e ^ (b0 + b1 * X))
Tani mund ta kthejmë ekuacionin si më poshtë. Për ta kthyer atë mund të vazhdojmë duke hequr e në njërën anë duke shtuar një logaritëm natyror në anën tjetër.
ln (p (X) / 1 - p (X)) = b0 + b1 * X
Në këtë mënyrë marrim faktin se llogaritja e rezultatit në të djathtë është përsëri linear (ashtu si regresioni linear), dhe inputi në të majtë është një logaritëm i probabilitetit të klasës së paracaktuar.
Probabilitetet llogariten si një raport i probabilitetit të ngjarjes të ndarë me probabilitetin e asnjë ngjarjeje, p.sh. 0,8 / (1-0,8) rezultati i të cilit është 4. Kështu që ne mund të shkruanim:
ln (shanset) = b0 + b1 * X
Meqenëse probabilitetet janë të shndërruara në log, ne i quajmë këto shanse logjike ose provë të anës së majtë.
Ne mund ta kthejmë eksponentin në të djathtë dhe ta shkruajmë si:
probabiliteti = e ^ (b0 + b1 * X)
E gjithë kjo na ndihmon të kuptojmë se në të vërtetë modeli është ende një kombinim linear i hyrjeve, por që ky kombinim linear i referohet probabiliteteve log të klasës paraprake.definita
Koeficientët (vlerat beta ose b) të algoritmit të regresionit logjistik vlerësohen në fazën e mësimit. Për ta bërë këtë, ne përdorim vlerësimin maksimal të gjasave.
Vlerësimi i gjasave maksimale është një algoritëm mësimor i përdorur nga disa algoritme të mësimit të makinerive. Koeficientët që rezultojnë nga modeli parashikojnë një vlerë shumë afër 1 (p.sh. mashkull) për klasën parashkolloredefinite dhe një vlerë shumë afër 0 (p.sh. femra) për klasën tjetër. Mundësia maksimale për regresionin logjistik është një procedurë e gjetjes së vlerave për koeficientët (vlerat beta ose ob) që minimizojnë gabimin në probabilitetet e parashikuara nga modeli në lidhje me ato në të dhëna (p.sh. probabiliteti 1 nëse të dhënat janë klasa kryesore). .
Ne do të përdorim një algoritëm minimizimi për të optimizuar vlerat e koeficientit më të mirë për të dhënat e trajnimit. Kjo shpesh zbatohet në praktikë duke përdorur një algoritëm efikas numerik të optimizmit.
Zhvillimi i aftësive të shkëlqyera motorike përmes ngjyrosjes i përgatit fëmijët për aftësi më komplekse si shkrimi. Për të ngjyrosur…
Sektori detar është një fuqi e vërtetë ekonomike globale, e cila ka lundruar drejt një tregu prej 150 miliardë...
Të hënën e kaluar, Financial Times njoftoi një marrëveshje me OpenAI. FT licencon gazetarinë e saj të klasit botëror…
Miliona njerëz paguajnë për shërbimet e transmetimit, duke paguar tarifat mujore të abonimit. Është e zakonshme që ju…