Mafunzo

Uainishaji wa Algorithms ya Kujifunza Mashine: Urekebishaji wa Linear, Uainishaji na nguzo

Kujifunza kwa mashine ina kufanana kubwa na utaboreshaji wa kihesabu, ambayo hutoa njia, nadharia na vikoa vya matumizi. 

Kujifunza kwa mashine kumeandaliwa kama "shida za kupunguza" ya kazi ya kupoteza dhidi ya seti fulani ya mifano (seti ya mafunzo). Kitendaji hiki kinaonyesha utofauti kati ya maadili yaliyotabiriwa na modeli inayofundishwa na maadili yanayotarajiwa kwa kila mfano wa mfano. 

Kusudi la mwisho ni kufundisha mfano uwezo wa kutabiri kwa usahihi kwenye seti ya hali ambazo hazipo kwenye seti ya mafunzo.

Njia kulingana na ambayo inawezekana kutofautisha aina tofauti za algorithm ni aina ya pato inayotarajiwa kutoka kwa mfumo fulani wa mashine kujifunza

Kati ya aina kuu tunayopata:

  • La uainishaji: pembejeo imegawanywa katika madarasa mawili au zaidi na mfumo wa kujifunza lazima uzalishe mfano wenye uwezo wa kugawa darasa moja au zaidi kati ya zile zinazopatikana kwa pembejeo.Aina hizi za kazi hushughulikiwa kawaida kwa kutumia mbinu za kujifunza zilizosimamiwa. 

    Mfano wa uainishaji ni mgawo wa lebo moja au zaidi kwa picha kulingana na vitu au masomo yaliyomo ndani yake;

  • La regression: conceptually sawa na uainishaji na tofauti kwamba pato lina uwanja unaoendelea na usio na discrete.Kwa kawaida inasimamiwa na mafunzo yaliyosimamiwa. 

    Mfano wa kumbukumbu ni makadirio ya kina cha eneo la tukio kutoka kwa uwakilishi wake katika mfumo wa picha ya rangi. 

    Kwa kweli, kikoa cha matokeo katika swali ni karibu na, na sio mdogo kwa seti fulani ya uwezekano;

  • Il Kuunganisha: iko wapi seti ya data imegawanywa katika vikundi ambavyo, hata hivyo, tofauti na uainishaji, hazijulikani kwa msingi.Asili ya shida ya mali ya jamii hii huwafanya kuwa na majukumu ya ujifunzaji yasiyodhibitiwa.
Mfano rahisi wa regression regression

Ukarimu wa mstari niaina inayotumika sana kukadiria maadili halisi kama vile:

  • gharama ya nyumba,
  • idadi ya simu,
  • mauzo kamili kwa kila mtu,

na ifuatavyo kigezo cha mabadiliko yanayoweza kuendelea:

  • mita za mraba,
  • usajili kwa akaunti ya sasa,
  • elimu ya mtu

Kwa ukarabati wa mstari, uhusiano kati ya vijitegemea na violegemeo vya kutegemewa hufuatwa kupitia mstari ambao kwa kawaida huwakilisha uhusiano kati ya viwili viwili.

Mstari unaofaa unajulikana kama laini ya kukandamiza na inawakilishwa na usawa wa aina ya Y = a * X + b.

Mfumo huo ni msingi wa data inayoingiliana kuhusisha tabia mbili au zaidi na kila mmoja. Unapompa algorithm tabia ya kuingiza, regression inarudisha tabia nyingine.

Aina nyingi za laini za kumbukumbu

Tunapokuwa na kutofautisha zaidi ya moja huru, basi tunazungumza juu ya hali nyingi za laini, tukichukuwa mfano kama ufuatao.


y=b0 + b1x1 + b2x2 +… + Bnxn

  • y ni majibu ya maadili, ambayo ni, inawakilisha matokeo yaliyotabiriwa na mfano;
  • b0 ni kukatwa, hiyo ni thamani ya y wakati xi wote ni sawa na 0;
  • tabia ya kwanza b1 mgawo wa x1;
  • kipengele kingine bn mgawo wa xn;
  • x1,x2,…, Xn ni vigezo huru vya mfano.

Kimsingi equation inaelezea uhusiano kati ya mabadiliko endelevu yanayotegemewa (y) na vijiti viwili au zaidi huru (x1, x2, x3…). 

Kwa mfano, ikiwa tunataka kukadiria utoaji wa gari la CO2 (kutofautisha y) kwa kuzingatia nguvu ya injini, idadi ya mitungi na matumizi ya mafuta. Sababu hizi za mwisho ni vijikaratasi huru x1, x2 na x3. Constants bi ni nambari halisi na huitwa mfano wa makadirio ya makadirio ya mfano .. Y ni utofauti unaoendelea wa kutegemea, i.e. jumla ya b0, b1 x1, b2 x2, n.k. y itakuwa idadi halisi.

Uchambuzi wa hali nyingi za kumbukumbu ni njia inayotumiwa kutambua athari ambazo vijitegemea vya kibinafsi zinakuwa na mabadiliko yanayotegemeana.

Kuelewa jinsi mabadiliko yanayotegemeana yanabadilika kama mabadiliko ya mabadiliko huru hutuhusu kutabiri athari au athari za mabadiliko katika hali halisi.

Kutumia kumbukumbu nyingi za mstari inawezekana kuelewa jinsi shinikizo la damu linabadilika kadiri index ya mwili inabadilika kuzingatia mambo kama vile umri, jinsia, na kadhalika, ikidhani kinachoweza kutokea.

Kwa rejareja nyingi tunaweza kupata makadirio juu ya mwenendo wa bei, kama mwenendo wa baadaye wa mafuta au dhahabu.

Mwishowe, regression nyingi za mstari hupata riba kubwa katika uwanja wa kujifunza mashine na akili ya bandia kwani inaruhusu kupata mifano ya kujifunza hata katika kesi ya idadi kubwa ya rekodi kuchambuliwa.

Mfano wa Udhibiti wa Vifaa

Usafirishaji wa vifaa ni zana ya kitakwimu ambayo inakusudia kuonyesha matokeo ya binomial na vigeuzi moja au zaidi vya kuelezea.

Kwa kawaida hutumiwa kwa shida za binary, ambapo kuna madarasa mawili tu, kwa mfano Ndio au Hapana, 0 au 1, kiume au kike nk.

Kwa njia hii inawezekana kuelezea data na kuelezea uhusiano kati ya kutofautisha kwa kutegemea kwa binary na tofauti za kawaida za kawaida au za kawaida.

Matokeo imedhamiriwa shukrani kwa matumizi ya kazi ya vifaa, ambayo inakadiria uwezekano na kisha defihumaliza darasa la karibu zaidi (chanya au hasi) kwa thamani iliyopatikana ya uwezekano.

Tunaweza kuzingatia kumbukumbu ya vifaa kama njia ya kuainisha familia ya inasimamiwa kujifunza algorithms.

Kutumia njia za takwimu, kumbukumbu ya vifaa inaruhusu kutoa matokeo ambayo, kwa kweli, inawakilisha uwezekano kwamba thamani ya pembejeo iliyopewa ni ya darasa fulani.

Katika shida za urekebishaji wa vifaa vya binomial, uwezekano wa kuwa matokeo ni ya darasa moja itakuwa P, wakati hiyo ni ya darasa lingine 1-P (ambapo P ni nambari kati ya 0 na 1 kwa sababu inaonyesha uwezekano).

Udhibiti wa vifaa vya binomial unafanya kazi vizuri katika visa vyote ambavyo kutafakari tunajaribu kutabiri ni binary, ambayo ni, kunaweza tu kudhani maadili mawili: thamani 1 ambayo inawakilisha darasa chanya, au thamani 0 ambayo inawakilisha darasa hasi.

Mfano wa shida ambazo zinaweza kutatuliwa kwa rejista ya vifaa ni:

  • barua-pepe ni barua taka au la;
  • ununuzi mkondoni ni udanganyifu au la, kutathmini hali ya ununuzi;
  • mgonjwa ana shida, akikagua radii yake.

Na kumbukumbu ya vifaa tunaweza kufanya uchanganuzi wa kiufundi, kupima uhusiano kati ya kile tunachotaka kutabiri (kutofautisha tegemezi) na tofauti moja au zaidi huru, i.e. sifa. Ukadiriaji wa uwezekano unafanywa kupitia kazi ya vifaa.

Uwezo huo hubadilishwa baadaye kuwa maadili ya binary, na ili kufanya utabiri kuwa halisi, matokeo haya hupewa darasa ambalo ni la, kwa kuzingatia ikiwa iko karibu na darasa yenyewe.

Kwa mfano, ikiwa utumiaji wa kazi ya vifaa hurudisha 0,85, basi inamaanisha kuwa pembejeo ilizalisha darasa chanya kwa kuipatia darasa la 1. Kinyume chake ikiwa ilipata thamani kama vile 0,4 au zaidi kwa jumla <0,5 ..

Jarida la uvumbuzi
Usikose habari muhimu zaidi kuhusu uvumbuzi. Jisajili ili kuzipokea kwa barua pepe.

Usaidizi wa vifaa hutumia kazi ya vifaa kutathmini uainishaji wa maadili ya pembejeo.

Kazi ya vifaa, ambayo pia huitwa sigmoid, ni curve inayo uwezo wa kuchukua idadi yoyote ya thamani halisi na kuiweka kwa alama kati ya 0 na 1, ukiondoa uliokithiri. Kazi ni:

ambapo:

  • e: msingi wa logarithms asili (nambari ya Euler, au expel kazi exp) ())
  • b0 + b1 * x: ni nambari halisi ya nambari unayotaka kubadilisha.

Uwakilishi unaotumika kwa hali ya kumbukumbu

Usaidizi wa vifaa hutumia equation kama uwakilishi, kama regal regression

Thamani za uingizaji (x) zimejumuishwa kwa usawa kutumia uzito au viwango vya kutosha, kutabiri thamani ya mazao (y). Tofauti muhimu kutoka kwa rejareja ya mstari ni kwamba thamani ya pato la kusongesha ni thamani ya binary (0 au 1) badala ya nambari ya nambari.

Hapa kuna mfano wa equation regression equistic:

y = e^(b0 + b1 * x) / (1 + e^(b0 + b1 * x))

Ambapo:

  • y ni tofauti inayotegemewa, i.e. thamani iliyotabiriwa;
  • b0 ni upatanishi au muda wa kukatiza;
  • b1 ni mgawo wa dhamana ya pembejeo moja (x).

Kila safu katika data ya pembejeo ina mgawo wa b unaohusika (thamani halisi ya kila wakati) ambayo lazima ifundishwe kutoka kwa data ya mafunzo.

Uwakilishi halisi wa mfano ambao ungehifadhi kwenye kumbukumbu au faili ni viambatanisho kwenye equation (beta au b thamani).

Usaidizi wa vifaa unatabiri uwezekano (anuwai ya kiufundi)

Aina za urekebishaji wa vifaa uwezekano wa darasa default.

Kama mfano, hebu fikiria kuwa tunaiga ngono ya watu kama ya kiume au ya kike kutoka urefu wao, darasa la kwanza linaweza kuwa la kiume, na mfano wa kuorodhesha vifaa unaweza kuandikwa kama uwezekano wa kuwa wa kiume kupewa urefu wa mtu, au zaidi. rasmi:

P (ngono = kiume | urefu)

Imeandikwa kwa njia nyingine, tunatoa mfano wa uwezekano kwamba ingizo (X) ni ya darasa la awalidefinite (Y = 1), tunaweza kuiandika kama:

P(X) = P(Y = 1 | X)

Utabiri wa uwezekano lazima ubadilishwe kuwa maadili ya binary (0 au 1) ili kweli kufanya utabiri wa uwezekano.

Usajili wa vifaa ni njia ya mstari, lakini utabiri hubadilishwa kwa kutumia kazi ya vifaa. Athari za hii ni kwamba hatuwezi tena kuelewa utabiri kama mchanganyiko wa pembejeo kama tuwezavyo na ukingo wa mstari, kwa mfano, kuendelea kutoka juu, mfano unaweza kuonyeshwa kama:

p(X) = e ^ (b0 + b1 * X) / (1 + e ^ (b0 + b1 * X))

Sasa tunaweza kubadilisha equation kama ifuatavyo. Ili kuibadilisha, tunaweza kuendelea na kuondoa hiyo kwa upande mmoja kwa kuongeza logarithm ya asili kwa upande mwingine.

ln (p (X) / 1 - p (X)) = b0 + b1 * X

Kwa njia hii tunapata ukweli kwamba hesabu ya matokeo katika upande wa kulia ni sawa tena (sawa na rejeleo la laini), na pembejeo upande wa kushoto ni mantiki ya uwezekano wa darasa default.

Uwezo huhesabiwa kama uwiano wa uwezekano wa tukio lililogawanywa na uwezekano wa tukio hakuna, i.e. 0,8 / (1-0,8) ambaye matokeo yake ni 4. Kwa hivyo tunaweza kuandika:

ln (tabia mbaya) = b0 + b1 * X

Kwa kuwa uwezekano umegeuzwa kwa logi, tunayaita tabia mbaya ya logi ya kushoto au hiari.

Tunaweza kurudisha kipandikiza kulia na kuiandika kama:

uwezekano = e ^ (b0 + b1 * X)

Yote hii inatusaidia kuelewa kuwa kwa kweli mfano bado ni mchanganyiko wa pembejeo, lakini kwamba mchanganyiko huu wa mstari unarejelea uwezekano wa logi wa darasa la awali.definita.

Kujifunza mfano wa kumbukumbu ya vifaa

Coefficients (beta au maadili ya b) ya algorithm ya urekebishaji wa vifaa inakadiriwa katika hatua ya kujifunza. Kwa kufanya hivyo, tunatumia upimaji wa uwezekano mkubwa.

Kadirio la juu zaidi la uwezekano ni kanuni ya kujifunza inayotumiwa na kanuni kadhaa za kujifunza kwa mashine. Migawo inayotokana na kielelezo hutabiri thamani iliyo karibu sana na 1 (k.m. kiume) kwa darasa la shule ya awalidefinite na thamani iliyo karibu sana na 0 (k.m. kike) kwa darasa lingine. Uwezekano wa juu zaidi wa urejeshaji wa vifaa ni utaratibu wa kupata thamani za viwianishi (thamani za Beta au ob) ambazo hupunguza hitilafu katika uwezekano uliotabiriwa na modeli inayohusiana na ile iliyo kwenye data (k.m. uwezekano wa 1 ikiwa data ni darasa la msingi) .

Tutatumia algorithm ya kupunguza kuongeza viwango bora vya mgawo kwa data ya mafunzo. Hii mara nyingi hutekelezwa katika mazoezi kwa kutumia algorithm yenye ufanisi wa hesabu.

Ercole Palmeri


Jarida la uvumbuzi
Usikose habari muhimu zaidi kuhusu uvumbuzi. Jisajili ili kuzipokea kwa barua pepe.

Makala ya hivi karibuni

Kidhibiti cha kutokuaminika cha Uingereza kinainua kengele ya BigTech kupitia GenAI

CMA ya Uingereza imetoa onyo kuhusu tabia ya Big Tech katika soko la kijasusi bandia. Hapo...

Aprili 18 2024

Casa Green: mapinduzi ya nishati kwa mustakabali endelevu nchini Italia

Amri ya "Nyumba za Kijani", iliyoundwa na Umoja wa Ulaya ili kuongeza ufanisi wa nishati ya majengo, imehitimisha mchakato wake wa kutunga sheria na…

Aprili 18 2024

Biashara ya mtandaoni nchini Italia kwa +27% kulingana na Ripoti mpya ya Casaleggio Associati

Ripoti ya kila mwaka ya Casaleggio Associati kuhusu Biashara ya Biashara nchini Italia iliwasilishwa. Ripoti yenye kichwa "AI-Commerce: mipaka ya Biashara ya Kielektroniki yenye Akili Bandia".…

Aprili 17 2024

Wazo Bora: Bandalux inatoa Airpure®, pazia linalosafisha hewa

Matokeo ya uvumbuzi wa mara kwa mara wa kiteknolojia na kujitolea kwa mazingira na ustawi wa watu. Bandalux inatoa Airpure®, hema…

Aprili 12 2024