Seòrsachadh algorithms ionnsachaidh inneal: toirt air ais sreathach, seòrsachadh agus cruinneachadh
Tha innealan gu math coltach ri optimization matamataigeach, a tha a ’toirt seachad dhòighean, teòiridhean agus raointean tagraidh.
San artaigil seo tha sinn airson eisimpleir phractaigeach a thoirt seachad air mar a bu chòir ionnsachadh innealan a chuir an gnìomh a’ cleachdadh algorithms ais-tharraing sreathach, cruinneachadh agus seòrsachadh.
Machine Ionnsachadh
a ' algoritmi di Machine Ionnsachadh e ais-tharraing sreathach tha iad air an cur ri chèile mar “duilgheadasan lughdachadh” de ghnìomh call a thaobh seata eisimpleirean sònraichte (seata trèanaidh). Tha an gnìomh seo a’ cur an cèill an eadar-dhealachadh eadar na luachan a thathar a’ sùileachadh leis a’ mhodail a thathar a’ trèanadh agus na luachan ris a bheil dùil airson gach eisimpleir eisimpleir.
Is e an amas mu dheireadh a bhith a ’teagasg don mhodal comas ro-innse gu ceart air seata de shuidheachaidhean nach eil an làthair anns an t-seata trèanaidh.
Un metodo secondo il quale è possibile distinguere diverse categorie di algorithm è il tipo di output atteso da un certo sistema di ionnsachadh innealan.
Am measg nam prìomh roinnean a lorgas sinn:
- La seòrsachadh: tha na cuir a-steach air an roinn ann an dà chlas no barrachd agus feumaidh an siostam ionnsachaidh modal a chruthachadh a bhios comasach air aon chlas no barrachd a shònrachadh am measg an fheadhainn a tha rim faighinn le cuir a-steach.Mar as trice bithear a ’dèiligeadh ris na seòrsan gnìomhan sin a’ cleachdadh modhan ionnsachaidh fo stiùir.
Is e eisimpleir de sheòrsachadh sònrachadh aon bhileag no barrachd gu ìomhaigh stèidhichte air na nithean no na cuspairean a tha ann;
- La ais-tharraing: gu bun-bheachdail coltach ri seòrsachadh leis an eadar-dhealachadh gu bheil fearann leantainneach agus neo-sgaraichte aig an toradh.Mar as trice tha e air a riaghladh le ionnsachadh fo stiùir.
Tha eisimpleir de ath-thilleadh air a riochdachadh le tuairmse air doimhneachd sealladh a’ tòiseachadh bhon riochdachadh aige ann an cruth ìomhaigh dath. Gu dearbh, tha raon an toraidh sin cha mhòr gun chrìoch, agus gun a bhith cuibhrichte ri seata sònraichte de chothroman;
- Il cruinneachadh: Càite a bheil e tha seata dàta air a roinn ann am buidhnean nach eil, ge-tà, eu-coltach ris an t-seòrsachadh, aithnichte mar a priori.Mar as trice tha fìor dhuilgheadasan nan roinnean seo gan dèanamh nan gnìomhan ionnsachaidh gun stiùireadh.
Modail ath-tharraing sreathach sìmplidh
Tha ais-tharraing sreathach ammodal a chleachdar gu farsaing airson tuairmse a dhèanamh air fìor luachan leithid:
- cosgais thaighean,
- àireamh de ghairmean,
- reic iomlan gach neach,
agus a ’leantainn slat-tomhais caochladairean leantainneach:
- meatairean ceàrnagach,
- ballrachd ri cunntas làithreach,
- foghlam an duine
Ann an toirt air ais sreathach, tha dàimh eadar caochladairean neo-eisimeileach agus caochladairean eisimeileach air a leantainn tro loidhne a tha mar as trice a ’riochdachadh a’ cheangail eadar an dà chaochladair.
Canar an loidhne iomchaidh ris an loidhne ath-tharraing agus tha e air a riochdachadh le co-aontar sreathach den t-seòrsa Y = a * X + b.
La formula si basa sull’interpolazione dei dati per associare tra loro due o più caratteristiche. Quando si fornisce all’algorithm una caratteristica in input, la regressione restituisce l’altra caratteristica.
Modail ath-tharraing sreathach iomadach
Nuair a tha barrachd air aon caochladair neo-eisimeileach againn, bidh sinn a ’bruidhinn air ioma-ais-tharraing sreathach, a’ gabhail ri modail mar a leanas:
tha = b0 + b1x1 + b2x2 +… + B.nxn
- y is e am freagairt do na luachan, is e sin, tha e a ’riochdachadh an toradh a tha am modail a’ dùileachadh;
- b0 is e an intercept, is e sin luach y nuair a tha xi tha iad uile co-ionann ri 0;
- a ’chiad chomharra b1 is e an co-èifeachd x1;
- feart eile fhathast bn is e an co-èifeachd xn;
- x1,x2,…, X.n tha caochladairean neo-eisimeileach a ’mhodail.
Gu bunaiteach tha an co-aontar a ’mìneachadh a’ cheangail eadar caochladair eisimeileach leantainneach (y) agus dà chaochladair neo-eisimeileach no barrachd (x1, x2, x3…).
Mar eisimpleir, nam biodh sinn airson tuairmse a dhèanamh air brùchdadh CO2 càr (caochladair eisimeileach y) a ’beachdachadh air cumhachd an einnsean, an àireamh de siolandairean agus caitheamh connaidh. Is e na factaran mu dheireadh sin na caochladairean neo-eisimeileach x1, x2 agus x3. Is e àireamhan fìor a th ’anns na cungaidhean bi agus canar co-èifeachdan ath-mheasaidh tuairmseach a’ mhodail riutha. Is e Y an caochladair eisimeileach leantainneach, i.e. is e sin suim b0, b1 x1, b2 x2, msaa. y bidh fìor àireamh.
Is e mion-sgrùdadh ath-tharraing air ais dòigh a thathar a ’cleachdadh gus a’ bhuaidh a th ’aig caochladairean neo-eisimeileach air caochladair eisimeileach a chomharrachadh.
Le bhith a ’tuigsinn mar a bhios an caochladair eisimeileach ag atharrachadh mar a bhios na caochladairean neo-eisimeileach ag atharrachadh leigidh sinn leinn buaidh no buaidh atharrachaidhean ann an suidheachaidhean fìor a ro-innse.
Eisimpleirean practaigeach
Le bhith a ’cleachdadh ioma-ais-tharraing sreathach tha e comasach tuigsinn mar a tha bruthadh-fala ag atharrachadh mar a bhios clàr-amais cuirp ag atharrachadh a’ beachdachadh air factaran mar aois, gnè, msaa, mar sin a ’gabhail ris na dh’ fhaodadh tachairt.
Le ioma-ais-tharraing gheibh sinn tuairmsean air gluasadan prìsean, leithid an gluasad san àm ri teachd airson ola no òr.
Mu dheireadh, tha ath-thionndadh ioma-sreathach a’ togail barrachd ùidh ann an raon na algoritmi di ionnsachadh innealan e inntleachd fuadain oir leigidh e leat modalan ionnsachaidh àrd-choileanaidh fhaighinn eadhon ann an cùis àireamh mhòr de chlàran airson mion-sgrùdadh.
Modail toirt air ais logistic
La ais-tharraing loidsigeach na inneal staitistigeil a tha ag amas air toradh binomial a mhodail le aon chaochladair mìneachaidh no barrachd.
Tha e air a chleachdadh sa chumantas airson duilgheadasan binary, far nach eil ann ach dà chlas, mar eisimpleir Tha no Chan eil, 0 no 1, fireann no boireann msaa ...
San dòigh seo tha e comasach cunntas a thoirt air an dàta agus mìneachadh a dhèanamh air a ’cheangal eadar caochladair eisimeil binary agus aon no barrachd caochladairean neo-eisimeileach ainmichte no òrdail.
Tha an toradh air a dhearbhadh le bhith a’ cleachdadh gnìomh loidsistigs, a tha a’ dèanamh tuairmse air coltachd agus an uairsin a’ mìneachadh a’ chlas as fhaisge (dearbhach no àicheil) don luach coltachd a gheibhear.
Faodaidh sinn beachdachadh air toirt air ais logistic mar dhòigh air teaghlach teaghlach a sheòrsachadh algorithms ionnsachaidh fo stiùir.
Le bhith a ’cleachdadh dhòighean staitistigeil, leigidh ais-tharraing logistic toradh a ghineadh a tha, gu dearbh, a’ riochdachadh coltachd gum buin luach inntrigidh sònraichte do chlas sònraichte.
Ann an duilgheadasan ath-tharraing logistic binomial, is e P an coltachd gum buin an toradh do aon chlas, fhad ‘s gum buin e don chlas 1-P eile (far a bheil P na àireamh eadar 0 agus 1 seach gu bheil e a’ cur an cèill coltachd).
Bidh an toirt air ais binomial logistic ag obair gu math anns a h-uile cùis far a bheil an caochladair a tha sinn a ’feuchainn ri ro-innse dà-chànanach, is e sin, chan urrainn dha ach dà luach a ghabhail: an luach 1 a tha a’ riochdachadh a ’chlas adhartach, no an luach 0 a tha a’ riochdachadh a ’chlas àicheil.
Esecpi
Is e eisimpleirean de dhuilgheadasan a dh ’fhuasgladh le ais-tharraing logistic:
- tha post-d mar spama no nach eil;
- tha ceannach air-loidhne meallta no nach eil, a ’luachadh nan cumhachan ceannach;
- tha briseadh aig euslainteach, a ’luachadh a radii.
Le ais-tharraing logistic is urrainn dhuinn mion-sgrùdadh ro-innse a dhèanamh, a ’tomhas a’ cheangail eadar na tha sinn airson a ro-innse (caochladair eisimeileach) agus aon no barrachd caochladairean neo-eisimeileach, i.e. na feartan. Tha tuairmse coltachd air a dhèanamh tro ghnìomh logistic.
Às deidh sin tha na coltasan air an cruth-atharrachadh gu luachan binary, agus gus an ro-innse a dhèanamh fìor, tha an toradh seo air a shònrachadh don chlas dham buin e, stèidhichte air a bheil e faisg air a ’chlas fhèin no nach eil.
Mar eisimpleir, ma thilleas cleachdadh na gnìomh logistic 0,85, tha e a ’ciallachadh gun do ghineadh an cur-a-steach clas adhartach le bhith ga shònrachadh gu clas 1. Air an làimh eile nam biodh e air luach leithid 0,4 no barrachd fhaighinn san fharsaingeachd <0,5 ..
Bidh ais-tharraing logistic a ’cleachdadh a’ ghnìomh logistic gus measadh a dhèanamh air seòrsachadh nan luachan inntrigidh.
Tha an gnìomh logistic, ris an canar cuideachd sigmoid, na lùb a tha comasach air àireamh sam bith de fhìor luach a thoirt agus a mhapadh gu luach eadar 0 agus 1, gun a bhith a ’toirt a-steach ìrean anabarrach. Is e an gnìomh:
Càite a bheil e:
- e: bunait logarithms nàdurrach (àireamh Euler, no excel function exp ())
- b0 + b1 * x: is e an fhìor luach àireamhach a tha thu airson cruth-atharrachadh.
Riochdachadh air a chleachdadh airson toirt air ais logistic
Bidh ais-tharraing loidsigeach a’ cleachdadh co-aontar mar riochdachadh, gu math coltach ri ais-tharraing sreathach.
Tha na luachan inntrigidh (x) air an cur còmhla gu sreathach le bhith a ’cleachdadh cuideaman no luachan coefficient, gus luach toraidh (y) a ro-innse. Is e prìomh eadar-dhealachadh bho ais-tharraing sreathach gur e luach binary (0 no 1) a th ’anns an luach toraidh modailichte seach luach àireamhach.
Gu h-ìosal tha eisimpleir de cho-aontar toirt air ais logistic:
y = e^(b0 + b1 * x) / (1 + e^(b0 + b1 * x))
Dove:
- y is e an caochlaideach eisimeileach, i.e. an luach ris a bheil dùil;
- is e b0 an teirm polarization no intercept;
- Is e b1 an co-èifeachd airson an luach cur-a-steach singilte (x).
Tha co-èifeachd b (luach fìor seasmhach) aig gach colbh san dàta inntrigidh a dh ’fheumar ionnsachadh bhon dàta trèanaidh.
Is e fìor riochdachadh a ’mhodail a bhiodh tu a’ stòradh mar chuimhneachan no faidhle na co-èifeachdan anns a ’cho-aontar (an luach beta no b).
Tha ro-aithris logistic a ’ro-innse coltachdan (raon teignigeach)
Tha ath-thilleadh loidsigeach a’ samhlachadh coltachd clas bunaiteach, ann an algoritmi di ionnsachadh innealan.
Mar eisimpleir, gabhamaid ris gu bheil sinn a ’modaladh gnè dhaoine mar fhireannach no boireann bhon àirde aca, dh’ fhaodadh a ’chiad chlas a bhith fireann, agus dh’ fhaodadh am modail ais-ghairm logistic a bhith air a sgrìobhadh mar an coltachd a bhith fireann le àirde neach, no barrachd. gu foirmeil:
P (gnè = fireann | àirde)
Air a sgrìobhadh ann an dòigh eile, tha sinn a’ modaladh a’ choltachd gum buin in-chur (X) don chlas bunaiteach (Y = 1), is urrainn dhuinn a sgrìobhadh mar:
P(X) = P(Y = 1 | X)
Feumaidh an ro-aithris coltachd a bhith air a thionndadh gu luachan binary (0 no 1) gus ro-innse coltachd a dhèanamh.
Is e dòigh sreathach a th ’ann an toirt air ais logistic, ach tha ro-innse air an cruth-atharrachadh a’ cleachdadh a ’ghnìomh logistic. Is e a ’bhuaidh a tha aig seo nach urrainn dhuinn ro-innse a thuigsinn tuilleadh mar mheasgachadh sreathach de chur-a-steach mar as urrainn dhuinn le ais-tharraing sreathach, mar eisimpleir, a’ leantainn bho shuas, faodar am modail a chuir an cèill mar:
p(X) = e ^ (b0 + b1 * X) / (1 + e ^ (b0 + b1 * X))
A-nis is urrainn dhuinn an co-aontar a thionndadh air ais mar a leanas. Gus a thionndadh air ais, is urrainn dhuinn a dhol air adhart le bhith a ’toirt air falbh an e air aon taobh le bhith a’ cur logarithm nàdurrach air an taobh eile.
ln (p (X) / 1 - p (X)) = b0 + b1 * X.
San dòigh seo tha sinn a ’faighinn a-mach gu bheil àireamhachadh an toraidh air an taobh cheart sreathach a-rithist (dìreach mar ais-tharraing sreathach), agus tha an cur-a-steach air an taobh chlì mar logarithm de choltachd a’ chlas àbhaisteach.
Àireamhachadh coltachd
Tha na coltachdan air an tomhas mar cho-mheas de choltachd an tachartais air a roinn le coltachd tachartas sam bith, m.e. 0,8 / (1-0,8) aig a bheil toradh 4. Mar sin b ’urrainn dhuinn sgrìobhadh an àite sin:
ln (odds) = b0 + b1 * X.
Leis gu bheil coltasan air an cruth-atharrachadh le log, is e seo an t-ainm log-odds no probit air an taobh chlì.
Faodaidh sinn an taisbeanair a thilleadh chun taobh cheart agus a sgrìobhadh mar:
coltachd = e ^ (b0 + b1 * X)
Tha seo uile gar cuideachadh a’ tuigsinn gu bheil am modail fhathast na mheasgachadh sreathach de na cuir a-steach, ach gu bheil am measgachadh sreathach seo a’ toirt iomradh air coltachd logaichean a’ chlas bunaiteach.
Ag ionnsachadh a ’mhodail ais-tharraing logistic
I coefficienti (valori beta o b) dell’algorithm di regressione logistica vengono stimati in fase di apprendimento. Per farlo, usiamo la stima di massima verosimiglianza.
La stima di massima verosimiglianza è un algorithm di apprendimento utilizzato da diversi algoritmi di apprendimento automatico. I coefficienti risultanti dal modello, prevedono un valore molto vicino a 1 (ad es. Maschio) per la classe predefinita e un valore molto vicino a 0 (ad es. Femmina) per l’altra classe. La massima verosimiglianza per la regressione logistica è una procedura di ricerca valori per i coefficienti (valori Beta o b) che minimizzano l’errore nelle probabilità previste dal modello rispetto a quelle nei dati (es. Probabilità 1 se il dato è il primario classe).
Utilizzeremo un algorithm di minimizzazione per ottimizzare i migliori valori dei coefficienti per i dati di allenamento. Questo è spesso implementato nella pratica utilizzando un efficiente algorithm di ottimizzazione numerica.
Ercole Palmeri