Seòrsachadh algorithms ionnsachaidh inneal: toirt air ais sreathach, seòrsachadh agus cruinneachadh

ais-tharraing sreathach

Tha innealan gu math coltach ri optimization matamataigeach, a tha a ’toirt seachad dhòighean, teòiridhean agus raointean tagraidh. 

San artaigil seo tha sinn airson eisimpleir phractaigeach a thoirt seachad air mar a bu chòir ionnsachadh innealan a chuir an gnìomh a’ cleachdadh algorithms ais-tharraing sreathach, cruinneachadh agus seòrsachadh.

Machine Ionnsachadh

a ' algoritmi di Machine Ionnsachadh e ais-tharraing sreathach tha iad air an cur ri chèile mar “duilgheadasan lughdachadh” de ghnìomh call a thaobh seata eisimpleirean sònraichte (seata trèanaidh). Tha an gnìomh seo a’ cur an cèill an eadar-dhealachadh eadar na luachan a thathar a’ sùileachadh leis a’ mhodail a thathar a’ trèanadh agus na luachan ris a bheil dùil airson gach eisimpleir eisimpleir. 

Is e an amas mu dheireadh a bhith a ’teagasg don mhodal comas ro-innse gu ceart air seata de shuidheachaidhean nach eil an làthair anns an t-seata trèanaidh.

Un metodo secondo il quale è possibile distinguere diverse categorie di algorithm è il tipo di output atteso da un certo sistema di ionnsachadh innealan

Am measg nam prìomh roinnean a lorgas sinn:

  • La seòrsachadh: tha na cuir a-steach air an roinn ann an dà chlas no barrachd agus feumaidh an siostam ionnsachaidh modal a chruthachadh a bhios comasach air aon chlas no barrachd a shònrachadh am measg an fheadhainn a tha rim faighinn le cuir a-steach.Mar as trice bithear a ’dèiligeadh ris na seòrsan gnìomhan sin a’ cleachdadh modhan ionnsachaidh fo stiùir. 

    Is e eisimpleir de sheòrsachadh sònrachadh aon bhileag no barrachd gu ìomhaigh stèidhichte air na nithean no na cuspairean a tha ann;

  • La ais-tharraing: gu bun-bheachdail coltach ri seòrsachadh leis an eadar-dhealachadh gu bheil fearann ​​leantainneach agus neo-sgaraichte aig an toradh.Mar as trice tha e air a riaghladh le ionnsachadh fo stiùir. 

    Tha eisimpleir de ath-thilleadh air a riochdachadh le tuairmse air doimhneachd sealladh a’ tòiseachadh bhon riochdachadh aige ann an cruth ìomhaigh dath. Gu dearbh, tha raon an toraidh sin cha mhòr gun chrìoch, agus gun a bhith cuibhrichte ri seata sònraichte de chothroman;

  • Il cruinneachadh: Càite a bheil e tha seata dàta air a roinn ann am buidhnean nach eil, ge-tà, eu-coltach ris an t-seòrsachadh, aithnichte mar a priori.Mar as trice tha fìor dhuilgheadasan nan roinnean seo gan dèanamh nan gnìomhan ionnsachaidh gun stiùireadh.

Modail ath-tharraing sreathach sìmplidh

Tha ais-tharraing sreathach ammodal a chleachdar gu farsaing airson tuairmse a dhèanamh air fìor luachan leithid:

  • cosgais thaighean,
  • àireamh de ghairmean,
  • reic iomlan gach neach,

agus a ’leantainn slat-tomhais caochladairean leantainneach:

  • meatairean ceàrnagach,
  • ballrachd ri cunntas làithreach,
  • foghlam an duine

Ann an toirt air ais sreathach, tha dàimh eadar caochladairean neo-eisimeileach agus caochladairean eisimeileach air a leantainn tro loidhne a tha mar as trice a ’riochdachadh a’ cheangail eadar an dà chaochladair.

Canar an loidhne iomchaidh ris an loidhne ath-tharraing agus tha e air a riochdachadh le co-aontar sreathach den t-seòrsa Y = a * X + b.

La formula si basa sull’interpolazione dei dati per associare tra loro due o più caratteristiche. Quando si fornisce all’algorithm una caratteristica in input, la regressione restituisce l’altra caratteristica.

algairim ionnsachaidh inneal loidhne ais-tharraing
Linea di Regressione dell’algorithm di ionnsachadh innealan

Modail ath-tharraing sreathach iomadach

Nuair a tha barrachd air aon caochladair neo-eisimeileach againn, bidh sinn a ’bruidhinn air ioma-ais-tharraing sreathach, a’ gabhail ri modail mar a leanas:


tha = b0 + b1x1 + b2x2 +… + B.nxn

  • y is e am freagairt do na luachan, is e sin, tha e a ’riochdachadh an toradh a tha am modail a’ dùileachadh;
  • b0 is e an intercept, is e sin luach y nuair a tha xi tha iad uile co-ionann ri 0;
  • a ’chiad chomharra b1 is e an co-èifeachd x1;
  • feart eile fhathast bn is e an co-èifeachd xn;
  • x1,x2,…, X.n tha caochladairean neo-eisimeileach a ’mhodail.

Gu bunaiteach tha an co-aontar a ’mìneachadh a’ cheangail eadar caochladair eisimeileach leantainneach (y) agus dà chaochladair neo-eisimeileach no barrachd (x1, x2, x3…). 

Mar eisimpleir, nam biodh sinn airson tuairmse a dhèanamh air brùchdadh CO2 càr (caochladair eisimeileach y) a ’beachdachadh air cumhachd an einnsean, an àireamh de siolandairean agus caitheamh connaidh. Is e na factaran mu dheireadh sin na caochladairean neo-eisimeileach x1, x2 agus x3. Is e àireamhan fìor a th ’anns na cungaidhean bi agus canar co-èifeachdan ath-mheasaidh tuairmseach a’ mhodail riutha. Is e Y an caochladair eisimeileach leantainneach, i.e. is e sin suim b0, b1 x1, b2 x2, msaa. y bidh fìor àireamh.

Is e mion-sgrùdadh ath-tharraing air ais dòigh a thathar a ’cleachdadh gus a’ bhuaidh a th ’aig caochladairean neo-eisimeileach air caochladair eisimeileach a chomharrachadh.

Le bhith a ’tuigsinn mar a bhios an caochladair eisimeileach ag atharrachadh mar a bhios na caochladairean neo-eisimeileach ag atharrachadh leigidh sinn leinn buaidh no buaidh atharrachaidhean ann an suidheachaidhean fìor a ro-innse.

Eisimpleirean practaigeach

Le bhith a ’cleachdadh ioma-ais-tharraing sreathach tha e comasach tuigsinn mar a tha bruthadh-fala ag atharrachadh mar a bhios clàr-amais cuirp ag atharrachadh a’ beachdachadh air factaran mar aois, gnè, msaa, mar sin a ’gabhail ris na dh’ fhaodadh tachairt.

Le ioma-ais-tharraing gheibh sinn tuairmsean air gluasadan prìsean, leithid an gluasad san àm ri teachd airson ola no òr.

Mu dheireadh, tha ath-thionndadh ioma-sreathach a’ togail barrachd ùidh ann an raon na algoritmi di ionnsachadh innealan e inntleachd fuadain oir leigidh e leat modalan ionnsachaidh àrd-choileanaidh fhaighinn eadhon ann an cùis àireamh mhòr de chlàran airson mion-sgrùdadh.

Modail toirt air ais logistic

La ais-tharraing loidsigeach na inneal staitistigeil a tha ag amas air toradh binomial a mhodail le aon chaochladair mìneachaidh no barrachd.

Tha e air a chleachdadh sa chumantas airson duilgheadasan binary, far nach eil ann ach dà chlas, mar eisimpleir Tha no Chan eil, 0 no 1, fireann no boireann msaa ...

San dòigh seo tha e comasach cunntas a thoirt air an dàta agus mìneachadh a dhèanamh air a ’cheangal eadar caochladair eisimeil binary agus aon no barrachd caochladairean neo-eisimeileach ainmichte no òrdail.

Tha an toradh air a dhearbhadh le bhith a’ cleachdadh gnìomh loidsistigs, a tha a’ dèanamh tuairmse air coltachd agus an uairsin a’ mìneachadh a’ chlas as fhaisge (dearbhach no àicheil) don luach coltachd a gheibhear.

Faodaidh sinn beachdachadh air toirt air ais logistic mar dhòigh air teaghlach teaghlach a sheòrsachadh algorithms ionnsachaidh fo stiùir.

Le bhith a ’cleachdadh dhòighean staitistigeil, leigidh ais-tharraing logistic toradh a ghineadh a tha, gu dearbh, a’ riochdachadh coltachd gum buin luach inntrigidh sònraichte do chlas sònraichte.

Ann an duilgheadasan ath-tharraing logistic binomial, is e P an coltachd gum buin an toradh do aon chlas, fhad ‘s gum buin e don chlas 1-P eile (far a bheil P na àireamh eadar 0 agus 1 seach gu bheil e a’ cur an cèill coltachd).

Bidh an toirt air ais binomial logistic ag obair gu math anns a h-uile cùis far a bheil an caochladair a tha sinn a ’feuchainn ri ro-innse dà-chànanach, is e sin, chan urrainn dha ach dà luach a ghabhail: an luach 1 a tha a’ riochdachadh a ’chlas adhartach, no an luach 0 a tha a’ riochdachadh a ’chlas àicheil.

Esecpi

Is e eisimpleirean de dhuilgheadasan a dh ’fhuasgladh le ais-tharraing logistic:

  • tha post-d mar spama no nach eil;
  • tha ceannach air-loidhne meallta no nach eil, a ’luachadh nan cumhachan ceannach;
  • tha briseadh aig euslainteach, a ’luachadh a radii.

Le ais-tharraing logistic is urrainn dhuinn mion-sgrùdadh ro-innse a dhèanamh, a ’tomhas a’ cheangail eadar na tha sinn airson a ro-innse (caochladair eisimeileach) agus aon no barrachd caochladairean neo-eisimeileach, i.e. na feartan. Tha tuairmse coltachd air a dhèanamh tro ghnìomh logistic.

Às deidh sin tha na coltasan air an cruth-atharrachadh gu luachan binary, agus gus an ro-innse a dhèanamh fìor, tha an toradh seo air a shònrachadh don chlas dham buin e, stèidhichte air a bheil e faisg air a ’chlas fhèin no nach eil.

Mar eisimpleir, ma thilleas cleachdadh na gnìomh logistic 0,85, tha e a ’ciallachadh gun do ghineadh an cur-a-steach clas adhartach le bhith ga shònrachadh gu clas 1. Air an làimh eile nam biodh e air luach leithid 0,4 no barrachd fhaighinn san fharsaingeachd <0,5 ..

Bidh ais-tharraing logistic a ’cleachdadh a’ ghnìomh logistic gus measadh a dhèanamh air seòrsachadh nan luachan inntrigidh.

Tha an gnìomh logistic, ris an canar cuideachd sigmoid, na lùb a tha comasach air àireamh sam bith de fhìor luach a thoirt agus a mhapadh gu luach eadar 0 agus 1, gun a bhith a ’toirt a-steach ìrean anabarrach. Is e an gnìomh:

Càite a bheil e:

  • e: bunait logarithms nàdurrach (àireamh Euler, no excel function exp ())
  • b0 + b1 * x: is e an fhìor luach àireamhach a tha thu airson cruth-atharrachadh.
gnìomh logistics
Gnìomh sigmoid

Riochdachadh air a chleachdadh airson toirt air ais logistic

Bidh ais-tharraing loidsigeach a’ cleachdadh co-aontar mar riochdachadh, gu math coltach ri ais-tharraing sreathach.

Tha na luachan inntrigidh (x) air an cur còmhla gu sreathach le bhith a ’cleachdadh cuideaman no luachan coefficient, gus luach toraidh (y) a ro-innse. Is e prìomh eadar-dhealachadh bho ais-tharraing sreathach gur e luach binary (0 no 1) a th ’anns an luach toraidh modailichte seach luach àireamhach.

Gu h-ìosal tha eisimpleir de cho-aontar toirt air ais logistic:

y = e^(b0 + b1 * x) / (1 + e^(b0 + b1 * x))

Dove:

  • y is e an caochlaideach eisimeileach, i.e. an luach ris a bheil dùil;
  • is e b0 an teirm polarization no intercept;
  • Is e b1 an co-èifeachd airson an luach cur-a-steach singilte (x).

Tha co-èifeachd b (luach fìor seasmhach) aig gach colbh san dàta inntrigidh a dh ’fheumar ionnsachadh bhon dàta trèanaidh.

Is e fìor riochdachadh a ’mhodail a bhiodh tu a’ stòradh mar chuimhneachan no faidhle na co-èifeachdan anns a ’cho-aontar (an luach beta no b).

Tha ro-aithris logistic a ’ro-innse coltachdan (raon teignigeach)

Tha ath-thilleadh loidsigeach a’ samhlachadh coltachd clas bunaiteach, ann an algoritmi di ionnsachadh innealan.

Mar eisimpleir, gabhamaid ris gu bheil sinn a ’modaladh gnè dhaoine mar fhireannach no boireann bhon àirde aca, dh’ fhaodadh a ’chiad chlas a bhith fireann, agus dh’ fhaodadh am modail ais-ghairm logistic a bhith air a sgrìobhadh mar an coltachd a bhith fireann le àirde neach, no barrachd. gu foirmeil:

P (gnè = fireann | àirde)

Air a sgrìobhadh ann an dòigh eile, tha sinn a’ modaladh a’ choltachd gum buin in-chur (X) don chlas bunaiteach (Y = 1), is urrainn dhuinn a sgrìobhadh mar:

P(X) = P(Y = 1 | X)

Feumaidh an ro-aithris coltachd a bhith air a thionndadh gu luachan binary (0 no 1) gus ro-innse coltachd a dhèanamh.

Is e dòigh sreathach a th ’ann an toirt air ais logistic, ach tha ro-innse air an cruth-atharrachadh a’ cleachdadh a ’ghnìomh logistic. Is e a ’bhuaidh a tha aig seo nach urrainn dhuinn ro-innse a thuigsinn tuilleadh mar mheasgachadh sreathach de chur-a-steach mar as urrainn dhuinn le ais-tharraing sreathach, mar eisimpleir, a’ leantainn bho shuas, faodar am modail a chuir an cèill mar:

p(X) = e ^ (b0 + b1 * X) / (1 + e ^ (b0 + b1 * X))

A-nis is urrainn dhuinn an co-aontar a thionndadh air ais mar a leanas. Gus a thionndadh air ais, is urrainn dhuinn a dhol air adhart le bhith a ’toirt air falbh an e air aon taobh le bhith a’ cur logarithm nàdurrach air an taobh eile.

ln (p (X) / 1 - p (X)) = b0 + b1 * X.

San dòigh seo tha sinn a ’faighinn a-mach gu bheil àireamhachadh an toraidh air an taobh cheart sreathach a-rithist (dìreach mar ais-tharraing sreathach), agus tha an cur-a-steach air an taobh chlì mar logarithm de choltachd a’ chlas àbhaisteach.

Àireamhachadh coltachd

Tha na coltachdan air an tomhas mar cho-mheas de choltachd an tachartais air a roinn le coltachd tachartas sam bith, m.e. 0,8 / (1-0,8) aig a bheil toradh 4. Mar sin b ’urrainn dhuinn sgrìobhadh an àite sin:

ln (odds) = b0 + b1 * X.

Leis gu bheil coltasan air an cruth-atharrachadh le log, is e seo an t-ainm log-odds no probit air an taobh chlì.

Faodaidh sinn an taisbeanair a thilleadh chun taobh cheart agus a sgrìobhadh mar:

coltachd = e ^ (b0 + b1 * X)

Tha seo uile gar cuideachadh a’ tuigsinn gu bheil am modail fhathast na mheasgachadh sreathach de na cuir a-steach, ach gu bheil am measgachadh sreathach seo a’ toirt iomradh air coltachd logaichean a’ chlas bunaiteach.

Ag ionnsachadh a ’mhodail ais-tharraing logistic

I coefficienti (valori beta o b) dell’algorithm di regressione logistica vengono stimati in fase di apprendimento. Per farlo, usiamo la stima di massima verosimiglianza.

La stima di massima verosimiglianza è un algorithm di apprendimento utilizzato da diversi algoritmi di apprendimento automatico. I coefficienti risultanti dal modello, prevedono un valore molto vicino a 1 (ad es. Maschio) per la classe predefinita e un valore molto vicino a 0 (ad es. Femmina) per l’altra classe. La massima verosimiglianza per la regressione logistica è una procedura di ricerca valori per i coefficienti (valori Beta o b) che minimizzano l’errore nelle probabilità previste dal modello rispetto a quelle nei dati (es. Probabilità 1 se il dato è il primario classe).

Utilizzeremo un algorithm di minimizzazione per ottimizzare i migliori valori dei coefficienti per i dati di allenamento. Questo è spesso implementato nella pratica utilizzando un efficiente algorithm di ottimizzazione numerica.

Ercole Palmeri


Autore

Fàg beachd

Cha tèid an seòladh puist-d agad fhoillseachadh. Tha na raointean riatanach air an comharrachadh *