Водич

Класификација алгоритама машинског учења: Линеарна регресија, класификација и кластерирање

Машинско учење има велике сличности са математичком оптимизацијом која пружа методе, теорије и домене апликација. 

Машинско учење је формулисано као "проблеми минимизирања" губитничке функције наспрам датог скупа примера (сет тренинга). Ова карактеристика изражава одступање између вредности које предвиђа модел који се обучава и очекиваних вредности за сваку пример примера. 

Крајњи циљ је научити модел способности исправног предвиђања на скупу случајева који нису присутни у сету тренинга.

Метода према којој је могуће разликовати различите категорије алгоритма је тип излаза који се очекује од одређеног система Машина учење

Међу главним категоријама налазимо:

  • La класификација: инпути су подељени у две или више класа и систем учења мора да произведе модел који може да додели једну или више класа међу онима који су доступни улазу.Овим врстама задатака обично се бави коришћењем надгледаних техника учења. 

    Пример класификације је додељивање једне или више ознака слици на основу објеката или предмета садржаних у њој;

  • La регресија: концептуално слична класификацији са разликом што излаз има континуирану и недискретивну домену.Обично се управља под надзором учења. 

    Пример регресије је процена дубине сцене од њеног приказивања у облику слике у боји. 

    У ствари, домен дотичног резултата је готово бесконачан и није ограничен на одређени дискретни скуп могућности;

  • Il кластерирање: где се налази скуп података је подељен у групе које, међутим, за разлику од класификације, нису а приори познате.Сама природа проблема који припадају овој категорији обично их чини задацима учења без надзора.
Једноставни модел линеарне регресије

Линеарна регресија је амшироко коришћени модел који се користи за процену стварних вредности као што су:

  • трошкове кућа,
  • број позива,
  • укупна продаја по особи,

и следи критеријум непрекидних променљивих:

  • квадратних метара,
  • претплата на текући рачун,
  • образовање особе

У линеарној регресији, однос између независних и зависних варијабли се прати кроз линију која обично представља однос између две променљиве.

Подесна линија позната је као регресијска линија и представљена је линеарном једначином типа И = а * Кс + б.

Формула је заснована на интерполирању података да би се две или више карактеристика повезале једна са другом. Кад алгоритам дате уносну карактеристику, регресија враћа другу карактеристику.

Модел вишеструке линеарне регресије

Кад имамо више од једне независне променљиве, тада говоримо о вишеструкој линеарној регресији, претпостављајући модел као што је следећи:


и = б0 + б1x1 + б2x2 +… + Бnxn

  • и је одговор на вриједности, тј. представља резултат који је предвидио модел
  • b0 је пресретање, то је вредност и када је кi сви су једнаки 0;
  • прва карактеристика б1 је коефицијент к1;
  • још једна карактеристика бn је коефицијент кn;
  • x1,x2,…, ИКСn су независне променљиве модела.

У основи једначина објашњава однос између континуиране зависне променљиве (и) и две или више независних променљивих (к1, к2, к3…). 

На пример, ако смо желели да проценимо емисију ЦО2 у аутомобилу (зависна променљива и) имајући у виду снагу мотора, број цилиндара и потрошњу горива. Ови последњи фактори су независне променљиве к1, к2 и к3. Константе би су стварни бројеви и зову се процијењени регресијски коефицијенти модела.И је континуирана зависна варијабла, тј. Сума б0, б1 к1, б2 к2 итд. и ће бити прави број.

Мултипла регресијска анализа је метода која се користи да се идентификује ефекат који независне варијабле имају на зависну варијаблу.

Разумевање начина на који се зависна променљива мења као и промене независних променљивих омогућава нам да предвидимо ефекте или утицаје промена у стварним ситуацијама.

Помоћу вишеструке линеарне регресије могуће је разумети како се мења крвни притисак како се мења индекс телесне масе узимајући у обзир факторе као што су старост, пол, итд., Претпостављајући шта би се могло догодити.

Вишеструком регресијом можемо добити процене кретања цена, попут будућег тренда нафте или злата.

Коначно, вишеструка линеарна регресија доживљава веће интересовање за област машинског учења и вештачке интелигенције, јер омогућава добијање изведбених модела учења чак и у случају великог броја записа који се анализирају.

Логистички регресиони модел

Логистичка регресија је статистички алат који има за циљ да моделира биномни резултат с једном или више објашњивих варијабли.

Обично се користи за бинарне проблеме, где постоје само две класе, на пример Да или Не, 0 или 1, мушки или женски итд. ...

На овај је начин могуће описати податке и објаснити однос између бинарне зависне варијабле и једне или више независних номиналних или редних варијабли.

Резултат се утврђује захваљујући употреби логистичке функције, која процењује вероватноћу и затим defiзавршава најближу класу (позитивну или негативну) добијеној вредности вероватноће.

Логистичку регресију можемо сматрати методом класификације породице надгледани алгоритми учења.

Помоћу статистичких метода, логистичка регресија омогућава генерисање резултата који, у ствари, представља вероватноћу да дата улазна вредност припада датој класи.

У проблемима биномне логистичке регресије вероватноћа да излаз припада једној класи ће бити П, док да припада другој класи 1-П (где је П број између 0 и 1, јер изражава вероватноћу).

Биномна логистичка регресија добро функционише у свим оним случајевима у којима је варијабла коју покушавамо предвидјети бинарна, то јест, може претпоставити само двије вриједности: вриједност 1 која представља позитивну класу, или вриједност 0 која представља негативну класу.

Примери проблема који се могу решити логистичком регресијом су:

  • е-пошта је нежељена пошта или не;
  • куповина на мрежи је лажна или не, процењује услове куповине;
  • пацијент има прелом, процењујући његове радијусе.

Помоћу логистичке регресије можемо направити предиктивну анализу, мерећи однос између онога што желимо да предвидимо (зависне променљиве) и једне или више независних променљивих, тј. Карактеристика. Процена вероватноће врши се помоћу логистичке функције.

Вероватноће се затим трансформишу у бинарне вредности, а да би се предвиђање остварило, овај резултат се додељује класи којој припада, на основу тога да ли је или не близу саме класе.

На пример, ако примена логистичке функције враћа 0,85, то значи да је улаз генерисао позитивну класу додељивањем класи 1. Обрнуто, ако је добио вредност као што је 0,4 или уопштено <0,5 ..

Иновациони билтен
Не пропустите најважније вести о иновацијама. Пријавите се да их примате путем е-поште.

Логистичка регресија користи логистичку функцију за процену класификације улазних вредности.

Логистичка функција, која се назива и сигмоидна, је кривуља способна да узме било који број стварне вредности и преслика је на вредност између 0 и 1, искључујући крајности. Функција је:

где је:

  • е: база природних логаритама (Еулеров број или екцел функција екп ())
  • б0 + б1 * к: је стварна нумеричка вредност коју желите трансформирати.

Репрезентација која се користи за логистичку регресију

Логистичка регресија користи једначину као репрезентацију, слично као линеарна регресија

Улазне вредности (к) линеарно се комбинују коришћењем утега или вредности коефицијента за предвиђање излазне вредности (и). Кључна разлика од линеарне регресије је да је моделирана излазна вредност бинарна вредност (0 или 1), а не нумеричка вредност.

Испод је пример логичке регресијске једначине:

и = е ^ (б0 + б1 * к) / (1 + е ^ (б0 + б1 * к))

Где је:

  • и је зависна варијабла, тј. предвиђена вредност;
  • б0 је термин поларизације или пресретања;
  • б1 је коефицијент за појединачну улазну вредност (к).

Сваки ступац у улазним подацима има придружени б коефицијент (константна стварна вриједност) који се мора научити из података о тренингу.

Стварни приказ модела који ћете сачувати у меморији или датотеци су коефицијенти у једначини (бета или б вредност).

Логистичка регресија предвиђа вероватноће (технички распон)

Логистичка регресија моделира вјероватност задане класе.

Као пример, претпоставимо да моделирамо спол људи мушко или женско од њихове висине, прва класа би могла бити мушкарац, а логистички регресијски модел могао би се записати као вероватноћа да су мушкарци с обзиром на висину особе или више. формално:

П (пол = мушкарац | висина)

На други начин, моделирамо вероватноћу да улаз (Кс) припада класи преdefiконачно (И = 1), можемо га записати као:

П (Кс) = П (И = 1 | Кс)

Предвиђање вероватноће мора се трансформисати у бинарне вредности (0 или 1) да би се стварно предвидело вероватноће.

Логистичка регресија је линеарна метода, али предвиђања се трансформишу коришћењем логистичке функције. Утицај тога је да више не можемо разумети предвиђања као линеарну комбинацију улаза, као што можемо и са линеарном регресијом, на пример, настављајући се одозго, модел се може изразити као:

п (Кс) = е ^ (б0 + б1 * Кс) / (1 + е ^ (б0 + б1 * Кс))

Сада једнаџбу можемо обрнути на следећи начин. Да бисмо је преокренули, можемо наставити уклањањем е на једној страни додавањем природног логаритма на другој страни.

лн (п (Кс) / 1 - п (Кс)) = б0 + б1 * Кс

На овај начин добијамо чињеницу да је израчунавање резултата на десној страни опет линеарно (баш као линеарна регресија), а улаз са леве стране је логаритам вероватноће подразумеване класе.

Вероватноће се израчунавају као омјер вероватноће догађаја који се дели са вероватноћом да нема догађаја, нпр. 0,8 / (1-0,8) чији је резултат 4, па бисмо уместо тога могли да напишемо:

лн (квота) = б0 + б1 * Кс

Пошто су вероватноће трансформисане у записник, то називамо левостраним записима или пробитом.

Можемо вратити експонент удесно и написати га као:

вероватноћа = е ^ (б0 + б1 * Кс)

Све ово нам помаже да схватимо да је модел заиста и даље линеарна комбинација улаза, али да се ова линеарна комбинација односи на лог вероватноће пре класеdefiнита.

Учење модела логистичке регресије

Коефицијенти (бета или б вредности) алгоритма логистичке регресије процењују се у фази учења. Да бисмо то учинили, користимо максималну процену вероватноће.

Процена максималне вероватноће је алгоритам учења који користи неколико алгоритама машинског учења. Коефицијенти добијени из модела предвиђају вредност веома близу 1 (нпр. Мушки) за преткласуdefiконачан и вредност веома близу 0 (нпр. женско) за другу класу. Максимална вероватноћа за логистичку регресију је поступак проналажења вредности за коефицијенте (Бета или об вредности) који минимизирају грешку у вероватноћама предвиђеним моделом у односу на оне у подацима (нпр. вероватноћа 1 ако су подаци примарна класа) .

Користићемо алгоритам минимизирања за оптимизацију најбољих вредности коефицијента за податке о тренингу. То се често примјењује у пракси користећи ефикасан алгоритам нумеричке оптимизације.

Ercole Palmeri


Иновациони билтен
Не пропустите најважније вести о иновацијама. Пријавите се да их примате путем е-поште.

Недавни чланци

Вееам има најсвеобухватнију подршку за рансомваре, од заштите до одговора и опоравка

Цовеваре од Вееам-а ће наставити да пружа услуге одговора на инциденте са сајбер изнудом. Цовеваре ће понудити форензику и могућности санације…

КСНУМКС април КСНУМКС

Зелена и дигитална револуција: Како предиктивно одржавање трансформише индустрију нафте и гаса

Предиктивно одржавање револуционише сектор нафте и гаса, са иновативним и проактивним приступом управљању постројењима.…

КСНУМКС април КСНУМКС

Британски антимонополски регулатор подигао је БигТецх аларм због ГенАИ

УК ЦМА је издао упозорење о понашању Биг Тецх-а на тржишту вештачке интелигенције. Тамо…

КСНУМКС април КСНУМКС

Цаса Греен: енергетска револуција за одрживу будућност у Италији

Уредба „Цасе Греен“, коју је формулисала Европска унија за побољшање енергетске ефикасности зграда, завршила је свој законодавни процес са…

КСНУМКС април КСНУМКС

Прочитајте Иновације на свом језику

Иновациони билтен
Не пропустите најважније вести о иновацијама. Пријавите се да их примате путем е-поште.

Пратите нас