Tutorial

Maşın öyrənmə alqoritmlərinin təsnifatı: xətti reqressiya, təsnifat və klasterləşmə

Maşın Öyrənmə üsulları, nəzəriyyələri və tətbiq sahələrini təmin edən riyazi optimallaşdırma ilə böyük oxşarlıqlara malikdir. 

Maşın təhsili müəyyən bir nümunə dəstinə (təlim dəsti) qarşı bir zərər funksiyasının "minimuma endirmə problemləri" şəklində tərtib edilmişdir. Bu funksiya hazırlanan model tərəfindən proqnozlaşdırılan dəyərlər və hər nümunə nümunəsi üçün gözlənilən dəyərlər arasındakı uyğunsuzluğu ifadə edir. 

Son məqsəd, modelə təlim toplusunda olmayan bir sıra hallarda düzgün proqnoz vermək bacarığını öyrətməkdir.

Alqoritmin müxtəlif kateqoriyalarını ayırd etmək mümkün olan üsul müəyyən bir sistemdən gözlənilən çıxış növüdür. maşın təlim

Əsas kateqoriyalar arasında tapırıq:

  • La təsnifatı: girişlər iki və ya daha çox sinfə bölünür və təlim sistemi giriş üçün mövcud olanlar arasında bir və ya daha çox sinif təyin edə biləcək bir model istehsal etməlidir.Bu tip tapşırıqlar adətən nəzarət olunan təlim metodlarından istifadə etməklə həll olunur. 

    Təsnifata bir nümunə, tərkibindəki əşyalara və ya subyektlərə əsaslanaraq bir və ya daha çox etiketin təsvirə təyin edilməsidir;

  • La reqressiya: Çıxışın davamlı və diskret olmayan bir sahə olduğu fərqlə təsnifat olaraq təsnifata bənzəyir.Adətən nəzarət olunan öyrənmə ilə idarə olunur. 

    Reqressiya nümunəsi bir mənzərənin dərinliyini rəngli bir şəkil şəklində təqdim etməsindən qiymətləndirməsidir. 

    Əslində, çıxışın sahəsi demək olar ki, sonsuzdur və müəyyən bir diskret imkan dəsti ilə məhdudlaşmır;

  • Il Kümelenme: O haradadır bir sıra məlumatlar qruplara bölünür, lakin təsnifatdan fərqli olaraq priori bilinmir.Bu kateqoriyaya aid problemlərin təbiəti adətən onları nəzarətsiz təlim tapşırıqları halına gətirir.
Sadə xətti reqressiya modeli

Xətti reqressiya amkimi real dəyərləri qiymətləndirmək üçün istifadə olunan geniş yayılmış model:

  • evlərin dəyəri,
  • zənglərin sayı,
  • adambaşına ümumi satış,

və davamlı dəyişənlərin meyarına uyğundur:

  • kvadratmetr,
  • cari hesaba abunə olmaq,
  • şəxsin təhsili

Xətti reqressiyada müstəqil dəyişənlər və asılı dəyişənlər arasındakı əlaqə ümumiyyətlə iki dəyişən arasındakı əlaqəni təmsil edən bir xətt vasitəsilə izlənilir.

Uyğunluq reqressiya xətti kimi tanınır və Y = a * X + b tipli xətti tənliklə təmsil olunur.

Formula iki və ya daha çox xüsusiyyətləri bir-biri ilə əlaqələndirmək üçün məlumatların interpolasiya edilməsinə əsaslanır. Alqoritmə giriş xarakteristikası verdiyiniz zaman reqressiya digər xarakteristikanı qaytarır.

Çoxsaylı xətti reqressiya modeli

Birdən çox müstəqil dəyişən olduqda, aşağıdakı kimi bir modeli qəbul edərək çoxsaylı xətti reqressiya haqqında danışırıq:


y=b0 + B1x1 + B2x2 +… + Bnxn

  • y - dəyərlərə cavabdır, yəni model tərəfindən proqnozlaşdırılan nəticəni təmsil edir;
  • b0 kəsişdir, yəni x olduqda y dəyərii hamısı 0-a bərabərdir;
  • ilk xarakterik b1 x əmsalıdır1;
  • başqa bir xüsusiyyət bn x əmsalıdırn;
  • x1,x2,…, Xn modelin müstəqil dəyişənləridir.

Təcrübədə, tənlik davamlı asılı dəyişən (y) və iki və ya daha çox müstəqil dəyişən (x1, x2, x3 ...) arasındakı əlaqəni izah edir. 

Məsələn, mühərrikin gücünü, silindrlərin sayını və yanacaq istehlakını nəzərə alaraq bir avtomobilin (asılı dəyişən y) CO2 emissiyasını qiymətləndirmək istəsək. Bu son amillər x1, x2 və x3 müstəqil dəyişənlərdir. Sabit olanlar həqiqi ədədlərdir və modelin təxmin edilən reqressiya əmsalları adlanır.Y davamlı asılı dəyişəndir, yəni b0, b1 x1, b2 x2 və s. y əsl nömrə olacaq.

Çoxsaylı reqressiya təhlili müstəqil dəyişənlərin asılı dəyişənlərə təsirini müəyyənləşdirmək üçün istifadə olunan bir üsuldur.

Müstəqil dəyişənlərin dəyişdikcə asılı dəyişənlərin necə dəyişdiyini anlamaq bizə real vəziyyətdəki dəyişikliklərin təsirlərini və ya təsirlərini proqnozlaşdırmağa imkan verir.

Çoxsaylı xətti reqressiya tətbiq etməklə, yaş, cinsiyyət və s. Kimi amillər nəzərə alınmaqla bədən kütləsi indeksinin dəyişməsi ilə qan təzyiqinin necə dəyişdiyini başa düşmək mümkündür.

Çoxsaylı reqressiya ilə neft və ya qızılın gələcək tendensiyası kimi qiymət meylləri ilə bağlı qiymətləndirmələr əldə edə bilərik.

Nəhayət, çoxsaylı xətti reqressiya, maşın öyrənmə və süni intellekt sahələrində daha çox maraqlanmaqdadır, çünki təhlil ediləcək çox sayda qeydin olduğu halda belə, öyrənmə modellərini əldə etməyə imkan verir.

Logistik Reqressiya Modeli

Logistik reqressiya, bir və ya bir neçə izahlı dəyişən ilə binomial nəticəni modelləşdirməyi hədəfləyən statistik bir vasitədir.

Ümumiyyətlə ikili problemlər üçün istifadə olunur, burada yalnız iki sinif var, məsələn Bəli və ya Xeyr, 0 və ya 1, kişi və ya qadın və s ...

Bu şəkildə məlumatları təsvir etmək və ikili asılı dəyişən və bir və ya daha çox nominal və ya nizamlı müstəqil dəyişənlər arasındakı əlaqəni izah etmək mümkündür.

Nəticə, ehtimalı qiymətləndirən və sonra bir logistik funksiyanın istifadəsi sayəsində müəyyən edilir defiəldə edilmiş ehtimal dəyərinə ən yaxın sinfi (müsbət və ya mənfi) bitir.

Logistik reqressiyanı ailəni təsnifləşdirmə metodu kimi nəzərdən keçirə bilərik nəzarət təlim alqoritmləri.

Statistik metodlardan istifadə edərək, logistik reqress, nəticədə verilmiş giriş dəyərinin müəyyən bir sinfə aid olma ehtimalını ifadə edən nəticə əldə etməyə imkan verir.

Binomial logistik reqressiya problemlərində çıxışın bir sinifə aid olma ehtimalı P, digər sinfi 1-P-ə aid olduğu (burada P - 0 ilə 1 arasındakı bir rəqəmdir, çünki ehtimalını ifadə edir).

Binomial logistik reqress, proqnozlaşdırmağa çalışdığımız dəyişənin ikili olduğu bütün hallarda yaxşı işləyir, yəni cəmi iki dəyəri götürə bilər: müsbət sinfi təmsil edən 1 dəyəri və ya mənfi sinfi təmsil edən 0 dəyəri.

Logistik reqressiya ilə həll edilə bilən problemlərə misallar:

  • bir e-poçt spamdır və ya deyil;
  • bir onlayn satın alma şərtlərini qiymətləndirərək saxtadır və ya deyil;
  • bir xəstədə radii qiymətləndirərək bir sınıq var.

Logistik reqressiya ilə proqnozlaşdırmaq üçün analiz edə bilərik, proqnozlaşdırmaq istədiyimiz (asılı dəyişən) və bir və ya daha çox müstəqil dəyişən, yəni xüsusiyyətləri arasındakı əlaqəni ölçürük. Ehtimal qiymətləndirmə logistik bir funksiya vasitəsilə aparılır.

Ehtimallar sonradan ikili dəyərlərə çevrilir və proqnozu gerçəkləşdirmək üçün bu nəticə sinifin özünə yaxın olub-olmamasından asılı olaraq aid olduğu sinifə təyin olunur.

Məsələn, lojistik funksiyanın tətbiqi 0,85-ə qayıdırsa, deməli, giriş 1-ci sinifə təyin etməklə müsbət bir sinif yaratmışdır, əksinə 0,4 və ya daha çox ümumiyyətlə <0,5 kimi bir dəyər əldə etmiş olsaydı ..

İnnovasiya bülleteni
Yeniliklərlə bağlı ən vacib xəbərləri qaçırmayın. Onları e-poçtla almaq üçün qeydiyyatdan keçin.

Logistik reqressiya giriş dəyərlərinin təsnifatını qiymətləndirmək üçün logistik funksiyadan istifadə edir.

Sigmoid adlandırılan logistika funksiyası, həddindən artıqları istisna olmaqla, istənilən sayda həqiqi dəyəri götürə və 0 ilə 1 arasındakı bir dəyəri müqayisə edə biləcək bir əyridir. Funksiyası:

O haradadır:

  • e: təbii logarifmlərin əsası (Eyler sayı və ya excel funksiyası exp ())
  • b0 + b1 * x: çevirmək istədiyiniz həqiqi rəqəmdir.

Logistik reqressiya üçün istifadə olunan nümayəndəlik

Logistik reqressiya bir tənliyi xətti reqressiya kimi bir təmsil olaraq istifadə edir

Giriş dəyərləri (x) bir çıxış dəyərini (y) proqnozlaşdırmaq üçün çəkilər və ya əmsal dəyərləri istifadə edərək xətti şəkildə birləşdirilir. Xətti reqressiyadan əsas fərq modelləşdirilmiş çıxış dəyərinin ədədi bir dəyər deyil, ikili dəyər (0 və ya 1) olmasıdır.

Aşağıda bir logistik reqressiya tənliyinin nümunəsi verilmişdir:

y = e^(b0 + b1 * x) / (1 + e^(b0 + b1 * x))

Göyərçin:

  • y - asılı dəyişən, yəni proqnozlaşdırılan dəyəri;
  • b0 qütbləşmə və ya kəsmə müddətidir;
  • b1 vahid giriş dəyəri (x) üçün əmsaldır.

Giriş məlumatlarındakı hər bir sütunda təlim məlumatlarından öyrənilməli olan əlaqəli bir əmsal (sabit bir real dəyər) var.

Yaddaşda və ya bir faylda saxlayacağınız modelin həqiqi nümayəndəliyi tənlikdəki əmsallardır (beta və ya b dəyəri).

Logistik reqress ehtimalları (texniki diapazon) proqnozlaşdırır

Logistik regressiya, standart sinifin ehtimalını modelləşdirir.

Nümunə olaraq, fərz edək ki, insanların cinslərini boylarından kişi və ya qadın olaraq modelləşdiririk, birinci sinif kişi ola bilər, logistik reqressiya modeli kişinin boyu və ya daha çox olduğu üçün kişi olma ehtimalı olaraq yazıla bilər. rəsmi olaraq:

P (cins = kişi | boy)

Başqa cür yazsaq, biz girişin (X) pre sinfinə aid olma ehtimalını modelləşdiririkdefinite (Y = 1), onu belə yaza bilərik:

P(X) = P(Y = 1 | X)

Həqiqətən bir proqnoz vermək üçün ehtimal proqnozu ikili dəyərlərə çevrilməlidir (0 və ya 1).

Logistik reqressiya xətti bir üsuldur, lakin proqnozlar logistik funksiyadan istifadə edərək çevrilir. Bunun təsiri, xətti reqressiya ilə bacardığımız kimi, proqnozları artıq girişlərin xətti birləşməsi kimi başa düşə bilməyəcəyimizdir, məsələn, yuxarıdan davam edərək, model aşağıdakı kimi ifadə edilə bilər:

p(X) = e ^ (b0 + b1 * X) / (1 + e ^ (b0 + b1 * X))

İndi tənliyi aşağıdakı kimi tərs edə bilərik. Bunun əksini düzəltmək üçün digər tərəfdən təbii bir logarithm əlavə edərək e-ni bir tərəfdən çıxartmaqla davam edə bilərik.

ln (p (X) / 1 - p (X)) = b0 + b1 * X

Bu yolla, sağdakı çıxışın hesablanması yenidən xətti olduğuna dair faktı əldə edirik (xətti reqressiya kimi) və solda olan giriş standart sinifin ehtimalının bir qeydidir.

Ehtimallar hadisənin baş vermə ehtimalına, məsələn, heç bir hadisənin baş verməməsi nisbətinə nisbət olaraq hesablanır. Nəticəsi 0,8 olan 1 / (0,8-4) XNUMX. Buna görə yaza bilərdik:

ln (ehtimal) = b0 + b1 * X

Ehtimallar log-a çevrildiyi üçün bu sol tərəfli giriş ehtimalları və ya probit deyirik.

Eksponenti sağa qaytarıb aşağıdakı kimi yaza bilərik:

ehtimal = e ^ (b0 + b1 * X)

Bütün bunlar bizə modelin hələ də girişlərin xətti kombinasiyası olduğunu başa düşməyə kömək edir, lakin bu xətti kombinasiya ilkin sinifin log ehtimallarına istinad edir.definita.

Logistik reqressiya modelini öyrənmək

Logistik reqressiya alqoritminin əmsalları (beta və ya b dəyərləri) öyrənmə mərhələsində qiymətləndirilir. Bunun üçün maksimum ehtimal qiymətləndirməsindən istifadə edirik.

Maksimum ehtimalın qiymətləndirilməsi bir neçə maşın öyrənmə alqoritmləri tərəfindən istifadə edilən öyrənmə alqoritmidir. Modeldən əldə edilən əmsallar məktəbəqədər sinif üçün 1-ə (məsələn, kişi) çox yaxın bir dəyər proqnozlaşdırır.definite və digər sinif üçün 0-a çox yaxın bir dəyər (məsələn, qadın). Logistik reqressiyanın maksimum ehtimalı, verilənlərdəkilərə nisbətən model tərəfindən proqnozlaşdırılan ehtimallardakı xətanı minimuma endirən əmsallar (Beta və ya ob dəyərləri) üçün dəyərlərin tapılması prosedurudur (məsələn, verilənlər əsas sinifdirsə, ehtimal 1). .

Təlim məlumatları üçün ən yaxşı əmsal dəyərlərini optimallaşdırmaq üçün minimallaşdırma alqoritmindən istifadə edəcəyik. Bu tez-tez səmərəli ədədi optimallaşdırma alqoritmindən istifadə edərək praktikada tətbiq olunur.

Ercole Palmeri


İnnovasiya bülleteni
Yeniliklərlə bağlı ən vacib xəbərləri qaçırmayın. Onları e-poçtla almaq üçün qeydiyyatdan keçin.

Articoli recenti

Veeam müdafiədən tutmuş cavab və bərpaya qədər ransomware üçün ən əhatəli dəstəyi təqdim edir

Coveware by Veeam kiber qəsb hallarına cavab xidmətləri göstərməyə davam edəcək. Coveware məhkəmə və remediasiya imkanları təklif edəcək...

23 Aprel 2024

Yaşıl və Rəqəmsal İnqilab: Proqnozlaşdırılan Baxım Neft və Qaz Sənayesini necə çevirir?

Proqnozlaşdırılan texniki xidmət zavodun idarə edilməsinə innovativ və proaktiv yanaşma ilə neft və qaz sektorunda inqilab edir.…

22 Aprel 2024

Böyük Britaniyanın antiinhisar tənzimləyicisi GenAI üzərində BigTech həyəcanını qaldırır

Böyük Britaniyanın CMA süni intellekt bazarında Big Tech-in davranışı ilə bağlı xəbərdarlıq edib. Orada…

18 Aprel 2024

Casa Green: İtaliyada davamlı gələcək üçün enerji inqilabı

Avropa İttifaqı tərəfindən binaların enerji səmərəliliyini artırmaq üçün tərtib edilən "Yaşıl Evlər" Fərmanı qanunvericilik prosesini yekunlaşdırdı ...

18 Aprel 2024