മെഷീൻ ലേണിംഗ് അൽ‌ഗോരിതംസിന്റെ വർഗ്ഗീകരണം: ലീനിയർ റിഗ്രഷൻ, ക്ലാസിഫിക്കേഷൻ, ക്ലസ്റ്ററിംഗ്

മെഷീൻ ലേണിംഗിന് ഗണിതശാസ്ത്ര ഒപ്റ്റിമൈസേഷനുമായി വലിയ സാമ്യതകളുണ്ട്, അത് രീതികളും സിദ്ധാന്തങ്ങളും അപ്ലിക്കേഷൻ ഡൊമെയ്‌നുകളും നൽകുന്നു.

തന്നിരിക്കുന്ന ഒരു കൂട്ടം ഉദാഹരണങ്ങൾ (പരിശീലന സെറ്റ്) നെതിരെയുള്ള നഷ്ടം ഫംഗ്ഷന്റെ "മിനിമൈസേഷൻ പ്രശ്നങ്ങൾ" എന്നാണ് മെഷീൻ ലേണിംഗ് രൂപപ്പെടുത്തിയിരിക്കുന്നത്. പരിശീലനം ലഭിച്ച മോഡൽ പ്രവചിച്ച മൂല്യങ്ങളും ഓരോ ഉദാഹരണ ഉദാഹരണത്തിനും പ്രതീക്ഷിക്കുന്ന മൂല്യങ്ങളും തമ്മിലുള്ള പൊരുത്തക്കേട് ഈ സവിശേഷത പ്രകടിപ്പിക്കുന്നു.

പരിശീലന സെറ്റിൽ ഇല്ലാത്ത ഒരു കൂട്ടം സംഭവങ്ങളെക്കുറിച്ച് കൃത്യമായി പ്രവചിക്കാനുള്ള കഴിവ് മോഡലിനെ പഠിപ്പിക്കുക എന്നതാണ് ആത്യന്തിക ലക്ഷ്യം.

അൽഗോരിതത്തിന്റെ വിവിധ വിഭാഗങ്ങളെ വേർതിരിച്ചറിയാൻ കഴിയുന്ന ഒരു രീതിയാണ് ഒരു നിശ്ചിത സിസ്റ്റത്തിൽ നിന്ന് പ്രതീക്ഷിക്കുന്ന ഔട്ട്പുട്ടിന്റെ തരം. മെഷീൻ ലേണിംഗ്.

ഞങ്ങൾ കണ്ടെത്തുന്ന പ്രധാന വിഭാഗങ്ങളിൽ:

La വർഗ്ഗീകരണം: ഇൻപുട്ടുകൾ രണ്ടോ അതിലധികമോ ക്ലാസുകളായി വിഭജിക്കപ്പെട്ടിട്ടുണ്ട്, കൂടാതെ ഒരു ഇൻപുട്ടിന് ലഭ്യമായവയിൽ ഒന്നോ അതിലധികമോ ക്ലാസുകൾ നിയോഗിക്കാൻ കഴിവുള്ള ഒരു മാതൃക പഠന സംവിധാനം നിർമ്മിക്കണം.സൂപ്പർവൈസുചെയ്‌ത പഠനരീതികൾ ഉപയോഗിച്ചാണ് ഇത്തരം ജോലികൾ സാധാരണ അഭിസംബോധന ചെയ്യുന്നത്.
വർ‌ഗ്ഗീകരണത്തിന്റെ ഒരു ഉദാഹരണം, ഒരു ഇമേജിൽ‌ അടങ്ങിയിരിക്കുന്ന ഒബ്‌ജക്റ്റുകൾ‌ അല്ലെങ്കിൽ‌ വിഷയങ്ങൾ‌ അടിസ്ഥാനമാക്കി ഒന്നോ അതിലധികമോ ലേബലുകൾ‌ നിർ‌ണ്ണയിക്കുന്നത്;
La റിഗ്രഷൻ: concept ട്ട്‌പുട്ടിന് നിരന്തരവും വ്യതിരിക്തവുമായ ഡൊമെയ്‌ൻ ഉണ്ടെന്ന വ്യത്യാസവുമായി ആശയപരമായി വർഗ്ഗീകരണത്തിന് സമാനമാണ്.ഇത് സാധാരണയായി നിയന്ത്രിക്കുന്നത് സൂപ്പർവൈസുചെയ്‌ത പഠനത്തിലൂടെയാണ്.
ഒരു രംഗത്തിന്റെ പ്രാതിനിധ്യത്തിൽ നിന്ന് ഒരു വർണ്ണ ചിത്രത്തിന്റെ രൂപത്തിൽ അതിന്റെ ആഴം കണക്കാക്കുന്നത് റിഗ്രഷന്റെ ഒരു ഉദാഹരണമാണ്.

വാസ്തവത്തിൽ, സംശയാസ്‌പദമായ output ട്ട്‌പുട്ടിന്റെ ഡൊമെയ്‌ൻ ഫലത്തിൽ അനന്തമാണ്, മാത്രമല്ല ഇത് ഒരു പ്രത്യേക വ്യതിരിക്ത സാധ്യതകളിലേക്ക് പരിമിതപ്പെടുത്തിയിട്ടില്ല;
Il ക്ലസ്റ്ററിങ്: ഇത് എവിടെയാണ് ഒരു കൂട്ടം ഡാറ്റയെ ഗ്രൂപ്പുകളായി തിരിച്ചിരിക്കുന്നു, എന്നിരുന്നാലും, വർഗ്ഗീകരണത്തിൽ നിന്ന് വ്യത്യസ്തമായി, ഒരു പ്രിയോറി അറിയപ്പെടില്ല.ഈ വിഭാഗത്തിൽ‌പ്പെടുന്ന പ്രശ്നങ്ങളുടെ സ്വഭാവം അവരെ മേൽ‌നോട്ടമില്ലാത്ത പഠന ജോലികളാക്കുന്നു.

ലളിതമായ ലീനിയർ റിഗ്രഷൻ മോഡൽ

ലീനിയർ റിഗ്രഷൻ am ആണ്ഇനിപ്പറയുന്നവ പോലുള്ള യഥാർത്ഥ മൂല്യങ്ങൾ കണക്കാക്കാൻ ഉപയോഗിക്കുന്ന വ്യാപകമായി ഉപയോഗിക്കുന്ന മോഡൽ:

വീടുകളുടെ വില,
കോളുകളുടെ എണ്ണം,
ഓരോ വ്യക്തിക്കും ആകെ വിൽപ്പന,

തുടർച്ചയായ വേരിയബിളുകളുടെ മാനദണ്ഡം പിന്തുടരുന്നു:

സ്ക്വയർ മീറ്റർ,
നിലവിലെ അക്കൗണ്ടിലേക്കുള്ള സബ്‌സ്‌ക്രിപ്‌ഷൻ,
വ്യക്തിയുടെ വിദ്യാഭ്യാസം

ലീനിയർ റിഗ്രഷനിൽ, രണ്ട് വേരിയബിളുകൾ തമ്മിലുള്ള ബന്ധത്തെ സാധാരണയായി പ്രതിനിധീകരിക്കുന്ന ഒരു വരിയിലൂടെ സ്വതന്ത്ര ചരങ്ങളും ആശ്രിത വേരിയബിളുകളും തമ്മിലുള്ള ബന്ധം പിന്തുടരുന്നു.

ഫിറ്റ് ലൈനിനെ റിഗ്രഷൻ ലൈൻ എന്ന് വിളിക്കുന്നു, ഇത് Y = a * X + b തരത്തിന്റെ രേഖീയ സമവാക്യം പ്രതിനിധീകരിക്കുന്നു.

രണ്ടോ അതിലധികമോ സവിശേഷതകൾ പരസ്പരം ബന്ധിപ്പിക്കുന്നതിന് ഡാറ്റ ഇന്റർപോളേറ്റ് ചെയ്യുന്നതിനെ അടിസ്ഥാനമാക്കിയുള്ളതാണ് ഫോർമുല. നിങ്ങൾ‌ അൽ‌ഗോരിതം ഒരു ഇൻ‌പുട്ട് സ്വഭാവം നൽകുമ്പോൾ‌, റിഗ്രഷൻ‌ മറ്റ് സ്വഭാവം നൽകുന്നു.

ഒന്നിലധികം ലീനിയർ റിഗ്രഷൻ മോഡൽ

നമുക്ക് ഒന്നിൽ കൂടുതൽ സ്വതന്ത്ര വേരിയബിളുകൾ ഉള്ളപ്പോൾ, ഇനിപ്പറയുന്നവ പോലുള്ള ഒരു മാതൃകയാക്കി ഒന്നിലധികം ലീനിയർ റിഗ്രഷനെക്കുറിച്ച് സംസാരിക്കുന്നു:

y = ബി₀ + ബി₁x₁ + ബി₂x₂ +… + ബി_nx_n

y എന്നത് മൂല്യങ്ങളോടുള്ള പ്രതികരണമാണ്, അതായത്, ഇത് മോഡൽ പ്രവചിച്ച ഫലത്തെ പ്രതിനിധീകരിക്കുന്നു;
b₀ ഇന്റർസെപ്റ്റ് ആണ്, അതാണ് x ആയിരിക്കുമ്പോൾ y യുടെ മൂല്യം_iഅവയെല്ലാം 0 ന് തുല്യമാണ്;
ആദ്യ സ്വഭാവം b₁ x ന്റെ ഗുണകം₁;
മറ്റൊരു സവിശേഷത b_n x ന്റെ ഗുണകം_n;
x₁,x₂,…, X_n മോഡലിന്റെ സ്വതന്ത്ര വേരിയബിളുകളാണ്.

അടിസ്ഥാനപരമായി സമവാക്യം തുടർച്ചയായ ആശ്രിത വേരിയബിളും (y) രണ്ടോ അതിലധികമോ സ്വതന്ത്ര വേരിയബിളുകളും (x1, x2, x3…) തമ്മിലുള്ള ബന്ധത്തെ വിശദീകരിക്കുന്നു.

ഉദാഹരണത്തിന്, എഞ്ചിൻ പവർ, സിലിണ്ടറുകളുടെ എണ്ണം, ഇന്ധന ഉപഭോഗം എന്നിവ കണക്കിലെടുത്ത് ഒരു കാറിന്റെ CO2 വികിരണം (ആശ്രിത വേരിയബിൾ y) കണക്കാക്കാൻ ഞങ്ങൾ ആഗ്രഹിക്കുന്നുവെങ്കിൽ. X1, x2, x3 എന്നീ സ്വതന്ത്ര വേരിയബിളുകളാണ് ഈ രണ്ടാമത്തെ ഘടകങ്ങൾ. സ്ഥിരാങ്കങ്ങൾ യഥാർത്ഥ സംഖ്യകളാണ്, അവയെ മോഡലിന്റെ കണക്കാക്കിയ റിഗ്രഷൻ കോഫിഫിഷ്യന്റ്സ് എന്ന് വിളിക്കുന്നു. Y എന്നത് തുടർച്ചയായ ആശ്രിത വേരിയബിൾ ആണ്, അതായത് b0, b1 x1, b2 x2 മുതലായവയുടെ ആകെത്തുക. y ഒരു യഥാർത്ഥ സംഖ്യയായിരിക്കും.

സ്വതന്ത്ര വേരിയബിളുകൾ ഒരു ആശ്രിത വേരിയബിളിൽ ചെലുത്തുന്ന സ്വാധീനം തിരിച്ചറിയാൻ ഉപയോഗിക്കുന്ന ഒരു രീതിയാണ് മൾട്ടിപ്പിൾ റിഗ്രഷൻ വിശകലനം.

സ്വതന്ത്ര വേരിയബിളുകൾ മാറുന്നതിനനുസരിച്ച് ആശ്രിത വേരിയബിൾ എങ്ങനെ മാറുന്നുവെന്ന് മനസിലാക്കുന്നത് യഥാർത്ഥ സാഹചര്യങ്ങളിലെ മാറ്റങ്ങളുടെ ഫലമോ പ്രത്യാഘാതമോ പ്രവചിക്കാൻ ഞങ്ങളെ അനുവദിക്കുന്നു.

ഒന്നിലധികം ലീനിയർ റിഗ്രഷൻ ഉപയോഗിച്ച് ബോഡി മാസ് സൂചികയിൽ പ്രായം, ലിംഗം മുതലായ ഘടകങ്ങൾ കണക്കിലെടുക്കുമ്പോൾ രക്തസമ്മർദ്ദം എങ്ങനെ മാറുന്നുവെന്ന് മനസിലാക്കാൻ കഴിയും, അങ്ങനെ എന്ത് സംഭവിക്കുമെന്ന് അനുമാനിക്കുന്നു.

ഒന്നിലധികം റിഗ്രഷൻ ഉപയോഗിച്ച് എണ്ണയുടെയോ സ്വർണ്ണത്തിന്റെയോ ഭാവി പ്രവണത പോലുള്ള വില പ്രവണതകളെക്കുറിച്ചുള്ള എസ്റ്റിമേറ്റുകൾ ഞങ്ങൾക്ക് ലഭിക്കും.

അവസാനമായി, ഒന്നിലധികം ലീനിയർ റിഗ്രഷൻ മെഷീൻ ലേണിംഗ്, ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മേഖലകളിൽ കൂടുതൽ താൽപ്പര്യം കണ്ടെത്തുന്നു, കാരണം ഇത് ധാരാളം റെക്കോർഡുകൾ വിശകലനം ചെയ്യേണ്ടിവരുമ്പോഴും പ്രകടന പഠന മോഡലുകൾ നേടാൻ അനുവദിക്കുന്നു.

ലോജിസ്റ്റിക് റിഗ്രഷൻ മോഡൽ

ഒന്നോ അതിലധികമോ വിശദീകരണ വേരിയബിളുകൾ ഉപയോഗിച്ച് ഒരു ദ്വിപദ ഫലത്തെ മാതൃകയാക്കാൻ ലക്ഷ്യമിടുന്ന ഒരു സ്റ്റാറ്റിസ്റ്റിക്കൽ ഉപകരണമാണ് ലോജിസ്റ്റിക് റിഗ്രഷൻ.

ഇത് സാധാരണയായി ബൈനറി പ്രശ്‌നങ്ങൾക്ക് ഉപയോഗിക്കുന്നു, അവിടെ രണ്ട് ക്ലാസുകൾ മാത്രമേയുള്ളൂ, ഉദാഹരണത്തിന് അതെ അല്ലെങ്കിൽ ഇല്ല, 0 അല്ലെങ്കിൽ 1, ആണോ പെണ്ണോ ...

ഈ രീതിയിൽ ഡാറ്റ വിവരിക്കാനും ഒരു ബൈനറി ഡിപൻഡന്റ് വേരിയബിളും ഒന്നോ അതിലധികമോ നാമമാത്രമായ അല്ലെങ്കിൽ ഓർഡിനൽ ഇൻഡിപെൻഡന്റ് വേരിയബിളുകൾ തമ്മിലുള്ള ബന്ധം വിശദീകരിക്കാനും കഴിയും.

ഒരു ലോജിസ്റ്റിക് ഫംഗ്ഷന്റെ ഉപയോഗത്തിന് നന്ദി, ഫലം നിർണ്ണയിക്കപ്പെടുന്നു, അത് ഒരു പ്രോബബിലിറ്റി കണക്കാക്കുകയും തുടർന്ന് defiലഭിച്ച പ്രോബബിലിറ്റി മൂല്യത്തിന് ഏറ്റവും അടുത്തുള്ള ക്ലാസ് (പോസിറ്റീവ് അല്ലെങ്കിൽ നെഗറ്റീവ്) അവസാനിപ്പിക്കുന്നു.

കുടുംബത്തെ തരംതിരിക്കുന്നതിനുള്ള ഒരു രീതിയായി ലോജിസ്റ്റിക് റിഗ്രഷൻ നമുക്ക് പരിഗണിക്കാം സൂപ്പർവൈസുചെയ്‌ത പഠന അൽ‌ഗോരിതംസ്.

സ്റ്റാറ്റിസ്റ്റിക്കൽ രീതികൾ ഉപയോഗിച്ച്, ലോജിസ്റ്റിക് റിഗ്രഷൻ ഒരു ഫലം സൃഷ്ടിക്കാൻ അനുവദിക്കുന്നു, വാസ്തവത്തിൽ, നൽകിയ ഇൻപുട്ട് മൂല്യം ഒരു നിശ്ചിത ക്ലാസിന്റെ ഭാഗമാകാനുള്ള സാധ്യതയെ പ്രതിനിധീകരിക്കുന്നു.

ദ്വിപദ ലോജിസ്റ്റിക് റിഗ്രഷൻ പ്രശ്‌നങ്ങളിൽ, class ട്ട്‌പുട്ട് ഒരു ക്ലാസ്സിൽ നിന്നുള്ളതാകാനുള്ള സാധ്യത പി ആയിരിക്കും, അതേസമയം അത് മറ്റ് ക്ലാസ് 1-പിയിൽ ഉൾപ്പെടുന്നു (ഇവിടെ പി 0 നും 1 നും ഇടയിലുള്ള ഒരു സംഖ്യയാണ്, കാരണം ഇത് ഒരു പ്രോബബിലിറ്റി പ്രകടിപ്പിക്കുന്നു).

നമ്മൾ പ്രവചിക്കാൻ ശ്രമിക്കുന്ന വേരിയബിൾ ബൈനറി ആയ എല്ലാ സാഹചര്യങ്ങളിലും ദ്വിമാന ലോജിസ്റ്റിക് റിഗ്രഷൻ നന്നായി പ്രവർത്തിക്കുന്നു, അതായത്, ഇതിന് രണ്ട് മൂല്യങ്ങൾ മാത്രമേ അനുമാനിക്കാൻ കഴിയൂ: പോസിറ്റീവ് ക്ലാസിനെ പ്രതിനിധീകരിക്കുന്ന മൂല്യം 1 അല്ലെങ്കിൽ നെഗറ്റീവ് ക്ലാസിനെ പ്രതിനിധീകരിക്കുന്ന മൂല്യം 0.

ലോജിസ്റ്റിക് റിഗ്രഷൻ വഴി പരിഹരിക്കാവുന്ന പ്രശ്നങ്ങളുടെ ഉദാഹരണങ്ങൾ ഇവയാണ്:

ഒരു ഇ-മെയിൽ സ്പാം അല്ലെങ്കിൽ അല്ല;
ഒരു ഓൺലൈൻ വാങ്ങൽ വഞ്ചനാപരമായതോ അല്ലാത്തതോ ആണ്, വാങ്ങൽ വ്യവസ്ഥകൾ വിലയിരുത്തുന്നു;
റേഡിയേഷൻ വിലയിരുത്തി ഒരു രോഗിക്ക് ഒടിവുണ്ടാകും.

ലോജിസ്റ്റിക് റിഗ്രഷൻ ഉപയോഗിച്ച് നമുക്ക് പ്രവചന വിശകലനം നടത്താം, നമുക്ക് പ്രവചിക്കാൻ ആഗ്രഹിക്കുന്നതും (ആശ്രിത വേരിയബിൾ) ഒന്നോ അതിലധികമോ സ്വതന്ത്ര വേരിയബിളുകളും തമ്മിലുള്ള ബന്ധം അളക്കുന്നു, അതായത് സവിശേഷതകൾ. ഒരു ലോജിസ്റ്റിക് ഫംഗ്ഷനിലൂടെയാണ് പ്രോബബിലിറ്റി കണക്കാക്കുന്നത്.

പ്രോബബിലിറ്റികൾ പിന്നീട് ബൈനറി മൂല്യങ്ങളായി പരിവർത്തനം ചെയ്യപ്പെടുന്നു, മാത്രമല്ല പ്രവചനം യാഥാർത്ഥ്യമാക്കുന്നതിന്, ഈ ഫലം അത് ക്ലാസിന് തന്നെ സമീപമാണോ അല്ലയോ എന്നതിനെ അടിസ്ഥാനമാക്കി അത് ഉൾപ്പെടുന്ന ക്ലാസിലേക്ക് നിയോഗിക്കപ്പെടുന്നു.

ഉദാഹരണത്തിന്, ലോജിസ്റ്റിക് ഫംഗ്ഷന്റെ ആപ്ലിക്കേഷൻ 0,85 നൽകുന്നുവെങ്കിൽ, ഇൻപുട്ട് അതിനെ ക്ലാസ് 1 ലേക്ക് നിയോഗിച്ച് ഒരു പോസിറ്റീവ് ക്ലാസ് സൃഷ്ടിച്ചു എന്നാണ് ഇതിനർത്ഥം. ഇത് 0,4 അല്ലെങ്കിൽ അതിൽ കൂടുതൽ സാധാരണയായി ഒരു മൂല്യം നേടിയിട്ടുണ്ടെങ്കിൽ <0,5 ..

ഇൻപുട്ട് മൂല്യങ്ങളുടെ വർഗ്ഗീകരണം വിലയിരുത്തുന്നതിന് ലോജിസ്റ്റിക് റിഗ്രഷൻ ലോജിസ്റ്റിക് പ്രവർത്തനം ഉപയോഗിക്കുന്നു.

ലോജിസ്റ്റിക് ഫംഗ്ഷൻ, സിഗ്മോയിഡ് എന്നും വിളിക്കപ്പെടുന്നു, ഏത് യഥാർത്ഥ മൂല്യവും എടുത്ത് 0 നും 1 നും ഇടയിലുള്ള മൂല്യത്തിലേക്ക് മാപ്പുചെയ്യാൻ കഴിവുള്ള ഒരു വക്രമാണ്, അതിരുകടന്നത് ഒഴികെ. പ്രവർത്തനം ഇതാണ്:

ഇത് എവിടെയാണ്:

e: സ്വാഭാവിക ലോഗരിതംസിന്റെ അടിസ്ഥാനം (യൂളറിന്റെ നമ്പർ അല്ലെങ്കിൽ എക്സൽ ഫംഗ്ഷൻ exp ())
b0 + b1 * x: നിങ്ങൾ പരിവർത്തനം ചെയ്യാൻ ആഗ്രഹിക്കുന്ന യഥാർത്ഥ സംഖ്യാ മൂല്യമാണ്.

ലോജിസ്റ്റിക് റിഗ്രഷനായി ഉപയോഗിക്കുന്ന പ്രാതിനിധ്യം

ലീനിയർ റിഗ്രഷൻ പോലെ ഒരു പ്രാതിനിധ്യമായി ലോജിസ്റ്റിക് റിഗ്രഷൻ ഒരു സമവാക്യം ഉപയോഗിക്കുന്നു

ഇൻപുട്ട് മൂല്യങ്ങൾ (x) line ട്ട്‌പുട്ട് മൂല്യം (y) പ്രവചിക്കാൻ ഭാരം അല്ലെങ്കിൽ ഗുണക മൂല്യങ്ങൾ ഉപയോഗിച്ച് രേഖീയമായി സംയോജിപ്പിക്കുന്നു. ലീനിയർ റിഗ്രഷനിൽ നിന്നുള്ള ഒരു പ്രധാന വ്യത്യാസം മോഡൽ ചെയ്ത output ട്ട്‌പുട്ട് മൂല്യം ഒരു സംഖ്യാ മൂല്യത്തേക്കാൾ ഒരു ബൈനറി മൂല്യമാണ് (0 അല്ലെങ്കിൽ 1) എന്നതാണ്.

ഒരു ലോജിസ്റ്റിക് റിഗ്രഷൻ സമവാക്യത്തിന്റെ ഒരു ഉദാഹരണം ചുവടെ:

y = e^(b0 + b1 * x) / (1 + e^(b0 + b1 * x))

ഡ ove വ്:

y എന്നത് ആശ്രിത വേരിയബിൾ ആണ്, അതായത് പ്രവചിച്ച മൂല്യം;
b0 എന്നത് ധ്രുവീകരണം അല്ലെങ്കിൽ തടസ്സപ്പെടുത്തൽ പദമാണ്;
സിംഗിൾ ഇൻപുട്ട് മൂല്യത്തിന്റെ (x) ഗുണകം b1 ആണ്.

ഇൻപുട്ട് ഡാറ്റയിലെ ഓരോ നിരയ്ക്കും ഒരു അനുബന്ധ ബി കോഫിഫിഷ്യന്റ് (സ്ഥിരമായ ഒരു യഥാർത്ഥ മൂല്യം) ഉണ്ട്, അത് പരിശീലന ഡാറ്റയിൽ നിന്ന് പഠിക്കണം.

നിങ്ങൾ മെമ്മറിയിലോ ഫയലിലോ സംഭരിക്കുന്ന മോഡലിന്റെ യഥാർത്ഥ പ്രാതിനിധ്യം സമവാക്യത്തിലെ ഗുണകങ്ങളാണ് (ബീറ്റ അല്ലെങ്കിൽ ബി മൂല്യം).

ലോജിസ്റ്റിക് റിഗ്രഷൻ സാധ്യതകൾ പ്രവചിക്കുന്നു (സാങ്കേതിക ശ്രേണി)

ലോജിസ്റ്റിക് റിഗ്രഷൻ സ്ഥിരസ്ഥിതി ക്ലാസിന്റെ സാധ്യതയെ മാതൃകയാക്കുന്നു.

ഒരു ഉദാഹരണമായി, ഞങ്ങൾ ആളുകളുടെ ലൈംഗികതയെ അവരുടെ ഉയരത്തിൽ നിന്ന് പുരുഷനോ സ്ത്രീയോ ആയി മാതൃകയാക്കുന്നുവെന്ന് കരുതുക, ഒന്നാം ക്ലാസ് പുരുഷന്മാരാകാം, കൂടാതെ ലോജിസ്റ്റിക് റിഗ്രഷൻ മോഡൽ ഒരു വ്യക്തിയുടെ ഉയരം അല്ലെങ്കിൽ അതിൽക്കൂടുതൽ പുരുഷനായിരിക്കാനുള്ള സാധ്യതയായി എഴുതാം. formal പചാരികമായി:

പി (ലിംഗം = പുരുഷൻ | ഉയരം)

മറ്റൊരു വിധത്തിൽ എഴുതിയാൽ, ഒരു ഇൻപുട്ട് (X) പ്രീ ക്ലാസ്സിൽ ഉൾപ്പെടാനുള്ള സാധ്യതയെ ഞങ്ങൾ മാതൃകയാക്കുന്നുdefiനൈറ്റ് (Y = 1), നമുക്ക് ഇത് ഇങ്ങനെ എഴുതാം:

പി (എക്സ്) = പി (വൈ = 1 | എക്സ്)

പ്രോബബിലിറ്റി പ്രവചനം നടത്തുന്നതിന് പ്രോബബിലിറ്റി പ്രവചനം ബൈനറി മൂല്യങ്ങളായി (0 അല്ലെങ്കിൽ 1) പരിവർത്തനം ചെയ്യണം.

ലോജിസ്റ്റിക് റിഗ്രഷൻ ഒരു രേഖീയ രീതിയാണ്, പക്ഷേ ലോജിസ്റ്റിക് ഫംഗ്ഷൻ ഉപയോഗിച്ച് പ്രവചനങ്ങൾ രൂപാന്തരപ്പെടുന്നു. ഇതിന്റെ ആഘാതം, ലീനിയർ റിഗ്രഷൻ ഉപയോഗിച്ച് നമുക്ക് കഴിയുന്നത്ര ഇൻപുട്ടുകളുടെ ഒരു രേഖീയ സംയോജനമായി പ്രവചനങ്ങൾ മനസിലാക്കാൻ കഴിയില്ല എന്നതാണ്, ഉദാഹരണത്തിന്, മുകളിൽ നിന്ന് തുടരുന്നതിലൂടെ, മോഡൽ ഇപ്രകാരം പ്രകടിപ്പിക്കാം:

p (X) = e ^ (b0 + b1 * X) / (1 + e^ (b0 + b1 * X))

ഇപ്പോൾ നമുക്ക് സമവാക്യം ഇനിപ്പറയുന്ന രീതിയിൽ മാറ്റാൻ കഴിയും. ഇത് പഴയപടിയാക്കാൻ, ഒരു വശത്ത് ഇ നീക്കംചെയ്ത് മറ്റൊരു വശത്ത് സ്വാഭാവിക ലോഗരിതം ചേർത്ത് നമുക്ക് മുന്നോട്ട് പോകാം.

ln (p (X) / 1 - p (X)) = b0 + b1 * X.

ഈ രീതിയിൽ, വലതുവശത്തുള്ള output ട്ട്‌പുട്ടിന്റെ കണക്കുകൂട്ടൽ വീണ്ടും രേഖീയമാണ് (ലീനിയർ റിഗ്രഷൻ പോലെ), ഇടതുവശത്തുള്ള ഇൻപുട്ട് സ്ഥിരസ്ഥിതി ക്ലാസിന്റെ പ്രോബബിലിറ്റിയുടെ ലോഗരിതം ആണ്.

ഇവന്റിന്റെ സംഭാവ്യതയുടെ അനുപാതമായി പ്രോബബിലിറ്റികൾ കണക്കാക്കുന്നു, ഇവന്റ് ഇല്ലാത്തതിന്റെ സാധ്യതയാൽ വിഭജിച്ചിരിക്കുന്നു, ഉദാ. 0,8 / (1-0,8) അതിന്റെ ഫലം 4 ആണ്. അതിനാൽ നമുക്ക് പകരം എഴുതാം:

ln (വിചിത്രമായത്) = b0 + b1 * X.

പ്രോബബിലിറ്റികൾ ലോഗ് രൂപാന്തരപ്പെടുത്തിയതിനാൽ, ഞങ്ങൾ ഇതിനെ ഇടത് വശത്തുള്ള ലോഗ്-ആഡ്സ് അല്ലെങ്കിൽ പ്രോബിറ്റ് എന്ന് വിളിക്കുന്നു.

നമുക്ക് എക്‌സ്‌പോണന്റിനെ വലതുവശത്തേക്ക് മടക്കി ഇങ്ങനെ എഴുതാം:

സംഭാവ്യത = e ^ (b0 + b1 * X)

മോഡൽ ഇപ്പോഴും ഇൻപുട്ടുകളുടെ ഒരു രേഖീയ സംയോജനമാണെന്ന് മനസ്സിലാക്കാൻ ഇതെല്ലാം ഞങ്ങളെ സഹായിക്കുന്നു, എന്നാൽ ഈ ലീനിയർ കോമ്പിനേഷൻ പ്രീ ക്ലാസ്സിന്റെ ലോഗ് പ്രോബബിലിറ്റികളെ സൂചിപ്പിക്കുന്നു.defiനിത.

ലോജിസ്റ്റിക് റിഗ്രഷൻ മോഡൽ പഠിക്കുന്നു

ലോജിസ്റ്റിക് റിഗ്രഷൻ അൽഗോരിത്തിന്റെ ഗുണകങ്ങൾ (ബീറ്റ അല്ലെങ്കിൽ ബി മൂല്യങ്ങൾ) പഠന ഘട്ടത്തിൽ കണക്കാക്കുന്നു. ഇത് ചെയ്യുന്നതിന്, ഞങ്ങൾ പരമാവധി സാധ്യത കണക്കാക്കൽ ഉപയോഗിക്കുന്നു.

നിരവധി മെഷീൻ ലേണിംഗ് അൽഗോരിതങ്ങൾ ഉപയോഗിക്കുന്ന ഒരു ലേണിംഗ് അൽഗോരിതം ആണ് പരമാവധി സാധ്യത കണക്കാക്കൽ. മോഡലിന്റെ ഫലമായുണ്ടാകുന്ന ഗുണകങ്ങൾ പ്രീ ക്ലാസിന് 1-ന് (ഉദാ. പുരുഷൻ) വളരെ അടുത്തുള്ള ഒരു മൂല്യം പ്രവചിക്കുന്നു.defiനൈറ്റ്, മറ്റ് ക്ലാസിന് 0 ന് വളരെ അടുത്തുള്ള ഒരു മൂല്യം (ഉദാ. സ്ത്രീ). ലോജിസ്റ്റിക് റിഗ്രഷന്റെ പരമാവധി സാധ്യത എന്നത് കോഫിഫിഷ്യന്റുകളുടെ (ബീറ്റ അല്ലെങ്കിൽ ഒബ് മൂല്യങ്ങൾ) മൂല്യങ്ങൾ കണ്ടെത്തുന്നതിനുള്ള ഒരു നടപടിക്രമമാണ്, അത് ഡാറ്റയിൽ ഉള്ളവയുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ മോഡൽ പ്രവചിച്ച പ്രോബബിലിറ്റികളിലെ പിശക് കുറയ്ക്കുന്നു (ഉദാ. ഡാറ്റ പ്രൈമറി ക്ലാസ് ആണെങ്കിൽ പ്രോബബിലിറ്റി 1) .

പരിശീലന ഡാറ്റയ്‌ക്കായി മികച്ച കോഫിഫിഷ്യന്റ് മൂല്യങ്ങൾ ഒപ്റ്റിമൈസ് ചെയ്യുന്നതിന് ഞങ്ങൾ ഒരു മിനിമൈസേഷൻ അൽഗോരിതം ഉപയോഗിക്കും. കാര്യക്ഷമമായ സംഖ്യാ ഒപ്റ്റിമൈസേഷൻ അൽഗോരിതം ഉപയോഗിച്ച് ഇത് പലപ്പോഴും പ്രായോഗികമായി നടപ്പിലാക്കുന്നു.

Ercole Palmeri

ടാഗുകൾ: വർഗ്ഗീകരണംക്ലസ്റ്ററിങ്കൃത്രിമ ബുദ്ധിയന്ത്ര പഠനംപൈത്തൺലീനിയർ റിഗ്രഷൻ

ഓഗസ്റ്റ് 16, 2020 4:02 pm

തൊട്ടടുത്ത മാർക്കറ്റിംഗ് ഓട്ടോമേഷൻ: സെഗ്മെന്റേഷൻ »

മുമ്പത്തെ "ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ്, കോഗ്നിറ്റീവ് സിസ്റ്റങ്ങൾ, അവ എന്തൊക്കെയാണ്, സാധ്യമായ ആപ്ലിക്കേഷനുകൾ

സമീപകാല ലേഖനങ്ങൾ

ലേഖനങ്ങൾ

ഉജ്ജ്വലമായ ആശയം: ബാൻഡലക്‌സ് എയർപ്യുർ® അവതരിപ്പിക്കുന്നു, വായു ശുദ്ധീകരിക്കുന്ന തിരശ്ശീല

നിരന്തരമായ സാങ്കേതിക നവീകരണത്തിൻ്റെയും പരിസ്ഥിതിയോടും ജനങ്ങളുടെ ക്ഷേമത്തോടുമുള്ള പ്രതിബദ്ധതയുടെയും ഫലം. ബന്ദലക്‌സ് എയർപ്യുരെ® അവതരിപ്പിക്കുന്നു, ഒരു കൂടാരം…

ഏപ്രിൽ 29 ഏപ്രിൽ

ലേഖനങ്ങൾ

ഡിസൈൻ പാറ്റേണുകൾ Vs SOLID തത്വങ്ങൾ, ഗുണങ്ങളും ദോഷങ്ങളും

സോഫ്‌റ്റ്‌വെയർ ഡിസൈനിലെ ആവർത്തിച്ചുള്ള പ്രശ്‌നങ്ങൾക്കുള്ള പ്രത്യേക താഴ്ന്ന നിലയിലുള്ള പരിഹാരങ്ങളാണ് ഡിസൈൻ പാറ്റേണുകൾ. ഡിസൈൻ പാറ്റേണുകൾ ഇവയാണ്…

ഏപ്രിൽ 29 ഏപ്രിൽ

കമ്യൂണികിട്ടി സ്റ്റാമ്പ

മാജിക്ക, അവരുടെ വാഹനം നിയന്ത്രിക്കുന്നതിൽ വാഹനമോടിക്കുന്നവരുടെ ജീവിതം ലളിതമാക്കുന്ന iOS ആപ്പ്

വാഹന മാനേജ്‌മെൻ്റ് ലളിതവും കാര്യക്ഷമവുമാക്കുന്ന ഐഫോൺ ആപ്പാണ് Magica, ഡ്രൈവർമാരെ സംരക്ഷിക്കാൻ സഹായിക്കുന്നു...

ഏപ്രിൽ 29 ഏപ്രിൽ

ലേഖനങ്ങൾ

എക്സൽ ചാർട്ടുകൾ, അവ എന്തൊക്കെയാണ്, ഒരു ചാർട്ട് എങ്ങനെ സൃഷ്ടിക്കാം, ഒപ്റ്റിമൽ ചാർട്ട് എങ്ങനെ തിരഞ്ഞെടുക്കാം

ഒരു Excel വർക്ക്ഷീറ്റിലെ ഡാറ്റയെ പ്രതിനിധീകരിക്കുന്ന ഒരു വിഷ്വൽ ആണ് Excel ചാർട്ട്.…

ഏപ്രിൽ 29 ഏപ്രിൽ

മെഷീൻ ലേണിംഗ് അൽ‌ഗോരിതംസിന്റെ വർഗ്ഗീകരണം: ലീനിയർ റിഗ്രഷൻ, ക്ലാസിഫിക്കേഷൻ, ക്ലസ്റ്ററിംഗ്

ലളിതമായ ലീനിയർ റിഗ്രഷൻ മോഡൽ

ഒന്നിലധികം ലീനിയർ റിഗ്രഷൻ മോഡൽ

ലോജിസ്റ്റിക് റിഗ്രഷൻ മോഡൽ

ലോജിസ്റ്റിക് റിഗ്രഷനായി ഉപയോഗിക്കുന്ന പ്രാതിനിധ്യം

ലോജിസ്റ്റിക് റിഗ്രഷൻ സാധ്യതകൾ പ്രവചിക്കുന്നു (സാങ്കേതിക ശ്രേണി)

ലോജിസ്റ്റിക് റിഗ്രഷൻ മോഡൽ പഠിക്കുന്നു

സമീപകാല ലേഖനങ്ങൾ

ഉജ്ജ്വലമായ ആശയം: ബാൻഡലക്‌സ് എയർപ്യുർ® അവതരിപ്പിക്കുന്നു, വായു ശുദ്ധീകരിക്കുന്ന തിരശ്ശീല

ഡിസൈൻ പാറ്റേണുകൾ Vs SOLID തത്വങ്ങൾ, ഗുണങ്ങളും ദോഷങ്ങളും

മാജിക്ക, അവരുടെ വാഹനം നിയന്ത്രിക്കുന്നതിൽ വാഹനമോടിക്കുന്നവരുടെ ജീവിതം ലളിതമാക്കുന്ന iOS ആപ്പ്

എക്സൽ ചാർട്ടുകൾ, അവ എന്തൊക്കെയാണ്, ഒരു ചാർട്ട് എങ്ങനെ സൃഷ്ടിക്കാം, ഒപ്റ്റിമൽ ചാർട്ട് എങ്ങനെ തിരഞ്ഞെടുക്കാം

സമീപകാല ലേഖനങ്ങൾ

ടാഗ്