یادگیری ماشینی به عنوان "مشکلات به حداقل رساندن" یک عملکرد ضرر در برابر مجموعه معینی از نمونه ها (مجموعه آموزش) فرموله شده است. این تابع اختلاف بین مقادیر پیش بینی شده توسط مدل در حال آموزش و مقادیر مورد انتظار برای هر نمونه را بیان می کند.
هدف نهایی ، آموزش مدل توانایی پیش بینی صحیح در مجموعه مواردی است که در مجموعه آموزش وجود ندارد.
روشی که براساس آن می توان دسته های مختلف الگوریتم را متمایز کرد، نوع خروجی مورد انتظار از یک سیستم معین است. فراگیری ماشین.
در میان دسته های اصلی که می یابیم:
نمونه ای از طبقه بندی ، اختصاص یک یا چند برچسب به یک تصویر بر اساس اشیاء یا موضوعات موجود در آن است.
نمونه ای از رگرسیون تخمین عمق یک صحنه از نمایش آن در قالب تصویر رنگی است.
در حقیقت ، دامنه ی خروجی مورد نظر واقعاً نامتناهی است ، و محدود به مجموعه ای از امکانات خاص نیست.
رگرسیون خطی هستممدل گسترده ای که برای تخمین مقادیر واقعی استفاده می شود مانند:
و معیار متغیرهای مداوم را دنبال می کند:
در رگرسیون خطی ، رابطه ای بین متغیرهای مستقل و متغیرهای وابسته از طریق یک خط دنبال می شود که معمولاً بیانگر رابطه بین دو متغیر است.
خط تناسب به خط رگرسیون معروف است و با یک معادله خطی از نوع Y = a * X + b نشان داده می شود.
فرمول مبتنی بر درون یابی داده ها به منظور پیوند دادن دو یا چند ویژگی با یکدیگر است. وقتی به الگوریتم یک ویژگی ورودی می دهید ، رگرسیون ویژگی دیگر را برمی گرداند.
هنگامی که ما بیش از یک متغیر مستقل داریم ، پس از فرض یک مدل مانند زیر ، از رگرسیون خطی چندگانه صحبت می کنیم:
y = ب0 + ب1x1 + ب2x2 +… + بnxn
در عمل ، معادله رابطه بین متغیر وابسته مداوم (y) و دو یا چند متغیر مستقل (x1 ، x2 ، x3 ...) را توضیح می دهد.
به عنوان مثال ، اگر بخواهیم میزان انرژی CO2 از یک ماشین (متغیر وابسته y) را با توجه به قدرت موتور ، تعداد سیلندرها و میزان مصرف سوخت تخمین بزنیم. این عوامل دوم متغیرهای مستقل x1 ، x2 و x3 هستند. ثابت ها اعداد واقعی هستند و ضرایب رگرسیون برآورد شده از مدل نامیده می شوند. Y متغیر وابسته مداوم است ، یعنی مجموع b0 ، b1 x1 ، b2 x2 و غیره است. y یک شماره واقعی خواهد بود
تحلیل رگرسیون چندگانه روشی است که برای شناسایی تأثیر متغیرهای مستقل بر یک متغیر وابسته به کار می رود.
درک چگونگی تغییر متغیر وابسته با تغییر متغیرهای مستقل به ما امکان می دهد تا اثرات یا تأثیرات تغییرات در موقعیت های واقعی را پیش بینی کنیم.
با استفاده از رگرسیون خطی چندگانه می توان فهمید که چگونه فشار خون تغییر می کند زیرا شاخص توده بدن با در نظر گرفتن عواملی مانند سن ، جنس ، و غیره تغییر می کند ، بنابراین فرض کنید چه اتفاقی می افتد.
با رگرسیون چندگانه می توان برآوردی از روند قیمت ها ، مانند روند آینده نفت یا طلا دریافت کرد.
سرانجام ، رگرسیون خطی چندگانه علاقه بیشتری به زمینه یادگیری ماشین و هوش مصنوعی پیدا می کند ، زیرا امکان دستیابی به مدل های یادگیری را حتی در مورد تعداد زیادی از پرونده ها برای تجزیه و تحلیل به دست می آورد.
رگرسیون لجستیک ابزاری آماری است که هدف آن مدل سازی یک نتیجه دوتایی با یک یا چند متغیر توضیحی است.
به طور کلی برای مشکلات باینری مورد استفاده قرار می گیرد ، جایی که فقط دو کلاس وجود دارد ، به عنوان مثال بله یا خیر ، 0 یا 1 ، مرد یا زن و غیره ...
از این طریق می توان داده ها را توصیف کرد و رابطه بین متغیر وابسته باینری و یک یا چند متغیر اسمی یا ترتیبی مستقل را توضیح داد.
نتیجه به لطف استفاده از یک تابع لجستیک تعیین می شود که یک احتمال را تخمین می زند و سپس defiنزدیکترین کلاس (مثبت یا منفی) به مقدار احتمال بدست آمده را خاتمه می دهد.
ما می توانیم رگرسیون لجستیک را به عنوان روشی برای طبقه بندی خانواده در نظر بگیریم الگوریتم های یادگیری نظارت شده.
با استفاده از روشهای آماری ، رگرسیون لجستیک امکان ایجاد نتیجه را می دهد که در حقیقت ، این احتمال را نشان می دهد که یک مقدار ورودی مشخص به یک کلاس معین تعلق دارد.
در مشكلات رگرسيون لجستيك ديناميك احتمال اينكه خروج به يك كلاس تعلق داشته باشد P خواهد بود در حالي كه متعلق به طبقه ديگر 1-P است (جايي كه P عددي بين 0 تا 1 است زيرا اين احتمال را نشان مي دهد).
رگرسیون لجستیک لاینالیستی در تمام مواردی که متغیر مورد نظر برای پیش بینی ما باینری است ، خوب عمل می کند ، یعنی می تواند تنها دو مقدار داشته باشد: مقدار 1 که نشان دهنده کلاس مثبت است یا مقدار 0 که نشان دهنده کلاس منفی است.
نمونه هایی از مشکلاتی که با استفاده از رگرسیون لجستیک قابل حل هستند عبارتند از:
با رگرسیون لجستیک می توانیم تجزیه و تحلیل پیش بینی کننده را انجام دهیم ، رابطه بین آنچه را که می خواهیم پیش بینی کنیم (متغیر وابسته) و یک یا چند متغیر مستقل ، یعنی خصوصیات ، اندازه گیری کنیم. تخمین احتمال از طریق یک تابع لجستیک انجام می شود.
احتمالات متعاقباً به مقادیر باینری تبدیل می شوند و برای واقعی تر شدن پیش بینی ، این نتیجه براساس اینكه نزدیك به خود کلاس باشد یا نه ، به كلاس متعلق به آن تعلق می گیرد.
به عنوان مثال ، اگر کاربرد تابع لجستیک 0,85 برگرداند ، بدین معناست که ورودی با اختصاص دادن به کلاس 1 یک کلاس مثبت ایجاد کرده است. برعکس اگر مقداری مانند 0,4 یا به طور کلی کمتر از 0,5 بدست آورده باشد ..
رگرسیون لجستیک برای ارزیابی طبقه بندی مقادیر ورودی از تابع لجستیک استفاده می کند.
عملکرد لجستیک ، که به آن سیگموئید نیز گفته می شود ، منحنی است که می تواند هر تعداد از مقدار واقعی را در نظر بگیرد و آن را به استثنای افراطی ، از یک مقدار بین 0 تا 1 نگاشت کند. عملکرد این است:
کجاست:
رگرسیون لجستیک از معادله ای به عنوان بازنمایی استفاده می کند ، دقیقاً مثل رگرسیون خطی
مقادیر ورودی (x) بصورت خطی با استفاده از وزنها یا مقادیر ضریب ترکیب می شوند تا مقدار خروجی (y) را پیش بینی کنید. یک تفاوت کلیدی از رگرسیون خطی در این است که مقدار خروجی مدل شده به جای یک عددی یک مقدار باینری (0 یا 1) است.
در اینجا مثالی از معادله رگرسیون لجستیک آورده شده است:
y = e^(b0 + b1 * x) / (1 + e^(b0 + b1 * x))
که در آن:
هر ستون در داده های ورودی دارای ضریب b (یک مقدار واقعی ثابت) است که باید از داده های آموزش آموخته شود.
بازنمایی واقعی مدلی که در حافظه یا پرونده ذخیره می کنید ضرایب معادله (مقدار بتا یا b) است.
رگرسیون لجستیک احتمال کلاس پیش فرض را مدل می کند.
به عنوان نمونه ، فرض كنیم كه از جنسیت افراد به عنوان نر یا ماده از قد آنها الگوسازی می كنیم ، طبقه اول می تواند نر باشد ، و مدل رگرسیون لجستیک می تواند به عنوان احتمال مرد بودن از قد قد فرد یا بیشتر نوشته شود. رسما:
P (جنس = مرد | قد)
به روشی دیگر، ما در حال مدل سازی احتمال تعلق یک ورودی (X) به کلاس pre هستیمdefinite (Y = 1)، می توانیم آن را به صورت زیر بنویسیم:
P(X) = P(Y = 1 | X)
پیش بینی احتمال باید به مقادیر باینری (0 یا 1) تبدیل شود تا در واقع یک پیش بینی احتمال ایجاد شود.
رگرسیون لجستیک روشی خطی است ، اما پیش بینی ها با استفاده از عملکرد لجستیک تبدیل می شوند. تأثیر این امر این است که ما دیگر نمی توان پیش بینی ها را به عنوان ترکیبی خطی از ورودی ها که می توانیم با رگرسیون خطی بفهمیم ، برای مثال ، با ادامه از بالا ، می توان مدل را به صورت زیر بیان کرد:
p(X) = e ^ (b0 + b1 * X) / (1 + e ^ (b0 + b1 * X))
اکنون می توان معادله را به شرح زیر معکوس کرد. برای معکوس کردن آن می توانیم با اضافه کردن e از یک طرف با اضافه کردن یک لگاریتم طبیعی از طرف دیگر ، پیش برویم.
ln (p (X) / 1 - p (X)) = b0 + b1 * X
به این ترتیب این واقعیت را می گیریم که محاسبه خروجی در سمت راست دوباره خطی است (درست مثل رگرسیون خطی) ، و ورودی در سمت چپ لگاریتمی برای احتمال کلاس پیش فرض است.
احتمالات بعنوان نسبت احتمالی رویداد تقسیم بر احتمال وقوع هیچ رویدادی ، به عنوان مثال محاسبه می شود. 0,8 / (1-0,8) که نتیجه آن 4 است. بنابراین می توانیم در عوض بنویسیم:
ln (شانس) = b0 + b1 * X
از آنجا که احتمالات تبدیل شده اند ، ما به این شكل ورود به سیستم یا مشروط می گویم.
ما می توانیم نماینده را به سمت راست برگردانیم و آنرا بنویسیم:
احتمال = e ^ (b0 + b1 * X)
همه اینها به ما کمک می کند تا بفهمیم که در واقع مدل هنوز یک ترکیب خطی از ورودی ها است، اما این ترکیب خطی به احتمالات لاگ کلاس پیش اشاره دارد.defiنیتا
ضرایب (مقادیر بتا یا ب) الگوریتم رگرسیون لجستیک در مرحله یادگیری برآورد می شود. برای این کار از تخمین حداکثر احتمال استفاده می کنیم.
تخمین حداکثر احتمال یک الگوریتم یادگیری است که توسط چندین الگوریتم یادگیری ماشین استفاده می شود. ضرایب حاصل از مدل مقدار بسیار نزدیک به 1 (به عنوان مثال پسر) را برای کلاس پیش دبستانی پیش بینی می کند.definite و مقدار بسیار نزدیک به 0 (به عنوان مثال زن) برای کلاس دیگر. حداکثر احتمال برای رگرسیون لجستیک روشی برای یافتن مقادیر برای ضرایب (مقادیر بتا یا ob) است که خطا در احتمالات پیشبینیشده توسط مدل را نسبت به احتمالات موجود در دادهها به حداقل میرساند (مثلاً احتمال 1 اگر دادهها کلاس اولیه باشد) .
ما از یک الگوریتم به حداقل رساندن برای بهینه سازی بهترین مقادیر ضریب برای داده های آموزش استفاده خواهیم کرد. این اغلب در عمل با استفاده از الگوریتم بهینه سازی عددی کارآمد اجرا می شود.
Coveware توسط Veeam به ارائه خدمات پاسخگویی به حوادث اخاذی سایبری ادامه خواهد داد. Coveware قابلیتهای پزشکی قانونی و اصلاحی را ارائه میدهد…
تعمیر و نگهداری پیش بینی شده با رویکردی نوآورانه و پیشگیرانه برای مدیریت کارخانه، بخش نفت و گاز را متحول می کند.…
CMA انگلستان در مورد رفتار Big Tech در بازار هوش مصنوعی هشداری صادر کرده است. آنجا…
فرمان "خانه های سبز" که توسط اتحادیه اروپا برای افزایش بهره وری انرژی ساختمان ها تدوین شده است، روند قانونی خود را با…