Овие механизми овозможуваат интелигентна машина да ги подобри своите способности и перформанси со текот на времето, автоматски да учи со искуство за извршување на одредени задачи, подобрувајќи ги своите перформанси се повеќе и повеќе со текот на времето.
Пример е AlphaGo, Софтвер за машинско учење за играта Go развиена од Deepmind. AlpaGo беше првиот софтвер способен да победи човечки господар во играта во авион Гобан стандардна големина (19 × 19). Софтверот AlphaGo беше едуциран со набљудување на милиони потези направени од играчите на Go за време на различни игри, и со тоа што машината играше против себе, со резултат дека можеше да го победи оној што се веруваше дека е најдобриот играч во светот на оваа игра.
Ајде сега да одиме во трите главни категории на машинско учење.
Системот добива примери означени според саканиот излез. Односно, збирките на податоци корисни за инструкции на машината се составени од елементи што претставуваат реални ситуации составени од влезни податоци.карактеристики„И од излезните податоци“целни“. Со повикување на примерот на статијата Што е машинско учење, за што се работи и неговите цели, подготовката на обуката беше од надгледуван тип бидејќи имавме поединечни случаи на рути, од кои за секоја беа наведени карактеристики (возило, рута) и цел (време на патување). Збирките на податоци обично се многу посложени, примерот беше екстремно ограничен и дидактички, со цел да се поедностави разбирањето на надгледуваното машинско учење.
Случај од овој тип му овозможува на алгоритмот да ја проучува основата на типот на маршрутата и возилото, колку може да биде времето на патување. Постојат два вида проблеми во надгледуваното машинско учење:
Преиспитувајќи го примерот на автопатските правци, можеме да кажеме дека се работи за регресија. Ако целта се состоеше од проценка како што е: брзо ако е помалку од еден час, бавно помеѓу 1 и два часа, многу бавно ако повеќе од два часа. Во овој случај тоа ќе беше проблем со класификација.
Нема означени податоци, тоа е системот кој, почнувајќи од влезовите, мора да најде структура во податоците. Практично немаме цели, туку само внесени податоци. Како во примерот да имавме само податоци за рутата и возилото, но не и податоци за времето на патување.
Во овој пристап, алгоритмите мора да ги идентификуваат категориите барајќи скриени структури во податоците. Главните алатки кои можат да се користат во пристапот без надзор се групирање и правила за здружување.
Системот прима влез од околината и презема активности. Системот се обидува да преземе активности за да добие награди. Системот ќе се обиде да спроведе акции кои ја оптимизираат наградата во зависност од состојбата на околината.
Системот за наградување се имплементира преку компонента, наречена агент. Агентот одлучува да се изврши акција за околината и од тоа добива една награда и евентуално информации за состојбата на животната средина, како последица на покренатата акција.
На пример, ако мислиме на систем посветен на играта шах, агентот е компонентата што одлучува за потегот, околината е самата игра. Како последица на секој потег направен од агентот, состојбата на играта се менува (сфатена како моментална ситуација, позиција на сите фигури, исто така како последица на потегот на противникот), добивајќи повратна информација како изедено парче на противникот, затоа наменета како награда за потегот. На овој начин агентот учи и се едуцира.
Затоа е очигледно дека изборот помеѓу типовите на машинско учење зависи од контекстот. Односно, типот на пристап се избира врз основа на достапните податоци и можноста да се има историја која вклучува опис на околностите на секој поединечен случај (влез), а исто така и резултат (излез). Така, со множество податоци од овој тип, можете да продолжите да користите надгледуван пристап.
Ако, од друга страна, немате можност да ги знаете излезните податоци (цел) априори или сакате да откриете нови цели, тогаш неопходно е да се идентификуваат врските помеѓу влезните податоци за да се откријат околности кои никогаш не биле доживеани во историја, или да се соочиме со учење кон средина која еволуира и реагира. Во овој случај потребно е да се одлучат за техники без надзор или засилување.
Ercole Palmeri: Зависник од иновации
Секоја деловна операција произведува многу податоци, дури и во различни форми. Рачно внесете ги овие податоци од лист на Excel во…
Компромисот на е-поштата на компанијата се зголеми за повеќе од двојно во првите три месеци од 2024 година во споредба со последниот квартал од…
Принципот на сегрегација на интерфејсот е еден од петте СОЛИД принципи на објектно-ориентиран дизајн. Еден час треба да има…
Microsoft Excel е референтна алатка за анализа на податоци, бидејќи нуди многу функции за организирање на збирки на податоци,…
Walliance, SIM и платформата меѓу лидерите во Европа во областа на Crowdfunding за недвижности од 2017 година, го најавува завршувањето…
Филаментот е „забрзана“ развојна рамка на Ларавел, која обезбедува неколку компоненти со целосен оџак. Тој е дизајниран да го поедностави процесот на…
„Морам да се вратам за да ја завршам мојата еволуција: ќе се проектирам себеси во компјутерот и ќе станам чиста енергија. Откако се населиле во…
Google DeepMind воведува подобрена верзија на својот модел за вештачка интелигенција. Новиот подобрен модел обезбедува не само…