Informatica

የማሽን ትምህርት ዓይነቶች

የማሽን መማር (ራስ-ሰር ትምህርት) የሚለው ቃል የሚያመለክተው የሰው ሰራሽ የማሰብ ችሎታ ዓለም አካል የሆኑ የአሠራር ዘዴዎችን ነው። ሶስት የማሽን መማሪያ ዓይነቶች አሉ፡ ክትትል የሚደረግበት፣ ክትትል የማይደረግበት እና የማጠናከሪያ ትምህርት።

እነዚህ ዘዴዎች ብልህ የሆነ ማሽን ከጊዜ ወደ ጊዜ ችሎታቸውን እና አፈፃፀሙን እንዲያሻሽሉ ያስችላቸዋል ፣ የተወሰኑ ተግባሮችን ለማከናወን በራስ-ሰር ከእውቀት ጋር በመማር አፈፃፀሙን ያሻሽላል።

ምሳሌ ነው። AlphaGo, የማሽን መማር ሶፍትዌር ለ Go ጨዋታ የተዘጋጀ Deepmind. አልፓጎ በአውሮፕላን ውስጥ በጨዋታው ውስጥ የሰውን ጌታ ማሸነፍ የሚችል የመጀመሪያው ሶፍትዌር ነው። ጎባን መደበኛ መጠን (19 × 19). የአልፋጎ ሶፍትዌር የተማረው በተለያዩ ጨዋታዎች ወቅት በጎ ተጨዋቾች የሚደረጉትን በሚሊዮኖች የሚቆጠሩ እንቅስቃሴዎችን በመመልከት እና ማሽኑ በራሱ ላይ እንዲጫወት በማድረግ በዚህ ጨዋታ የአለም ምርጥ ተጫዋች ነው ተብሎ የሚታመነውን ማሸነፍ ችሏል።

አሁን ወደ ሶስት ዋና ዋና የማሽን መማሪያ ምድቦች እንሂድ።

ክትትል የሚደረግበት ትምህርት

ስርዓቱ በሚፈለገው ውጤት መሰረት ምልክት የተደረገባቸው ምሳሌዎችን ይቀበላል. ማለትም፣ ማሽኑን ለማስተማር የሚጠቅሙ የመረጃ ቋቶች ከግቤት ውሂብ የተውጣጡ እውነተኛ ሁኔታዎችን ከሚወክሉ አካላት የተሠሩ ናቸው።ዋና መለያ ጸባያት"እና ከውጤት ውሂብ"ዒላማ". የጽሁፉን ምሳሌ በመጥቀስ የማሽን መማር ምንድን ነው ፣ ስለ ምን እና ዓላማዎቹየሥልጠናው ዝግጅት ለየብቻ የመንገዶች ጉዳይ ስለነበረን የሥልጠናው ዝግጅት ክትትል የሚደረግበት ነበር ለእያንዳንዳቸው ገፅታዎች (ተሽከርካሪ፣ መንገድ) እና ኢላማ (የጉዞ ጊዜ) ተለይተዋል። የውሂብ ስብስቦች ብዙውን ጊዜ በጣም የተወሳሰቡ ናቸው፣ ምሳሌው እጅግ በጣም ውስን እና ተግባራዊ ነበር፣ ዓላማውም ክትትል የሚደረግበት የማሽን መማር ግንዛቤን ለማቃለል ነው።

የዚህ ዓይነቱ ጉዳይ አልጎሪዝም የመንገዱን እና የተሽከርካሪውን ዓይነት መሠረት እንዲያጠና ያስችለዋል ፣ የጉዞ ጊዜ ምን ሊሆን ይችላል። ቁጥጥር የሚደረግበት የማሽን ትምህርት ሁለት አይነት ችግሮች አሉ፡-

ንዴት: ዒላማው በተከታታይ ተለዋዋጭ ሲሠራ, ይህ መጠን, ቁጥር ነው;
ምደባዒላማው በክፍል ወይም በምድብ መወከል ሲቻል።

የሞተር መንገድ መንገዶችን ምሳሌ እንደገና ስንመረምር, ወደ ኋላ መመለስ ነው ማለት እንችላለን. ዒላማው ግምገማን ያካተተ ከሆነ፡ ከአንድ ሰአት በታች ከሆነ ፈጣን፣ በ1 እና በሁለት ሰአት መካከል ቀርፋፋ፣ ከሁለት ሰአት በላይ ከሆነ በጣም ቀርፋፋ። በዚህ ጉዳይ ላይ የመመደብ ችግር ነበር.

ቁጥጥር የማይደረግበት ትምህርት

ምንም ምልክት የተደረገበት ውሂብ የለም, ከግብዓቶች ጀምሮ, በመረጃው ውስጥ መዋቅር ማግኘት ያለበት ስርዓቱ ነው. እኛ በተግባር ምንም ኢላማዎች የሉንም፣ ነገር ግን የግቤት ውሂብ ብቻ። በምሳሌው ውስጥ የመንገድ እና የተሽከርካሪዎች መረጃ ብቻ እንዳለን, ነገር ግን የጉዞ ጊዜ ውሂብ አይደለም.

በዚህ አቀራረብ, ስልተ ቀመሮቹ በመረጃው ውስጥ የተደበቁ መዋቅሮችን በመፈለግ ምድቦችን መለየት አለባቸው. ቁጥጥር በማይደረግበት አቀራረብ ውስጥ ጥቅም ላይ ሊውሉ የሚችሉ ዋና ዋና መሳሪያዎች ናቸው መሰብሰብ እና የማህበር ደንቦች.

የማጠናከሪያ ትምህርት

ስርዓቱ ከአካባቢው ግብዓት ይቀበላል እና እርምጃዎችን ይወስዳል። ስርዓቱ ሽልማቶችን ለማግኘት እርምጃዎችን ለመውሰድ ይሞክራል። ስርዓቱ በአካባቢው ባለው ሁኔታ ላይ በመመስረት ሽልማቱን የሚያሻሽሉ ድርጊቶችን ለመተግበር ይሞክራል.

የሽልማት ሥርዓቱ የሚተገበረው በተባለው አካል ነው። ወኪል. ተወካዩ በአካባቢው ላይ የሚወሰደውን እርምጃ ይወስናል እና ከዚህ አንድ ይቀበላል ሪኮምፐንሳ እና ምናልባትም በአካባቢው ሁኔታ ላይ መረጃ, በተጀመረው ድርጊት ምክንያት.

ለምሳሌ, ለቼዝ ጨዋታ የተወሰነ ስርዓትን ካሰብን, ወኪሉ እንቅስቃሴውን የሚወስነው አካል ነው, አካባቢው ራሱ ጨዋታው ነው. በተወካዩ በተደረጉ እያንዳንዱ እንቅስቃሴዎች ምክንያት የጨዋታው ሁኔታ ይለወጣል (እንደ ወቅታዊው ሁኔታ ፣ የሁሉም ቁርጥራጮች አቀማመጥ ፣ እንዲሁም በተቃዋሚው እንቅስቃሴ ምክንያት) ፣ የተቃዋሚ ቁራጭ ተበላ ፣ ስለሆነም ለመንቀሳቀስ እንደ ሽልማት የታሰበ. በዚህ መንገድ ወኪሉ ይማራል, እራሱን ያስተምራል.

ታሰላስል

ስለዚህ በማሽን መማሪያ ዓይነቶች መካከል ያለው ምርጫ እንደ አውድ ላይ እንደሚመረኮዝ ግልጽ ነው. ያም ማለት የአቀራረብ አይነት የሚመረጠው በተገኘው መረጃ መሰረት እና የእያንዳንዱን ግለሰብ ሁኔታ (ግቤት) ሁኔታን የሚገልጽ ታሪክ የመኖሩ እድል እና እንዲሁም ውጤት (ውጤት) ነው. ስለዚህ በዚህ አይነት የውሂብ ስብስብ, ክትትል የሚደረግበት ዘዴን መጠቀም መቀጠል ይችላሉ.

በሌላ በኩል የውጤት መረጃን (ዒላማ) የማወቅ እድል ከሌልዎት ወይም አዲስ ኢላማዎችን ለማግኘት ከፈለጉ በግብአት ውሂቡ ውስጥ ፈጽሞ ያልተለማመዱ ሁኔታዎችን ለማወቅ በግብአት ውሂቡ መካከል ያለውን ግንኙነት መለየት ያስፈልጋል። ታሪክ፣ ወይም በዝግመተ ለውጥ እና ምላሽ ወደሚያገኝ አካባቢ መማር። በዚህ ሁኔታ ቁጥጥር የማይደረግበት ወይም የማጠናከሪያ ዘዴዎችን መምረጥ አስፈላጊ ነው.

Ercole Palmeriፈጠራ ሱስ ነው።