እነዚህ ዘዴዎች ብልህ የሆነ ማሽን ከጊዜ ወደ ጊዜ ችሎታቸውን እና አፈፃፀሙን እንዲያሻሽሉ ያስችላቸዋል ፣ የተወሰኑ ተግባሮችን ለማከናወን በራስ-ሰር ከእውቀት ጋር በመማር አፈፃፀሙን ያሻሽላል።
ምሳሌ ነው። AlphaGo, የማሽን መማር ሶፍትዌር ለ Go ጨዋታ የተዘጋጀ Deepmind. አልፓጎ በአውሮፕላን ውስጥ በጨዋታው ውስጥ የሰውን ጌታ ማሸነፍ የሚችል የመጀመሪያው ሶፍትዌር ነው። ጎባን መደበኛ መጠን (19 × 19). የአልፋጎ ሶፍትዌር የተማረው በተለያዩ ጨዋታዎች ወቅት በጎ ተጨዋቾች የሚደረጉትን በሚሊዮኖች የሚቆጠሩ እንቅስቃሴዎችን በመመልከት እና ማሽኑ በራሱ ላይ እንዲጫወት በማድረግ በዚህ ጨዋታ የአለም ምርጥ ተጫዋች ነው ተብሎ የሚታመነውን ማሸነፍ ችሏል።
አሁን ወደ ሶስት ዋና ዋና የማሽን መማሪያ ምድቦች እንሂድ።
ስርዓቱ በሚፈለገው ውጤት መሰረት ምልክት የተደረገባቸው ምሳሌዎችን ይቀበላል. ማለትም፣ ማሽኑን ለማስተማር የሚጠቅሙ የመረጃ ቋቶች ከግቤት ውሂብ የተውጣጡ እውነተኛ ሁኔታዎችን ከሚወክሉ አካላት የተሠሩ ናቸው።ዋና መለያ ጸባያት"እና ከውጤት ውሂብ"ዒላማ". የጽሁፉን ምሳሌ በመጥቀስ የማሽን መማር ምንድን ነው ፣ ስለ ምን እና ዓላማዎቹየሥልጠናው ዝግጅት ለየብቻ የመንገዶች ጉዳይ ስለነበረን የሥልጠናው ዝግጅት ክትትል የሚደረግበት ነበር ለእያንዳንዳቸው ገፅታዎች (ተሽከርካሪ፣ መንገድ) እና ኢላማ (የጉዞ ጊዜ) ተለይተዋል። የውሂብ ስብስቦች ብዙውን ጊዜ በጣም የተወሳሰቡ ናቸው፣ ምሳሌው እጅግ በጣም ውስን እና ተግባራዊ ነበር፣ ዓላማውም ክትትል የሚደረግበት የማሽን መማር ግንዛቤን ለማቃለል ነው።
የዚህ ዓይነቱ ጉዳይ አልጎሪዝም የመንገዱን እና የተሽከርካሪውን ዓይነት መሠረት እንዲያጠና ያስችለዋል ፣ የጉዞ ጊዜ ምን ሊሆን ይችላል። ቁጥጥር የሚደረግበት የማሽን ትምህርት ሁለት አይነት ችግሮች አሉ፡-
የሞተር መንገድ መንገዶችን ምሳሌ እንደገና ስንመረምር, ወደ ኋላ መመለስ ነው ማለት እንችላለን. ዒላማው ግምገማን ያካተተ ከሆነ፡ ከአንድ ሰአት በታች ከሆነ ፈጣን፣ በ1 እና በሁለት ሰአት መካከል ቀርፋፋ፣ ከሁለት ሰአት በላይ ከሆነ በጣም ቀርፋፋ። በዚህ ጉዳይ ላይ የመመደብ ችግር ነበር.
ምንም ምልክት የተደረገበት ውሂብ የለም, ከግብዓቶች ጀምሮ, በመረጃው ውስጥ መዋቅር ማግኘት ያለበት ስርዓቱ ነው. እኛ በተግባር ምንም ኢላማዎች የሉንም፣ ነገር ግን የግቤት ውሂብ ብቻ። በምሳሌው ውስጥ የመንገድ እና የተሽከርካሪዎች መረጃ ብቻ እንዳለን, ነገር ግን የጉዞ ጊዜ ውሂብ አይደለም.
በዚህ አቀራረብ, ስልተ ቀመሮቹ በመረጃው ውስጥ የተደበቁ መዋቅሮችን በመፈለግ ምድቦችን መለየት አለባቸው. ቁጥጥር በማይደረግበት አቀራረብ ውስጥ ጥቅም ላይ ሊውሉ የሚችሉ ዋና ዋና መሳሪያዎች ናቸው መሰብሰብ እና የማህበር ደንቦች.
ስርዓቱ ከአካባቢው ግብዓት ይቀበላል እና እርምጃዎችን ይወስዳል። ስርዓቱ ሽልማቶችን ለማግኘት እርምጃዎችን ለመውሰድ ይሞክራል። ስርዓቱ በአካባቢው ባለው ሁኔታ ላይ በመመስረት ሽልማቱን የሚያሻሽሉ ድርጊቶችን ለመተግበር ይሞክራል.
የሽልማት ሥርዓቱ የሚተገበረው በተባለው አካል ነው። ወኪል. ተወካዩ በአካባቢው ላይ የሚወሰደውን እርምጃ ይወስናል እና ከዚህ አንድ ይቀበላል ሪኮምፐንሳ እና ምናልባትም በአካባቢው ሁኔታ ላይ መረጃ, በተጀመረው ድርጊት ምክንያት.
ለምሳሌ, ለቼዝ ጨዋታ የተወሰነ ስርዓትን ካሰብን, ወኪሉ እንቅስቃሴውን የሚወስነው አካል ነው, አካባቢው ራሱ ጨዋታው ነው. በተወካዩ በተደረጉ እያንዳንዱ እንቅስቃሴዎች ምክንያት የጨዋታው ሁኔታ ይለወጣል (እንደ ወቅታዊው ሁኔታ ፣ የሁሉም ቁርጥራጮች አቀማመጥ ፣ እንዲሁም በተቃዋሚው እንቅስቃሴ ምክንያት) ፣ የተቃዋሚ ቁራጭ ተበላ ፣ ስለሆነም ለመንቀሳቀስ እንደ ሽልማት የታሰበ. በዚህ መንገድ ወኪሉ ይማራል, እራሱን ያስተምራል.
ስለዚህ በማሽን መማሪያ ዓይነቶች መካከል ያለው ምርጫ እንደ አውድ ላይ እንደሚመረኮዝ ግልጽ ነው. ያም ማለት የአቀራረብ አይነት የሚመረጠው በተገኘው መረጃ መሰረት እና የእያንዳንዱን ግለሰብ ሁኔታ (ግቤት) ሁኔታን የሚገልጽ ታሪክ የመኖሩ እድል እና እንዲሁም ውጤት (ውጤት) ነው. ስለዚህ በዚህ አይነት የውሂብ ስብስብ, ክትትል የሚደረግበት ዘዴን መጠቀም መቀጠል ይችላሉ.
በሌላ በኩል የውጤት መረጃን (ዒላማ) የማወቅ እድል ከሌልዎት ወይም አዲስ ኢላማዎችን ለማግኘት ከፈለጉ በግብአት ውሂቡ ውስጥ ፈጽሞ ያልተለማመዱ ሁኔታዎችን ለማወቅ በግብአት ውሂቡ መካከል ያለውን ግንኙነት መለየት ያስፈልጋል። ታሪክ፣ ወይም በዝግመተ ለውጥ እና ምላሽ ወደሚያገኝ አካባቢ መማር። በዚህ ሁኔታ ቁጥጥር የማይደረግበት ወይም የማጠናከሪያ ዘዴዎችን መምረጥ አስፈላጊ ነው.
Ercole Palmeriፈጠራ ሱስ ነው።
ማንኛውም የንግድ ሥራ በተለያዩ ቅርጾች እንኳን ሳይቀር ብዙ ውሂብ ይፈጥራል. ይህንን ውሂብ እራስዎ ከኤክሴል ሉህ ወደ…
በ2024 የመጀመሪያዎቹ ሶስት ወራት ውስጥ የኩባንያው ኢሜይሎች ስምምነት ካለፈው ሩብ ዓመት ጋር ሲነጻጸር ከእጥፍ በላይ ጨምሯል።
የበይነገጽ መለያየት መርህ ከአምስቱ የ SOLID መርሆዎች የነገር ተኮር ንድፍ አንዱ ነው። አንድ ክፍል ሊኖረው ይገባል…
ማይክሮሶፍት ኤክሴል የመረጃ ስብስቦችን ለማደራጀት ብዙ ባህሪያትን ስለሚሰጥ የመረጃ ትንተና ዋቢ መሳሪያ ነው…
ከ 2017 ጀምሮ በሪል እስቴት Crowdfunding መስክ በአውሮፓ ውስጥ ካሉ መሪዎች መካከል ዋሊያንስ ፣ ሲም እና መድረክ ማጠናቀቁን ያስታውቃል…
Filament "የተጣደፈ" የላራቬል ልማት ማዕቀፍ ነው, በርካታ ሙሉ-ቁልል ክፍሎችን ያቀርባል. ሂደቱን ለማቃለል የተነደፈ ነው…
"የእኔን ዝግመተ ለውጥ ለማጠናቀቅ መመለስ አለብኝ፡ እራሴን በኮምፒዩተር ውስጥ አቀርባለሁ እና ንጹህ ሃይል እሆናለሁ። አንዴ ከተቀመጠ…
ጎግል DeepMind የተሻሻለ የአርቴፊሻል ኢንተለጀንስ ሞዴሉን እያስተዋወቀ ነው። አዲሱ የተሻሻለው ሞዴል ብቻ ሳይሆን…