යන පාර කියල හිතන අයත් ඉන්නවා මානව මට්ටමේ කෘතිම බුද්ධිය දැන් සිතියම්ගත කර ඇත, දැන් එය පරිගණක සම්පත් වැඩි කිරීම පිළිබඳ ප්රශ්නයක් වනු ඇත, අනෙකුත් බොහෝ අවශ්යතා තවමත් අතුරුදහන් වනු ඇති නිසා මන්දගාමී වේ. කෙසේ වෙතත්, ඉතා වෙනස් කාර්යයන් කළමනාකරණය කිරීමේ අසාමාන්ය හැකියාව Gato අනෙක් ඒවාට වඩා වෙනස් AI පද්ධතියක් බවට පත් කරයි, එය එක් අතකින් තවමත් සෑම කෙනෙකුම අපේක්ෂා කරන සාමාන්ය කෘතිම බුද්ධිය නොවේ නම්, අනෙක් පැත්තෙන් එය තවමත් නව්ය පද්ධතියකි. එකම ගෘහනිර්මාණ ශිල්පයට වඩා වෙනස් දත්ත සැකසීමට කළමනාකරණය කරයි deep learning.
කෘත්රිම බුද්ධියේ සංකීර්ණ ලෝකයේ මෙතෙක් පැවති ප්රධාන වෙනස්කම්වලින් එකක් වූයේ දුර්වල AI, "පටු" AI ලෙසද හැඳින්වෙන සහ ශක්තිමත් AI, "සාමාන්ය" AI ලෙසද හැඳින්වේ. සිතීමේ යන්ත්ර පිළිබඳ ප්රශ්නය වහාම විසඳීමට එය තරමක් සරල ක්රමයක් විය. පටු AI යනු මාර්ගයක් සැලසුම් කිරීම, අදාළ සෙවුම් ප්රතිඵල සැපයීම හෝ ලිඛිත සංවාදයක් පැවැත්වීම වැනි එක් කාර්යයක් පමණක් ඉටු කරන ආකාරයේ කෘතිම බුද්ධියකි. අනෙක් අතට සාමාන්ය AI යනු චිත්රපටවල අප දකින ආකාරයේ කෘත්රිම බුද්ධියක් වන අතර එය මිනිසෙකු මෙන් සිතන, එකවර බොහෝ කාර්යයන් ඉටු කරන, ඒවා අතර ප්රයෝජනවත් සහසම්බන්ධතා ඇති කරයි. මෙම මිනිසුන්ට සමාන යන්ත්ර සඳහා කෙටි යෙදුම AGI වේ. කෘතිම සාමාන්ය බුද්ධිය. බොහෝ පර්යේෂකයන් සඳහා, න්යායාත්මකව කළ හැකි නමුත් අපි ඉක්මනින් ළඟා නොවන චිමේරා.
කෙසේ වෙතත්, අද මෙම වෙනස ක්රියා කරන අතර පැහැදිලි කිරීමට අඩු හා සරල වීමට පටන් ගනී. ඇත්ත වශයෙන්ම, මෑත වසරවලදී, AGI සොයාගැනීම්වලට තුඩු නොදී, වඩ වඩාත් සාමාන්යවාදී කෘතිම බුද්ධි ආකෘති නිර්මාණය කිරීමට පර්යේෂණ තල්ලු වී ඇත. එබැවින් එය නිර්මාණය වෙමින් පවතී එක්තරා ආකාරයක මැද බිමක්, විවිධ ස්වභාවයේ බොහෝ කාර්යයන් ඉටු කිරීමට හැකි AI මාදිලි අපට හමුවන අතර, ඒවා තවදුරටත් "පටු" AI ලෙස විස්තර කළ නොහැකි නමුත්, ඒ සමඟම එම හේතුකාරක බුද්ධිය හෝ දැනුවත්භාවය නොපෙන්වයි. බොහෝ විශේෂඥයින් AGI තුළ ආවේනික විය යුතුය.
අපට මෙම වර්ගයේ කෘතිම බුද්ධිය "සාමාන්යවාදී" හෝ සමහර විට වඩාත් නිවැරදිව හැඳින්විය හැකිය.බහුමාධ්ය”, එය සමඟ අන්තර් ක්රියා කිරීමට ක්රම කිහිපයක් ඇති බැවින්. උදාහරණයක් ලෙස, multimodal AI පද්ධතියකට අපගේ ප්රදේශයේ කාලගුණ අනාවැකිය සොයා ගැනීමට හැකි වනු ඇත (සොයා බලා හොඳම ප්රතිඵලය තෝරන්න), අද වැස්ස බව අපට කියන්න (ස්වාභාවික භාෂා සැකසීම සහ කථන සංස්ලේෂණය) සහ අපි යනවාදැයි පරීක්ෂා කරන්න. කුඩයක් සහිතව හෝ නැතිව (යන්ත්ර දර්ශනය). තවද, බහුමාධ්ය පද්ධතියක එක් ප්රධාන ලක්ෂණයක් වන්නේ විවිධ වර්ගවල දත්ත “ආග්රහණය කිරීම” - උදාහරණ ලෙස පින්තූර සහ පෙළ - දෙකෙන්ම ප්රයෝජනවත් තොරතුරු අඳින්නේ කෙසේදැයි දැන ගැනීමයි. එහි ප්රතිඵලයක් ලෙස, අප කටයුතු කරන්නේ සැබෑ බුද්ධියක් සමඟ බව අපට පෙනෙනු ඇත, යථාර්ථයේ දී ඇත්තේ "බැටරි" තුළ සහ එකිනෙක හා සහයෝගීතාවයේ තබා ඇති බහු AI මාදිලි පමණි.
බහුමාධ්ය AI සඳහා වූ පර්යේෂණ සම්බන්ධයෙන්, මෑත සතිවල ලන්ඩන් සමාගමක් වන DeepMind, අපට මතකයි - මන්දාකිනියේ කොටසකි. ගූගල්, තමන් ගැන බොහෝ කතා බහට ලක් වූ AI පද්ධති දෙකක් නිකුත් කර ඇත. පළමුවැන්න ලෙස හැඳින්වේ ෆ්ලෙමින්ගෝ, සහ "බහුවිධ කාර්යයන්" විසඳීමට හැකියාව ඇති ආකෘතියකි, එනම්, පින්තූර, වීඩියෝ සහ පෙළ වැනි විවිධ ක්රම හරහා එකිනෙකින් එන තොරතුරු එකිනෙකින් සංකලනය වී තිබිය හැකි කාර්යයන්. ෆ්ලෙමින්ගෝ යනු දෘශ්ය භාෂා ආකෘතියක් (VLM) වන අතර එය වර්ගීකරණ තොරතුරු, සිරස්තල කළමනාකරණය, රූප මත පදනම් වූ ප්රශ්නවලට පිළිතුරු, ආදාන / ප්රතිදාන සාම්පල කිහිපයක් පමණක් සපයන අතර (ඊනියා "වෙඩි කිහිපයක් ඉගෙනීම" ").
ආකෘතියේ පරමාර්ථය වන්නේ රූපයක හෝ වීඩියෝවක තත්වය "අවබෝධ කර ගැනීම", එහි භාෂා පද්ධතිය සමඟ එය නිවැරදිව විස්තර කිරීම සහ එය "දකින" දේ සම්බන්ධ ප්රශ්නවලට නිවැරදිව පිළිතුරු සැපයීමයි.
දී ඇති කාර්යයක් සඳහා Gato සැමවිටම හොඳම AI ආකෘතිය නොවේ. Sawyer රොබෝවෙකුගේ පාලනය (එය බොහෝ "සන්ධි" සහිත අතකින් සමන්විත රොබෝවකි) හොඳ ප්රමිතියක් ඇත, නමුත් සිරස්තල නිර්මාණය කිරීම සාමාන්ය දෙයක් වන අතර සමහර Atari ක්රීඩා හැසිරවීම කැප වූ අනෙක් ඒවාට වඩා අඩුය. AI ආකෘති. DeepMind ප්රකාශ කරන්නේ කාර්යයන් 450 න් (ඔහු පුහුණු කළ 604 හා සසඳන විට) Gato "කාලයෙන් අඩකට වඩා" මානව විශේෂඥයින්ට වඩා නිවැරදි බවයි. සම්පූර්ණ කාර්ය 604 න් අවම වශයෙන් 154 ක් ඉතා දුර්වල ප්රතිඵල ලබා දෙන බව පැවසීමේ තරමක් ව්යාකූල ආකාරයක් වන අතර ඉතිරි 450 දී Gato කාලයෙන් හොඳ භාගයක් මානව විශේෂඥයෙකුට වඩා හොඳින් හැසිරෙන නමුත් එය හැසිරෙන කාලයෙන් තවත් භාගයක් වඩාත් නරක ය.
මේ සතිවල ප්රතිඵල DeepMind වසර ගණනාවක් තිස්සේ කරගෙන යන කැපවීමක ප්රතිඵලයක්. සමාගමේ ඉලක්කය වන්නේ "බුද්ධිය පිළිබඳ ගැටළුව විසඳීම", විවිධ ගැටළු රාශියක් විසඳීමට හැකි වන පරිදි වඩාත් පොදු පද්ධති සංවර්ධනය කිරීම බව අමතක නොකළ යුතුය. ඒකට තමයි සමාගම කෘත්රිම සාමාන්ය බුද්ධිය කියලා කියන්නේ, එතනට තමයි යන්න ඕන. පසුගිය වසරේ මෙම දිශාවට පියවරක් තැබීය සංජානනය කරන්නා, රූප, පෙළ, වීඩියෝ, ශබ්ද, ත්රිමාණ දත්ත වැනි විවිධ ආකාරයේ යෙදවුම් හැසිරවීමේ හැකියාව ඇති ට්රාන්ස්ෆෝමර් ගෘහ නිර්මාණ ශිල්පය මත පදනම් වූ බහුමාධ්ය ආකෘතියකි. ගැටෝ හි නිර්මාතෘවරුන් සිතන්නේ අනාගත සාමාන්ය පද්ධතිවල මාදිලි ගණන තවදුරටත් පුළුල් කිරීම සඳහා Perceiver ප්රයෝජනවත් විය හැකි බවයි.
ලිපියෙන් උපුටා ගන්නා ලදී Luca Sambucci, ඔබට කියවීමට අවශ්ය නම්සම්පූර්ණ පෝස්ට් එක මෙතන ක්ලික් කරන්න
නාවික අංශය සැබෑ ගෝලීය ආර්ථික බලවතෙකු වන අතර එය බිලියන 150 ක වෙළඳපලක් කරා ගමන් කර ඇත.
පසුගිය සඳුදා ෆිනෑන්ෂල් ටයිම්ස් OpenAI සමඟ ගිවිසුමක් නිවේදනය කළේය. FT එහි ලෝක මට්ටමේ පුවත්පත් කලාවට බලපත්ර ලබා දෙයි…
මිලියන ගණනක් ජනතාව ප්රවාහ සේවා සඳහා ගෙවයි, මාසික දායක ගාස්තු ගෙවයි. පොදු මතය වන්නේ ඔබ...
Coveware by Veeam සයිබර් කප්පම් සිදුවීම් ප්රතිචාර සේවා සැපයීම දිගටම කරගෙන යනු ඇත. Coveware අධිකරණ වෛද්ය විද්යාව සහ ප්රතිකර්ම හැකියාවන් ලබා දෙනු ඇත…