ગેટો, ડીપમાઇન્ડ અને સામાન્ય કૃત્રિમ બુદ્ધિમત્તા તરફની દોડ

ગેટો એ ડીપમાઇન્ડની નવી મલ્ટિમોડલ AI સિસ્ટમ છે જે હંમેશા સમાન ન્યુરલ નેટવર્કનો ઉપયોગ કરીને સેંકડો વિવિધ કાર્યો કરવા સક્ષમ છે.

ત્યાં જેઓ લાગે છે કે જે રીતે છે માનવ-સ્તરની કૃત્રિમ બુદ્ધિ હવે મેપ આઉટ થઈ ગયું છે, હવે તે માત્ર કોમ્પ્યુટેશનલ સંસાધનોને વધારવાનો પ્રશ્ન હશે, જ્યારે અન્ય ધીમી પડી રહ્યા છે કારણ કે ઘણી આવશ્યકતાઓ હજુ પણ ખૂટે છે. જો કે, ખૂબ જ અલગ-અલગ કાર્યોનું સંચાલન કરવાની અસાધારણ ક્ષમતા ગેટોને AI સિસ્ટમને અન્ય કરતા અલગ બનાવે છે, જે જો એક તરફ હજુ સુધી સામાન્ય કૃત્રિમ બુદ્ધિમત્તા નથી કે જેની દરેક વ્યક્તિ અપેક્ષા રાખે છે, તો બીજી તરફ તે હજુ પણ એક નવીન સિસ્ટમ છે. જે સમાન આર્કિટેક્ચરમાંથી ખૂબ જ અલગ ડેટા પર પ્રક્રિયા કરવાનું સંચાલન કરે છે deep learning.

AI અને સામાન્ય AI બંધ કરો

અત્યાર સુધી કૃત્રિમ બુદ્ધિમત્તાની જટિલ દુનિયામાં મુખ્ય તફાવતો પૈકી એક નબળા AI વચ્ચેનો તફાવત છે, જેને "સંકુચિત" AI પણ કહેવાય છે અને મજબૂત AI, જેને "સામાન્ય" AI પણ કહેવાય છે. વિચારવાના મશીનોના પ્રશ્નને તરત જ ઉકેલવા માટે તે એકદમ સરળ રીત હતી. નેરો એઆઈ એ એક પ્રકારની કૃત્રિમ બુદ્ધિ છે જે ફક્ત એક જ કાર્ય કરે છે, જેમ કે કોઈ માર્ગનું આયોજન કરવું, સંબંધિત શોધ પરિણામો પ્રદાન કરવા અથવા લેખિત વાતચીત કરવી. બીજી બાજુ, જનરલ AI એ એક પ્રકારની કૃત્રિમ બુદ્ધિ છે જે આપણે ફિલ્મોમાં જોઈએ છીએ, જે માણસની જેમ વિચારે છે, જે એકસાથે ઘણા કાર્યો કરે છે, તેમની વચ્ચે ઉપયોગી સિનર્જી બનાવે છે. આ માનવ જેવા મશીનોનું ટૂંકું નામ AGI છે, આર્ટિફિશિયલ જનરલ ઇન્ટેલિજન્સ. મોટાભાગના સંશોધકો માટે, એક કિમેરા જે સૈદ્ધાંતિક રીતે શક્ય છે પરંતુ જેના સુધી આપણે જલ્દી પહોંચીશું નહીં.

જો કે, આ ભેદ આજે ક્રીક થાય છે અને સમજાવવા માટે ઓછા અને ઓછા સરળ થવા લાગે છે. વાસ્તવમાં, તાજેતરના વર્ષોમાં સંશોધન એ AGI ની શોધ તરફ દોરી ગયા વિના, વધુને વધુ સામાન્યવાદી કૃત્રિમ બુદ્ધિમત્તા મોડલ બનાવવા તરફ આગળ વધ્યું છે. તેથી તે બનાવે છે એક પ્રકારનું મધ્યમ જમીન, જ્યાં આપણને એઆઈ મૉડલ મળે છે જે અલગ-અલગ પ્રકૃતિના અસંખ્ય કાર્યો કરવા સક્ષમ હોય છે, એટલા માટે કે તેઓને હવે "સંકુચિત" AI તરીકે વર્ણવી શકાય નહીં, પરંતુ જે તે જ સમયે તે કારણભૂત બુદ્ધિ અથવા જાગૃતિ બતાવતા નથી કે જેના માટે ઘણા નિષ્ણાતો એજીઆઈમાં સહજ હોવા જોઈએ.

મલ્ટિમોડલ AI

આપણે આ પ્રકારની કૃત્રિમ બુદ્ધિમત્તાને "સામાન્યવાદી" અથવા કદાચ વધુ યોગ્ય રીતે કહી શકીએ.મલ્ટીમોડલ”, કારણ કે તેની સાથે ક્રિયાપ્રતિક્રિયા કરવાની ઘણી રીતો છે. ઉદાહરણ આપવા માટે, મલ્ટિમોડલ AI સિસ્ટમ અમારા વિસ્તાર માટે હવામાનની આગાહી શોધી શકશે (શોધો અને શ્રેષ્ઠ પરિણામ પસંદ કરો), અમને જણાવો કે આજે વરસાદ પડશે (કુદરતી ભાષા પ્રક્રિયા અને ભાષણ સંશ્લેષણ) અને તપાસો કે અમે જઈ રહ્યા છીએ. છત્રી (મશીન વિઝન) સાથે અથવા વગર બહાર નીકળવું. તદુપરાંત, મલ્ટિમોડલ સિસ્ટમની મુખ્ય લાક્ષણિકતાઓમાંની એક એ છે કે વિવિધ પ્રકારના ડેટાને "ઇન્ગસ્ટિંગ" કરવું - ઉદાહરણ તરીકે છબીઓ અને ટેક્સ્ટ - બંનેમાંથી ઉપયોગી માહિતી કેવી રીતે દોરવી તે જાણવું. પરિણામે અમને એવું લાગશે કે અમે વાસ્તવિક બુદ્ધિમત્તા સાથે કામ કરી રહ્યા છીએ, વાસ્તવમાં ફક્ત બહુવિધ AI મૉડલ "બેટરી" અને એકબીજા સાથે સુમેળમાં મૂકવામાં આવ્યા છે.

ડીપમાઇન્ડ ઝૂ

મલ્ટિમોડલ AI તરફના સંશોધનના સંદર્ભમાં, તાજેતરના અઠવાડિયામાં લંડનની કંપની ડીપમાઇન્ડ, જે - અમને યાદ છે - તે ગેલેક્સીનો એક ભાગ છે. Google, એ બે AI સિસ્ટમ્સ બહાર પાડી છે જેણે પોતાના વિશે ઘણી ચર્ચા કરી છે. પ્રથમ કહેવામાં આવે છે ફ્લેમિંગો, અને "મલ્ટીમોડલ ટાસ્ક્સ" ઉકેલવામાં સક્ષમ મોડેલ છે, એટલે કે, એવા કાર્યો કે જેમાં વિવિધ મોડલિટીઝ, જેમ કે ઇમેજ, વિડિયો અને ટેક્સ્ટ, એકબીજા સાથે સંયોજનમાં પણ ઇનકમિંગ માહિતી આપવામાં આવી શકે છે. ફ્લેમિંગો એ વિઝ્યુઅલ લેંગ્વેજ મોડલ (VLM) છે જે વર્ગીકરણ માહિતી, કૅપ્શન મેનેજમેન્ટ, ઇમેજ-આધારિત પ્રશ્નના જવાબોને હેન્ડલ કરી શકે છે, જ્યારે માત્ર થોડા ઇનપુટ/આઉટપુટ નમૂનાઓ (કહેવાતા "ફુ-શોટ લર્નિંગ" ") પ્રદાન કરે છે.

મોડેલનો હેતુ કોઈ છબી અથવા વિડિયોની પરિસ્થિતિને "સમજવાનો" છે, તેની ભાષાકીય પ્રણાલી સાથે તેનું યોગ્ય રીતે વર્ણન કરવું અને તે જે "જુએ છે" તેને લગતા પ્રશ્નોના યોગ્ય જવાબ આપવાનો છે.

કનેક્ટિવિઝમ અને બુદ્ધિ?

આપેલ કાર્ય માટે ગેટો હંમેશા શ્રેષ્ઠ AI મોડેલ નથી. સોયર રોબોટનું નિયંત્રણ (તે ઘણા "સાંધા" સાથે હાથ ધરાવતો રોબોટ છે) એક સારા ધોરણનું છે, પરંતુ કૅપ્શન્સનું નિર્માણ માત્ર સામાન્ય છે, જ્યારે કેટલીક અટારી રમતોનું સંચાલન અન્ય સમર્પિત રમતો કરતા ઓછું છે. AI મોડલ્સ. ડીપમાઇન્ડ જણાવે છે કે 450 માંથી (604 ની સરખામણીમાં તેને તાલીમ આપવામાં આવી હતી) ગેટો માનવ નિષ્ણાતો કરતાં "અડધા કરતાં વધુ સમય" કરતાં વધુ સચોટ છે. કહેવાની થોડી ગૂંચવણભરી રીત કે કુલ 604 કાર્યોમાંથી, ઓછામાં ઓછા 154 ખૂબ જ ખરાબ પરિણામો આપે છે, જ્યારે બાકીના 450માં ગાટો માનવ નિષ્ણાત કરતાં વધુ સારી રીતે વર્તે છે, પરંતુ બીજા અડધા સમયમાં તે વર્તે છે. ખરાબ

સામાન્યીકરણનો માર્ગ

આ અઠવાડિયાના પરિણામો એ પ્રતિબદ્ધતાનું પરિણામ છે જે ડીપમાઇન્ડ ઘણા વર્ષોથી કરે છે. ચાલો ભૂલશો નહીં કે કંપનીનું ધ્યેય "બુદ્ધિની સમસ્યાનું નિરાકરણ" કરવાનો છે, વિવિધ સમસ્યાઓની વિશાળ શ્રેણીનો સામનો કરવા માટે સક્ષમ વધુ સામાન્ય સિસ્ટમ્સ વિકસાવવી. તેને કંપની આર્ટિફિશિયલ જનરલ ઈન્ટેલિજન્સ કહે છે અને તે જ તેઓ જવા માંગે છે. ગયા વર્ષે આ દિશામાં એક પગલું ભરવામાં આવ્યું હતું અનુભૂતિ કરનાર, ટ્રાન્સફોર્મર આર્કિટેક્ચર પર આધારિત મલ્ટિમોડલ મોડલ જે વિવિધ પ્રકારના ઇનપુટ્સ, જેમ કે છબીઓ, ટેક્સ્ટ, વિડિયો, સાઉન્ડ, 3D ડેટાને હેન્ડલ કરવામાં સક્ષમ છે. ગેટોના નિર્માતાઓ પોતે જ વિચારે છે કે પર્સીવર ભવિષ્યની સામાન્ય પ્રણાલીઓના મોડ્સની સંખ્યાને વધુ વિસ્તૃત કરવા માટે ઉપયોગી થઈ શકે છે.

ની પોસ્ટમાંથી કાઢવામાં આવેલ લેખ Luca Sambucci, જો તમે વાંચવા માંગતા હોઆખી પોસ્ટ અહીં ક્લિક કરો