કમ્પ્યુટર

ગેટો, ડીપમાઇન્ડ અને સામાન્ય કૃત્રિમ બુદ્ધિમત્તા તરફની દોડ

ગેટો એ ડીપમાઇન્ડની નવી મલ્ટિમોડલ AI સિસ્ટમ છે જે હંમેશા સમાન ન્યુરલ નેટવર્કનો ઉપયોગ કરીને સેંકડો વિવિધ કાર્યો કરવા સક્ષમ છે.

ત્યાં જેઓ લાગે છે કે જે રીતે છે માનવ-સ્તરની કૃત્રિમ બુદ્ધિ હવે મેપ આઉટ થઈ ગયું છે, હવે તે માત્ર કોમ્પ્યુટેશનલ સંસાધનોને વધારવાનો પ્રશ્ન હશે, જ્યારે અન્ય ધીમી પડી રહ્યા છે કારણ કે ઘણી આવશ્યકતાઓ હજુ પણ ખૂટે છે. જો કે, ખૂબ જ અલગ-અલગ કાર્યોનું સંચાલન કરવાની અસાધારણ ક્ષમતા ગેટોને AI સિસ્ટમને અન્ય કરતા અલગ બનાવે છે, જે જો એક તરફ હજુ સુધી સામાન્ય કૃત્રિમ બુદ્ધિમત્તા નથી કે જેની દરેક વ્યક્તિ અપેક્ષા રાખે છે, તો બીજી તરફ તે હજુ પણ એક નવીન સિસ્ટમ છે. જે સમાન આર્કિટેક્ચરમાંથી ખૂબ જ અલગ ડેટા પર પ્રક્રિયા કરવાનું સંચાલન કરે છે deep learning.

AI અને સામાન્ય AI બંધ કરો 

અત્યાર સુધી કૃત્રિમ બુદ્ધિમત્તાની જટિલ દુનિયામાં મુખ્ય તફાવતો પૈકી એક નબળા AI વચ્ચેનો તફાવત છે, જેને "સંકુચિત" AI પણ કહેવાય છે અને મજબૂત AI, જેને "સામાન્ય" AI પણ કહેવાય છે. વિચારવાના મશીનોના પ્રશ્નને તરત જ ઉકેલવા માટે તે એકદમ સરળ રીત હતી. નેરો એઆઈ એ એક પ્રકારની કૃત્રિમ બુદ્ધિ છે જે ફક્ત એક જ કાર્ય કરે છે, જેમ કે કોઈ માર્ગનું આયોજન કરવું, સંબંધિત શોધ પરિણામો પ્રદાન કરવા અથવા લેખિત વાતચીત કરવી. બીજી બાજુ, જનરલ AI એ એક પ્રકારની કૃત્રિમ બુદ્ધિ છે જે આપણે ફિલ્મોમાં જોઈએ છીએ, જે માણસની જેમ વિચારે છે, જે એકસાથે ઘણા કાર્યો કરે છે, તેમની વચ્ચે ઉપયોગી સિનર્જી બનાવે છે. આ માનવ જેવા મશીનોનું ટૂંકું નામ AGI છે, આર્ટિફિશિયલ જનરલ ઇન્ટેલિજન્સ. મોટાભાગના સંશોધકો માટે, એક કિમેરા જે સૈદ્ધાંતિક રીતે શક્ય છે પરંતુ જેના સુધી આપણે જલ્દી પહોંચીશું નહીં.

જો કે, આ ભેદ આજે ક્રીક થાય છે અને સમજાવવા માટે ઓછા અને ઓછા સરળ થવા લાગે છે. વાસ્તવમાં, તાજેતરના વર્ષોમાં સંશોધન એ AGI ની શોધ તરફ દોરી ગયા વિના, વધુને વધુ સામાન્યવાદી કૃત્રિમ બુદ્ધિમત્તા મોડલ બનાવવા તરફ આગળ વધ્યું છે. તેથી તે બનાવે છે એક પ્રકારનું મધ્યમ જમીન, જ્યાં આપણને એઆઈ મૉડલ મળે છે જે અલગ-અલગ પ્રકૃતિના અસંખ્ય કાર્યો કરવા સક્ષમ હોય છે, એટલા માટે કે તેઓને હવે "સંકુચિત" AI તરીકે વર્ણવી શકાય નહીં, પરંતુ જે તે જ સમયે તે કારણભૂત બુદ્ધિ અથવા જાગૃતિ બતાવતા નથી કે જેના માટે ઘણા નિષ્ણાતો એજીઆઈમાં સહજ હોવા જોઈએ.

મલ્ટિમોડલ AI

આપણે આ પ્રકારની કૃત્રિમ બુદ્ધિમત્તાને "સામાન્યવાદી" અથવા કદાચ વધુ યોગ્ય રીતે કહી શકીએ.મલ્ટીમોડલ”, કારણ કે તેની સાથે ક્રિયાપ્રતિક્રિયા કરવાની ઘણી રીતો છે. ઉદાહરણ આપવા માટે, મલ્ટિમોડલ AI સિસ્ટમ અમારા વિસ્તાર માટે હવામાનની આગાહી શોધી શકશે (શોધો અને શ્રેષ્ઠ પરિણામ પસંદ કરો), અમને જણાવો કે આજે વરસાદ પડશે (કુદરતી ભાષા પ્રક્રિયા અને ભાષણ સંશ્લેષણ) અને તપાસો કે અમે જઈ રહ્યા છીએ. છત્રી (મશીન વિઝન) સાથે અથવા વગર બહાર નીકળવું. તદુપરાંત, મલ્ટિમોડલ સિસ્ટમની મુખ્ય લાક્ષણિકતાઓમાંની એક એ છે કે વિવિધ પ્રકારના ડેટાને "ઇન્ગસ્ટિંગ" કરવું - ઉદાહરણ તરીકે છબીઓ અને ટેક્સ્ટ - બંનેમાંથી ઉપયોગી માહિતી કેવી રીતે દોરવી તે જાણવું. પરિણામે અમને એવું લાગશે કે અમે વાસ્તવિક બુદ્ધિમત્તા સાથે કામ કરી રહ્યા છીએ, વાસ્તવમાં ફક્ત બહુવિધ AI મૉડલ "બેટરી" અને એકબીજા સાથે સુમેળમાં મૂકવામાં આવ્યા છે.

ડીપમાઇન્ડ ઝૂ

મલ્ટિમોડલ AI તરફના સંશોધનના સંદર્ભમાં, તાજેતરના અઠવાડિયામાં લંડનની કંપની ડીપમાઇન્ડ, જે - અમને યાદ છે - તે ગેલેક્સીનો એક ભાગ છે. Google, એ બે AI સિસ્ટમ્સ બહાર પાડી છે જેણે પોતાના વિશે ઘણી ચર્ચા કરી છે. પ્રથમ કહેવામાં આવે છે ફ્લેમિંગો, અને "મલ્ટીમોડલ ટાસ્ક્સ" ઉકેલવામાં સક્ષમ મોડેલ છે, એટલે કે, એવા કાર્યો કે જેમાં વિવિધ મોડલિટીઝ, જેમ કે ઇમેજ, વિડિયો અને ટેક્સ્ટ, એકબીજા સાથે સંયોજનમાં પણ ઇનકમિંગ માહિતી આપવામાં આવી શકે છે. ફ્લેમિંગો એ વિઝ્યુઅલ લેંગ્વેજ મોડલ (VLM) છે જે વર્ગીકરણ માહિતી, કૅપ્શન મેનેજમેન્ટ, ઇમેજ-આધારિત પ્રશ્નના જવાબોને હેન્ડલ કરી શકે છે, જ્યારે માત્ર થોડા ઇનપુટ/આઉટપુટ નમૂનાઓ (કહેવાતા "ફુ-શોટ લર્નિંગ" ") પ્રદાન કરે છે.

મોડેલનો હેતુ કોઈ છબી અથવા વિડિયોની પરિસ્થિતિને "સમજવાનો" છે, તેની ભાષાકીય પ્રણાલી સાથે તેનું યોગ્ય રીતે વર્ણન કરવું અને તે જે "જુએ છે" તેને લગતા પ્રશ્નોના યોગ્ય જવાબ આપવાનો છે.

ઇનોવેશન ન્યૂઝલેટર
નવીનતા પરના સૌથી મહત્વપૂર્ણ સમાચારને ચૂકશો નહીં. તેમને ઇમેઇલ દ્વારા પ્રાપ્ત કરવા માટે સાઇન અપ કરો.

કનેક્ટિવિઝમ અને બુદ્ધિ?

આપેલ કાર્ય માટે ગેટો હંમેશા શ્રેષ્ઠ AI મોડેલ નથી. સોયર રોબોટનું નિયંત્રણ (તે ઘણા "સાંધા" સાથે હાથ ધરાવતો રોબોટ છે) એક સારા ધોરણનું છે, પરંતુ કૅપ્શન્સનું નિર્માણ માત્ર સામાન્ય છે, જ્યારે કેટલીક અટારી રમતોનું સંચાલન અન્ય સમર્પિત રમતો કરતા ઓછું છે. AI મોડલ્સ. ડીપમાઇન્ડ જણાવે છે કે 450 માંથી (604 ની સરખામણીમાં તેને તાલીમ આપવામાં આવી હતી) ગેટો માનવ નિષ્ણાતો કરતાં "અડધા કરતાં વધુ સમય" કરતાં વધુ સચોટ છે. કહેવાની થોડી ગૂંચવણભરી રીત કે કુલ 604 કાર્યોમાંથી, ઓછામાં ઓછા 154 ખૂબ જ ખરાબ પરિણામો આપે છે, જ્યારે બાકીના 450માં ગાટો માનવ નિષ્ણાત કરતાં વધુ સારી રીતે વર્તે છે, પરંતુ બીજા અડધા સમયમાં તે વર્તે છે. ખરાબ

સામાન્યીકરણનો માર્ગ

આ અઠવાડિયાના પરિણામો એ પ્રતિબદ્ધતાનું પરિણામ છે જે ડીપમાઇન્ડ ઘણા વર્ષોથી કરે છે. ચાલો ભૂલશો નહીં કે કંપનીનું ધ્યેય "બુદ્ધિની સમસ્યાનું નિરાકરણ" કરવાનો છે, વિવિધ સમસ્યાઓની વિશાળ શ્રેણીનો સામનો કરવા માટે સક્ષમ વધુ સામાન્ય સિસ્ટમ્સ વિકસાવવી. તેને કંપની આર્ટિફિશિયલ જનરલ ઈન્ટેલિજન્સ કહે છે અને તે જ તેઓ જવા માંગે છે. ગયા વર્ષે આ દિશામાં એક પગલું ભરવામાં આવ્યું હતું અનુભૂતિ કરનાર, ટ્રાન્સફોર્મર આર્કિટેક્ચર પર આધારિત મલ્ટિમોડલ મોડલ જે વિવિધ પ્રકારના ઇનપુટ્સ, જેમ કે છબીઓ, ટેક્સ્ટ, વિડિયો, સાઉન્ડ, 3D ડેટાને હેન્ડલ કરવામાં સક્ષમ છે. ગેટોના નિર્માતાઓ પોતે જ વિચારે છે કે પર્સીવર ભવિષ્યની સામાન્ય પ્રણાલીઓના મોડ્સની સંખ્યાને વધુ વિસ્તૃત કરવા માટે ઉપયોગી થઈ શકે છે.

ની પોસ્ટમાંથી કાઢવામાં આવેલ લેખ Luca Sambucci, જો તમે વાંચવા માંગતા હોઆખી પોસ્ટ અહીં ક્લિક કરો 


ઇનોવેશન ન્યૂઝલેટર
નવીનતા પરના સૌથી મહત્વપૂર્ણ સમાચારને ચૂકશો નહીં. તેમને ઇમેઇલ દ્વારા પ્રાપ્ત કરવા માટે સાઇન અપ કરો.

તાજેતરના લેખો

ભાવિ અહીં છે: શિપિંગ ઉદ્યોગ વૈશ્વિક અર્થતંત્રમાં કેવી રીતે ક્રાંતિ લાવી રહ્યો છે

નૌકાદળ ક્ષેત્ર એ સાચી વૈશ્વિક આર્થિક શક્તિ છે, જેણે 150 અબજના બજાર તરફ નેવિગેટ કર્યું છે...

1 મે 2024

પ્રકાશકો અને OpenAI આર્ટિફિશિયલ ઇન્ટેલિજન્સ દ્વારા પ્રક્રિયા કરાયેલ માહિતીના પ્રવાહને નિયંત્રિત કરવા માટે કરાર પર હસ્તાક્ષર કરે છે

ગયા સોમવારે, ફાઇનાન્શિયલ ટાઇમ્સે OpenAI સાથેના સોદાની જાહેરાત કરી હતી. FT તેના વિશ્વ કક્ષાના પત્રકારત્વને લાઇસન્સ આપે છે...

30 એપ્રિલ 2024

ઓનલાઈન ચુકવણીઓ: સ્ટ્રીમિંગ સેવાઓ તમને કાયમ માટે કેવી રીતે ચૂકવણી કરે છે તે અહીં છે

લાખો લોકો સ્ટ્રીમિંગ સેવાઓ માટે ચૂકવણી કરે છે, માસિક સબ્સ્ક્રિપ્શન ફી ચૂકવે છે. સામાન્ય અભિપ્રાય છે કે તમે…

29 એપ્રિલ 2024

Veeam રેન્સમવેર માટે સૌથી વધુ વ્યાપક સમર્થન આપે છે, સુરક્ષાથી લઈને પ્રતિસાદ અને પુનઃપ્રાપ્તિ સુધી

Veeam દ્વારા Coveware સાયબર ગેરવસૂલી ઘટના પ્રતિભાવ સેવાઓ પ્રદાન કરવાનું ચાલુ રાખશે. કોવવેર ફોરેન્સિક્સ અને ઉપચાર ક્ષમતાઓ પ્રદાન કરશે...

23 એપ્રિલ 2024

તમારી ભાષામાં ઇનોવેશન વાંચો

ઇનોવેશન ન્યૂઝલેટર
નવીનતા પરના સૌથી મહત્વપૂર્ણ સમાચારને ચૂકશો નહીં. તેમને ઇમેઇલ દ્વારા પ્રાપ્ત કરવા માટે સાઇન અપ કરો.

અમને અનુસરો