kompjuter

Gato, DeepMind u t-tellieqa lejn intelliġenza artifiċjali ġenerali

Gato hija sistema AI multimodali ġdida minn DeepMind kapaċi twettaq mijiet ta’ kompiti differenti dejjem billi tuża l-istess netwerk newrali.

Hemm min jaħseb li l-mod biex intelliġenza artifiċjali fil-livell tal-bniedem issa huwa mfassal, issa tkun biss kwistjoni li jiżdiedu r-riżorsi komputazzjonali, filwaqt li oħrajn qed jonqsu minħabba li ħafna rekwiżiti xorta jkunu neqsin. Madankollu, l-abbiltà straordinarja li jamministra ħidmiet differenti ħafna tagħmel lil Gato sistema AI differenti mill-oħrajn, li jekk minn naħa għadha mhix l-intelliġenza artifiċjali ġenerali li kulħadd jistenna, min-naħa l-oħra għadha sistema innovattiva għall-mod kif li jirnexxielu jipproċessa data differenti ħafna mill-istess arkitettura bħal deep learning.

Agħlaq AI u AI ġenerali 

S'issa waħda mid-distinzjonijiet ewlenin fid-dinja kumplessa tal-intelliġenza artifiċjali kienet id-differenza bejn AI dgħajfa, imsejħa wkoll AI "dejqa", u AI qawwija, imsejħa wkoll AI "ġenerali". Kien mod pjuttost sempliċi biex tissolva l-kwistjoni tal-magni tal-ħsieb minnufih. Narrow AI hija t-tip ta 'intelliġenza artifiċjali li twettaq kompitu wieħed biss, bħall-ippjanar ta' rotta, li tipprovdi riżultati ta 'tfittxija rilevanti, jew li jkollha konversazzjoni bil-miktub. L-AI ġenerali, min-naħa l-oħra, hija t-tip ta 'intelliġenza artifiċjali li naraw fil-films, li taħseb bħal bniedem, li twettaq ħafna kompiti fl-istess ħin, u toħloq sinerġiji utli bejniethom. L-akronimu għal dawn il-magni bħall-bniedem huwa AGI, Intelliġenza Ġenerali artifiċjali. Għall-biċċa l-kbira tar-riċerkaturi, kimera li teoretikament hija possibbli iżda li mhux se nilħquha dalwaqt.

Madankollu, din id-distinzjoni llum tfarrak u tibda tkun dejjem inqas sempliċi biex tispjega. Fil-fatt, f’dawn l-aħħar snin ir-riċerka mbuttat lejn il-ħolqien ta’ mudelli ta’ intelliġenza artifiċjali dejjem aktar ġeneralisti, mingħajr madankollu ma wasslet għall-iskoperta tal-AGI. Għalhekk qed toħloq tip ta’ triq tan-nofs, fejn insibu mudelli ta’ AI li kapaċi jwettqu bosta kompiti ta’ natura differenti, tant li ma jistgħux jibqgħu deskritti bħala AI “dejqa”, iżda li fl-istess ħin ma jurux dik l-intelliġenza kawżali jew l-għarfien li għal ħafna esperti għandhom ikunu inerenti f'AGI.

AI multimodali

Nistgħu nsejħu dan it-tip ta 'intelliġenza artifiċjali "ġenerali" jew forsi b'mod aktar korrett "multimodali”, Peress li hemm diversi modi kif jinteraġixxu magħha. Biex nagħtu eżempju, sistema AI multimodali tkun kapaċi ssib it-tbassir tat-temp għaż-żona tagħna (fittxu u agħżel l-aħjar riżultat), tgħidilna li llum ser ix-xita (ipproċessar tal-lingwa naturali u sinteżi tad-diskors) u tivverifika jekk hux sejrin barra bi jew mingħajr umbrella (machine vision). Barra minn hekk, waħda mill-karatteristiċi ewlenin ta' sistema multimodali hija dik li "tidaħħal" data ta' tipi differenti - pereżempju stampi u test - li tkun taf kif tiġbed informazzjoni utli mit-tnejn. Bħala riżultat jidher lilna li qed nittrattaw ma 'intelliġenza reali, fir-realtà hemm biss mudelli multipli ta' AI mqiegħda "f'batterija" u f'sinerġija ma 'xulxin.

Iż-Żoo DeepMind

Fir-rigward tar-riċerka lejn AI multimodali, fl-aħħar ġimgħat il-kumpanija ta’ Londra DeepMind, li - niftakru - hija parti mill-galaxie ta’ Google, ħarġet żewġ sistemi AI li tkellmu ħafna dwarhom infushom. L-ewwel jissejjaħ Flamingo, u huwa mudell li kapaċi jsolvi “ħidmiet multimodali”, jiġifieri, kompiti li jista’ jkollhom informazzjoni deħlin imwassla permezz ta’ modalitajiet differenti, bħal immaġini, vidjow u test, anki flimkien ma’ xulxin. Flamingo huwa mudell tal-lingwa viżwali (VLM) li jista 'jimmaniġġja informazzjoni ta' klassifikazzjoni, ġestjoni ta 'caption, tweġibiet ta' mistoqsijiet ibbażati fuq immaġini, kollha filwaqt li jipprovdu biss ftit kampjuni ta 'input / output (l-hekk imsejjaħ "tagħlim ta' ftit sparatura" ").

L-għan tal-mudell huwa li "tifhem" is-sitwazzjoni ta 'immaġni jew vidjo, jiddeskriviha b'mod korrett bis-sistema lingwistika tiegħu u jwieġeb b'mod korrett mistoqsijiet relatati ma' dak li "jara".

Newsletter dwar l-innovazzjoni
Titlifx l-aktar aħbarijiet importanti dwar l-innovazzjoni. Irreġistra biex tirċevihom bl-email.

Konnettiviżmu u intelliġenza?

Gato mhux dejjem huwa l-aħjar mudell AI għal biċċa xogħol partikolari. Il-kontroll ta 'robot Sawyer (huwa robot li jikkonsisti f'driegħ b'ħafna "ġonot") huwa ta' standard tajjeb, iżda l-ħolqien ta 'captions huwa biss medjokri, filwaqt li l-immaniġġjar ta' xi logħob Atari huwa inqas minn dak ta 'oħrajn iddedikat. Mudelli AI. DeepMind jiddikjara li minn 450 biċċa xogħol (meta mqabbla mas-604 li kien imħarreġ fuqhom) Gato huwa aktar preċiż mill-esperti umani "aktar minn nofs il-ħin". Mod kemmxejn ikkonvolut kif tgħid li minn total ta’ 604 biċċa xogħol, mill-inqas 154 jagħtu riżultati ħżiena ħafna, filwaqt li fl-450 li jifdal nofs tajjeb tal-ħin Gato iġib ruħu aħjar minn espert uman, iżda nofs il-ħin iġib ruħu agħar.

It-triq għall-ġeneralizzazzjoni

Ir-riżultati ta’ dawn il-ġimgħat huma r-riżultat ta’ impenn li DeepMind ilha twettaq għal bosta snin. Ma ninsewx li l-għan tal-kumpanija huwa li "issolvi l-problema tal-intelliġenza", tiżviluppa sistemi dejjem aktar ġenerali li kapaċi jindirizzaw firxa wiesgħa ta 'problemi differenti. Dak hu li l-kumpanija ssejjaħ Intelliġenza ġenerali artifiċjali, u hemmhekk iridu jmorru. Is-sena li għaddiet sar pass f’din id-direzzjoni bihom Perċevitur, mudell multimodali bbażat fuq l-arkitettura tat-Transformer li kapaċi timmaniġġja tipi differenti ta 'inputs, bħal immaġini, test, vidjo, ħoss, data 3D. Il-ħallieqa tal-Gato nfushom jaħsbu li Perceiver jista 'jkun utli biex ikompli jespandi n-numru ta' modi ta 'sistemi ġenerali futuri.

Artiklu estratt mill-Post of Luca Sambucci, jekk trid taqra l-post kollu ikklikkja hawn 


Newsletter dwar l-innovazzjoni
Titlifx l-aktar aħbarijiet importanti dwar l-innovazzjoni. Irreġistra biex tirċevihom bl-email.

Artikoli riċenti

Il-pubblikaturi u l-OpenAI jiffirmaw ftehimiet biex jirregolaw il-fluss tal-informazzjoni pproċessata mill-Intelliġenza Artifiċjali

It-Tnejn li għadda, il-Financial Times ħabbret ftehim mal-OpenAI. FT tagħti liċenzja għall-ġurnaliżmu ta’ klassi dinjija tagħha...

April 30 2024

Ħlasijiet Online: Hawn Kif Is-Servizzi ta' Streaming Jagħmel Inti Tħallas Għal Dejjem

Miljuni ta 'nies iħallsu għal servizzi ta' streaming, iħallsu miżati ta 'abbonament ta' kull xahar. Hija opinjoni komuni li inti...

April 29 2024

Veeam għandu l-aktar appoġġ komprensiv għar-ransomware, mill-protezzjoni għar-rispons u l-irkupru

Coveware minn Veeam se jkompli jipprovdi servizzi ta' rispons għal inċidenti ta' estorsjoni ċibernetika. Coveware se joffri forensiċi u kapaċitajiet ta' rimedju...

April 23 2024

Rivoluzzjoni Ekoloġika u Diġitali: Kif il-Manutenzjoni Predittiva qed tittrasforma l-Industrija taż-Żejt u l-Gass

Il-manutenzjoni ta’ tbassir qed tirrivoluzzjona s-settur taż-żejt u l-gass, b’approċċ innovattiv u proattiv għall-ġestjoni tal-impjant...

April 22 2024