kompjuter

Gato, DeepMind dhe gara drejt inteligjencës artificiale të përgjithshme

Gato është një sistem i ri multimodal i AI nga DeepMind i aftë për të kryer qindra detyra të ndryshme duke përdorur gjithmonë të njëjtin rrjet nervor.

Ka nga ata që mendojnë se rruga për të inteligjencë artificiale e nivelit njerëzor tani është hartuar, tani do të ishte vetëm një çështje e rritjes së burimeve llogaritëse, ndërsa të tjerat po ngadalësohen sepse shumë kërkesa do të mungonin ende. Megjithatë, aftësia e jashtëzakonshme për të menaxhuar detyra shumë të ndryshme e bën Gato një sistem AI të ndryshëm nga të tjerët, i cili nëse nga njëra anë nuk është ende inteligjenca artificiale e përgjithshme që të gjithë presin, nga ana tjetër është ende një sistem inovativ për mënyrën se si i cili arrin të përpunojë të dhëna shumë të ndryshme nga e njëjta arkitekturë si deep learning.

Mbyllni AI dhe AI ​​të përgjithshme 

Deri më tani, një nga dallimet kryesore në botën komplekse të inteligjencës artificiale ka qenë dallimi midis AI-së së dobët, e quajtur gjithashtu AI "e ngushtë" dhe AI-së së fortë, e quajtur gjithashtu AI "e përgjithshme". Ishte një mënyrë mjaft e thjeshtë për të zgjidhur menjëherë çështjen e makinave të të menduarit. AI i ngushtë është lloji i inteligjencës artificiale që kryen vetëm një detyrë, të tilla si planifikimi i një rruge, sigurimi i rezultateve përkatëse të kërkimit ose kryerja e një bisede me shkrim. Inteligjenca artificiale e përgjithshme, nga ana tjetër, është lloji i inteligjencës artificiale që shohim në filma, e cila mendon si një qenie njerëzore, e cila kryen shumë detyra në të njëjtën kohë duke krijuar sinergji të dobishme mes tyre. Akronimi për këto makina të ngjashme me njeriun është AGI, Inteligjenca e Përgjithshme Artificiale. Për shumicën e studiuesve, një kimerë që është teorikisht e mundur, por që nuk do ta arrijmë së shpejti.

Megjithatë, ky dallim sot kërcitet dhe fillon të jetë gjithnjë e më pak i thjeshtë për t'u shpjeguar. Në fakt, në vitet e fundit kërkimet kanë shtyrë drejt krijimit të modeleve gjithnjë e më të përgjithshme të inteligjencës artificiale, pa çuar megjithatë në zbulimin e AGI. Prandaj është duke krijuar një lloj terreni i mesëm, ku gjejmë modele të AI që janë në gjendje të kryejnë detyra të shumta të një natyre të ndryshme, aq sa nuk mund të përshkruhen më si AI "e ngushtë", por që në të njëjtën kohë nuk tregojnë atë inteligjencën shkakësore apo ndërgjegjësimin që për shumë ekspertë duhet të jenë të natyrshëm në një AGI.

AI multimodale

Ne mund ta quajmë këtë lloj inteligjence artificiale "përgjithshme" ose ndoshta më saktë "multimodal”, Pasi ka disa mënyra për të bashkëvepruar me të. Për të dhënë një shembull, një sistem multimodal i AI do të jetë në gjendje të gjejë parashikimin e motit për zonën tonë (kërkoni dhe zgjidhni rezultatin më të mirë), na tregoni se do të bjerë shi sot (përpunimi i gjuhës natyrore dhe sinteza e të folurit) dhe kontrolloni nëse do të shkojmë jashtë me ose pa ombrellë (pamje me makinë). Për më tepër, një nga karakteristikat kryesore të një sistemi multimodal është ai i "gëlltitjes" së të dhënave të llojeve të ndryshme - për shembull imazhe dhe tekst - duke ditur se si të nxjerrë informacione të dobishme nga të dyja. Si rezultat do të na duket se kemi të bëjmë me një inteligjencë të vërtetë, në realitet ka vetëm modele të shumta të AI të vendosura “në bateri” dhe në sinergji me njëri-tjetrin.

Kopshti Zoologjik DeepMind

Për sa i përket kërkimit në drejtim të AI multimodale, javët e fundit kompania londineze DeepMind, e cila - kujtojmë - është pjesë e galaktikës së Google, ka lëshuar dy sisteme të AI që kanë bërë shumë përfolje për veten e tyre. E para quhet zog flamingo, dhe është një model i aftë për të zgjidhur “detyra multimodale”, pra detyra që mund të kenë informacione hyrëse të përcjella përmes modaliteteve të ndryshme, si imazhe, video dhe tekst, edhe në kombinim me njëra-tjetrën. Flamingo është një model gjuhësor vizual (VLM) që mund të trajtojë informacionin e klasifikimit, menaxhimin e titrave, përgjigjet e pyetjeve të bazuara në imazhe, të gjitha duke ofruar vetëm disa mostra hyrëse/dalëse (të ashtuquajturat "të mësuarit me disa fotografi" ").

Qëllimi i modelit është të "kuptojë" situatën e një imazhi ose videoje, duke e përshkruar atë saktë me sistemin e tij gjuhësor dhe duke iu përgjigjur saktë pyetjeve në lidhje me atë që "sheh".

Buletini i inovacionit
Mos humbisni lajmet më të rëndësishme mbi inovacionin. Regjistrohuni për t'i marrë ato me email.

Konektivizmi dhe inteligjenca?

Gato nuk është gjithmonë modeli më i mirë i AI për një detyrë të caktuar. Kontrolli i një roboti Sawyer (është një robot i përbërë nga një krah me shumë "nyje") është i një standardi të mirë, por krijimi i titrave është vetëm mediokër, ndërsa trajtimi i disa lojërave Atari është më pak se ai i të tjerave të dedikuara Modelet e AI. DeepMind thotë se nga 450 detyra (krahasuar me 604 për të cilat ai ishte trajnuar) Gato është më i saktë se ekspertët njerëzorë "më shumë se gjysmën e kohës". Një mënyrë disi e ndërlikuar për të thënë se nga gjithsej 604 detyra, të paktën 154 japin rezultate shumë të dobëta, ndërsa në 450 të tjerat një gjysmë të mirë të kohës Gato sillet më mirë se një ekspert njerëzor, por gjysmën tjetër të kohës sillet. më keq.

Rruga drejt përgjithësimit

Rezultatet e këtyre javëve janë rezultat i një angazhimi që DeepMind e ka kryer prej shumë vitesh. Të mos harrojmë se qëllimi i kompanisë është të “zgjidhë problemin e inteligjencës”, duke zhvilluar sisteme gjithnjë e më të përgjithshme të aftë për të trajtuar një gamë të gjerë problemesh të ndryshme. Kjo është ajo që kompania e quan Inteligjenca e Përgjithshme Artificiale, dhe ja ku ata duan të shkojnë. Vitin e kaluar është bërë një hap në këtë drejtim Perceptues, një model multimodal i bazuar në arkitekturën Transformer, i aftë për të trajtuar lloje të ndryshme hyrjesh, si imazhe, tekst, video, zë, të dhëna 3D. Vetë krijuesit e Gato mendojnë se Perceiver mund të jetë i dobishëm për zgjerimin e mëtejshëm të numrit të mënyrave të sistemeve të përgjithshme të ardhshme.

Artikull i nxjerrë nga Postimi i Luca Sambucci, nëse doni të lexonii gjithë postimi kliko këtu 


Buletini i inovacionit
Mos humbisni lajmet më të rëndësishme mbi inovacionin. Regjistrohuni për t'i marrë ato me email.

Artikujt e fundit

E ardhmja është këtu: Si industria e transportit po revolucionarizon ekonominë globale

Sektori detar është një fuqi e vërtetë ekonomike globale, e cila ka lundruar drejt një tregu prej 150 miliardë...

1 Maj 2024

Botuesit dhe OpenAI nënshkruajnë marrëveshje për të rregulluar rrjedhën e informacionit të përpunuar nga Inteligjenca Artificiale

Të hënën e kaluar, Financial Times njoftoi një marrëveshje me OpenAI. FT licencon gazetarinë e saj të klasit botëror…

30 Prill 2024

Pagesat në internet: Ja se si shërbimet e transmetimit ju bëjnë të paguani përgjithmonë

Miliona njerëz paguajnë për shërbimet e transmetimit, duke paguar tarifat mujore të abonimit. Është e zakonshme që ju…

29 Prill 2024

Veeam përmban mbështetjen më të plotë për ransomware, nga mbrojtja te përgjigja dhe rikuperimi

Coveware nga Veeam do të vazhdojë të ofrojë shërbime të reagimit ndaj incidenteve të zhvatjes kibernetike. Coveware do të ofrojë aftësi mjeko-ligjore dhe riparimi…

23 Prill 2024