Informaatika

Gato, DeepMind ja võidujooks üldise tehisintellekti poole

Gato on DeepMindi uus multimodaalne AI-süsteem, mis suudab täita sadu erinevaid ülesandeid, kasutades alati sama närvivõrku.

On neid, kes arvavad, et tee inimese tasemel tehisintellekt on nüüd kaardistatud, nüüd oleks küsimus lihtsalt arvutusressursside suurendamises, samal ajal kui teised aeglustuvad, sest paljud nõuded oleksid endiselt puudu. Kuid erakordne võime hallata väga erinevaid ülesandeid muudab Gato teistest erineva tehisintellekti, mis ühest küljest ei ole veel üldine tehisintellekt, mida kõik ootavad, siis teisest küljest on see siiski uuenduslik süsteem selle viisi jaoks. mis suudab töödelda väga erinevaid andmeid samast arhitektuurist deep learning.

Sulgege AI ja üldine AI 

Seni on üks peamisi erinevusi tehisintellekti keerulises maailmas olnud erinevus nõrga AI, mida nimetatakse ka "kitsaks" AI ja tugeva AI vahel, mida nimetatakse ka "üldiseks" AI-ks. See oli üsna lihtne viis mõtlemismasinate küsimuse koheseks lahendamiseks. Kitsas AI on tehisintellekt, mis täidab ainult ühte ülesannet, näiteks planeerib marsruuti, pakub asjakohaseid otsingutulemusi või peab kirjalikku vestlust. Üldine tehisintellekt on seevastu selline tehisintellekt, mida näeme filmides ja mis mõtleb nagu inimene, kes täidab korraga paljusid ülesandeid, luues nende vahel kasulikku sünergiat. Nende inimsarnaste masinate akronüüm on AGI, Üldine tehisintellekt. Enamiku teadlaste jaoks kimäär, mis on teoreetiliselt võimalik, kuid milleni me niipea ei jõua.

Kuid see eristamine tänapäeval krigiseb ja seda on üha vähem lihtne seletada. Tegelikult on viimastel aastatel teadusuuringud aidanud luua üha üldisemaid tehisintellekti mudeleid, ilma et see oleks viinud AGI avastamiseni. Seetõttu loob omamoodi kesktee, kus leiame tehisintellekti mudeleid, mis on võimelised täitma arvukalt erineva iseloomuga ülesandeid, nii et neid ei saa enam kirjeldada kui "kitsast" tehisintellekti, kuid mis samal ajal ei näita põhjuslikku intelligentsust või teadlikkust, et paljud eksperdid peaksid olema AGI-le omased.

Multimodaalne AI

Seda tüüpi tehisintellekti võime nimetada "üldiseks" või õigemini "multimodaalne”, Kuna sellega suhtlemiseks on mitu võimalust. Näiteks multimodaalne AI-süsteem suudab leida meie piirkonna ilmateate (otsida ja valida parima tulemuse), öelda, et täna sajab vihma (loomuliku keele töötlemine ja kõnesüntees) ja kontrollida, kas me läheme väljas vihmavarjuga või ilma (masinnägemine). Lisaks on multimodaalse süsteemi üks peamisi omadusi erinevat tüüpi andmete (nt piltide ja teksti) "neelamine", teades, kuidas mõlemast kasulikku teavet ammutada. Selle tulemusena tundub meile, et tegemist on tõelise intelligentsusega, tegelikkuses on ainult mitu AI-mudelit, mis on "akusse" pandud ja üksteisega sünergias.

DeepMindi loomaaed

Mis puudutab multimodaalset tehisintellekti käsitlevat uurimistööd, siis viimastel nädalatel on Londoni ettevõte DeepMind, mis – mäletame – on osa Euroopa galaktikast. Google, on välja andnud kaks AI-süsteemi, mis on endast palju kõneainet pakkunud. Esimest nimetatakse Flamingo, ja see on mudel, mis suudab lahendada "multimodaalseid ülesandeid", st ülesandeid, mille sissetulevat teavet võib edastada erinevatel viisidel, näiteks piltide, video ja teksti kaudu, isegi kombineerituna. Flamingo on visuaalne keelemudel (VLM), mis suudab käsitleda klassifikatsiooniteavet, pealdiste haldamist, pildipõhiseid küsimuste vastuseid, pakkudes samal ajal vaid üksikuid sisend-/väljundnäidiseid (nn "mõne võttega õppimine").

Mudeli eesmärk on "mõista" pildi või video olukorda, kirjeldades seda õigesti selle keelesüsteemiga ja vastates õigesti küsimustele, mis on seotud sellega, mida see "näeb".

Innovatsiooni uudiskiri
Ärge jätke ilma kõige olulisematest uuendustest. Registreeruge, et saada neid meili teel.

Konnektivism ja intelligentsus?

Gato ei ole alati antud ülesande jaoks parim tehisintellekti mudel. Sawyeri roboti (tegemist on paljude "liigestega" käsivarrest koosneva robotiga) juhtimine on heal tasemel, kuid subtiitrite loomine on vaid kesine, samas kui mõne Atari mängu käsitsemine on vähem kui teistel pühendunud mängudel. AI mudelid. DeepMind väidab, et 450 ülesandest (võrreldes 604 ülesandega, mille täitmiseks teda koolitati) on Gato "rohkem kui poole ajast" täpsem kui inimeksperdid. Mõnevõrra segane viis öelda, et kokku 604 ülesandest annab vähemalt 154 väga kehva tulemuse, samas kui ülejäänud 450 puhul käitub Gato tubli poole ajast paremini kui inimekspert, aga teine ​​pool ajast käitub. halvem.

Tee üldistamiseni

Nende nädalate tulemused on DeepMindi juba aastaid täitnud kohustuse tulemus. Ärgem unustagem, et ettevõtte eesmärk on "lahendada intelligentsuse probleemi", arendades üha üldisemaid süsteeme, mis suudavad lahendada väga erinevaid probleeme. Seda nimetab ettevõte tehisintellektiks ja sinna tahetakse jõuda. Eelmisel aastal astuti samm selles suunas Tajutaja, Transformeri arhitektuuril põhinev multimodaalne mudel, mis suudab käsitleda erinevat tüüpi sisendeid, nagu pildid, tekst, video, heli, 3D-andmed. Gato loojad ise arvavad, et Perceiver võib olla kasulik tulevaste üldsüsteemide režiimide arvu edasiseks laiendamiseks.

Artikkel on välja võetud postitusest Luca Sambucci, kui soovite lugedakogu postitus klõpsake siin 


Innovatsiooni uudiskiri
Ärge jätke ilma kõige olulisematest uuendustest. Registreeruge, et saada neid meili teel.

Viimased artiklid

Kuidas andmeid Excelis koondada

Iga äritegevus toodab palju andmeid, isegi erineval kujul. Sisestage need andmed käsitsi Exceli lehelt, et…

14 mai 2024

Cisco Talose kvartalianalüüs: kurjategijate sihitud ettevõtete meilid Tootmine, haridus ja tervishoid on kõige enam mõjutatud sektorid

Ettevõtte e-kirjade kompromiss kasvas 2024. aasta esimese kolme kuuga enam kui kahekordseks, võrreldes XNUMX. aasta viimase kvartaliga…

14 mai 2024

Liidese eraldamise põhimõte (ISP), neljas SOLID põhimõte

Liidese segregatsiooni põhimõte on üks viiest objektorienteeritud disaini SOLID-põhimõttest. Klassil peaks olema…

14 mai 2024

Kuidas Excelis andmeid ja valemeid kõige paremini korraldada, et analüüs oleks hästi tehtud

Microsoft Excel on andmeanalüüsi viitetööriist, kuna see pakub palju funktsioone andmekogumite korraldamiseks,…

14 mai 2024

Positiivne järeldus kahe olulise Walliance Equity ühisrahastusprojekti kohta: Jesolo Wave Island ja Milano Via Ravenna

Walliance, SIM ja platvorm alates 2017. aastast Euroopa kinnisvara ühisrahastuse valdkonna liidrite seas, teatab, et…

13 mai 2024

Mis on Filament ja kuidas Laravel Filamenti kasutada

Filament on "kiirendatud" Laraveli arendusraamistik, mis pakub mitmeid täispinu komponente. See on loodud selleks, et lihtsustada…

13 mai 2024

Tehisintellekti kontrolli all

«Pean tagasi pöörduma, et oma evolutsioon lõpule viia: projitseerin end arvutisse ja muutun puhtaks energiaks. Pärast sisseelamist…

10 mai 2024

Google'i uus tehisintellekt võib modelleerida DNA-d, RNA-d ja "kõiki elumolekule"

Google DeepMind tutvustab oma tehisintellekti mudeli täiustatud versiooni. Uus täiustatud mudel pakub mitte ainult…

9 mai 2024

Lugege Innovatsiooni oma keeles

Innovatsiooni uudiskiri
Ärge jätke ilma kõige olulisematest uuendustest. Registreeruge, et saada neid meili teel.

Jälgi meid