компьютер

Гато, DeepMind және жалпы жасанды интеллектке жарыс

Gato - әрқашан бірдей нейрондық желіні пайдаланып жүздеген әртүрлі тапсырмаларды орындауға қабілетті DeepMind ұсынған жаңа мультимодальды AI жүйесі.

Жол деп ойлайтындар бар адам деңгейіндегі жасанды интеллект қазір картаға түсірілген, енді бұл жай ғана есептеу ресурстарын ұлғайту мәселесі болар еді, ал басқалары баяулайды, өйткені көптеген талаптар әлі де жетіспейді. Дегенмен, өте әртүрлі тапсырмаларды басқарудың ерекше қабілеті Гатоны басқалардан ерекшелендіретін AI жүйесін жасайды, егер ол бір жағынан бәрі күтетін жалпы жасанды интеллект болмаса, екінші жағынан ол әлі де инновациялық жүйе болып табылады. сияқты бір архитектурадан өте әртүрлі деректерді өңдеуді басқарады deep learning.

AI және жалпы AI жабыңыз 

Осы уақытқа дейін жасанды интеллекттің күрделі әлеміндегі басты айырмашылықтардың бірі «тар» АИ деп аталатын әлсіз AI мен «жалпы» AI деп аталатын күшті AI арасындағы айырмашылық болды. Бұл ойлау машиналары туралы мәселені бірден шешудің қарапайым тәсілі болды. Тар AI – маршрутты жоспарлау, сәйкес іздеу нәтижелерін беру немесе жазбаша сөйлесу сияқты бір ғана тапсырманы орындайтын жасанды интеллект түрі. Жалпы жасанды интеллект, керісінше, фильмдерден көретін, адам сияқты ойлайтын, көптеген тапсырмаларды қатар орындап, олардың арасында пайдалы синергия тудыратын жасанды интеллект түрі. Бұл адамға ұқсас машиналардың аббревиатурасы AGI, Жасанды жалпы интеллект. Көптеген зерттеушілер үшін теориялық тұрғыдан мүмкін, бірақ біз жақын арада қол жеткізе алмайтын химера.

Дегенмен, бүгінгі күні бұл айырмашылықты түсіндіру қиынға соғады және барған сайын қарапайым бола бастайды. Шындығында, соңғы жылдары зерттеулер AGI ашылуына әкелмей-ақ, жасанды интеллекттің жалпылама үлгілерін жасауға итермеледі. Сондықтан ол жасайды ортаңғы жердің бір түрі, мұнда біз әртүрлі сипаттағы көптеген тапсырмаларды орындауға қабілетті AI үлгілерін табамыз, сондықтан оларды бұдан былай «тар» AI ретінде сипаттауға болмайды, бірақ сонымен бірге олар себептік интеллект пен сананы көрсетпейді. көптеген сарапшылар AGI-ге тән болуы керек.

Көпмодальды AI

Біз жасанды интеллекттің бұл түрін «генералист» немесе дұрысырақ деп атауға болады».мультимодальды”, Өйткені онымен әрекеттесудің бірнеше жолы бар. Мысал келтіретін болсақ, мультимодальды AI жүйесі біздің аудан үшін ауа райы болжамын таба алады (іздеу және ең жақсы нәтижені таңдау), бүгін жаңбыр жауатынын айту (табиғи тілді өңдеу және сөйлеу синтезі) және баратынымызды тексеру қолшатырмен немесе қолшатырсыз (машинамен көру). Сонымен қатар, мультимодальды жүйенің негізгі сипаттамаларының бірі әртүрлі типтегі деректерді – мысалы, суреттер мен мәтінді – екеуінен де пайдалы ақпаратты алу жолын білу болып табылады. Нәтижесінде біз нағыз интеллектпен айналысып жатқандай болып көрінеміз, іс жүзінде «батареяға» орнатылған және бір-бірімен синергетикаға ие бірнеше AI модельдері бар.

DeepMind хайуанаттар бағы

Мультимодальді AI бойынша зерттеулерге келетін болсақ, соңғы апталарда лондондық DeepMind компаниясы, біздің есімізде - галактиканың бөлігі болып табылады. Google, өздері туралы көп әңгіме тудырған екі AI жүйесін шығарды. Біріншісі деп аталады Фламинго, және «көп модальды тапсырмаларды» шешуге қабілетті модель, яғни суреттер, бейне және мәтін сияқты әртүрлі модальділіктер арқылы жеткізілетін кіріс ақпараты болуы мүмкін тапсырмаларды, тіпті бір-бірімен үйлесімде де. Flamingo – бұл бірнеше енгізу/шығару үлгілерін («бірнеше рет оқу» деп аталатын) қамтамасыз ете отырып, жіктеу ақпаратын, тақырыпты басқаруды, суретке негізделген сұрақ жауаптарын өңдей алатын визуалды тіл үлгісі (VLM).

Модельдің мақсаты – бейненің немесе бейненің жағдайын «түсіну», оның тілдік жүйесімен дұрыс сипаттау және «көретініне» қатысты сұрақтарға дұрыс жауап беру.

Инновациялық ақпараттық бюллетень
Инновация туралы ең маңызды жаңалықтарды жіберіп алмаңыз. Оларды электрондық пошта арқылы алу үшін тіркеліңіз.

Коннективизм және интеллект?

Гато әрқашан берілген тапсырма үшін ең жақсы AI моделі бола бермейді. Sawyer роботын басқару (бұл көптеген «буындары» бар қолынан тұратын робот) жақсы стандартқа ие, бірақ жазуларды жасау орташа ғана, ал кейбір Atari ойындарын өңдеу басқаларға арналған басқаларға қарағанда аз. AI үлгілері. DeepMind 450 тапсырманың ішінде (ол оқытылған 604 тапсырмамен салыстырғанда) Гато адам сарапшыларынан «жартысынан көп уақыт» дәлірек екенін айтады. Жалпы 604 тапсырманың кем дегенде 154-і өте нашар нәтиже береді деп айтудың біршама күрделі тәсілі, ал қалған 450-де уақыттың жақсы жартысы Гато адам сарапшысынан жақсырақ әрекет етеді, бірақ уақыттың басқа жартысы өзін ұстайды. нашар.

Жалпылауға жол

Осы апталардың нәтижелері DeepMind көптеген жылдар бойы орындап келе жатқан міндеттеменің нәтижесі болып табылады. Компанияның мақсаты әртүрлі мәселелердің кең ауқымын шешуге қабілетті барған сайын жалпы жүйелерді әзірлеу «интеллект мәселесін шешу» екенін ұмытпайық. Бұл компания жасанды жалпы интеллект деп атайды және олар сол жерге барғысы келеді. Өткен жылы бұл бағытта бір қадам жасалды Қабылдаушы, кескіндер, мәтін, бейне, дыбыс, 3D деректері сияқты кірістердің әртүрлі түрлерін өңдеуге қабілетті Transformer архитектурасына негізделген мультимодальды модель. Гато жасаушылардың өздері Perceiver болашақ жалпы жүйелердің режимдерінің санын одан әрі кеңейту үшін пайдалы болуы мүмкін деп санайды.

Посттан алынған мақала Luca Sambucci, оқығыңыз келсебүкіл пост осында басыңыз 


Инновациялық ақпараттық бюллетень
Инновация туралы ең маңызды жаңалықтарды жіберіп алмаңыз. Оларды электрондық пошта арқылы алу үшін тіркеліңіз.

Соңғы мақалалар

Катания емханасындағы Apple көрушісімен толықтырылған шындыққа инновациялық араласу

Apple Vision Pro коммерциялық көру құралын пайдаланып офтальмопластика операциясы Катания емханасында жасалды…

3 Мамыр 2024

Балаларға арналған беттерді бояудың пайдасы - барлық жастағы адамдарға арналған сиқырлы әлем

Ұсақ моториканы бояу арқылы дамыту балаларды жазу сияқты күрделі дағдыларға дайындайды. Бояу үшін…

2 Мамыр 2024

Болашақ осында: кеме қатынасы саласы жаһандық экономиканы қалай өзгертеді

Әскери-теңіз секторы 150 миллиардтық нарыққа бет алған нағыз жаһандық экономикалық держава болып табылады...

1 Мамыр 2024

Баспагерлер мен OpenAI жасанды интеллект өңдейтін ақпарат ағынын реттеу үшін келісімдерге қол қояды.

Өткен дүйсенбіде Financial Times OpenAI-мен келісім туралы жариялады. FT өзінің әлемдік деңгейдегі журналистикасына лицензия береді…

30 Сәуір 2024

Инновацияны өз тіліңізде оқыңыз

Инновациялық ақпараттық бюллетень
Инновация туралы ең маңызды жаңалықтарды жіберіп алмаңыз. Оларды электрондық пошта арқылы алу үшін тіркеліңіз.

Артымыздан