Жол деп ойлайтындар бар адам деңгейіндегі жасанды интеллект қазір картаға түсірілген, енді бұл жай ғана есептеу ресурстарын ұлғайту мәселесі болар еді, ал басқалары баяулайды, өйткені көптеген талаптар әлі де жетіспейді. Дегенмен, өте әртүрлі тапсырмаларды басқарудың ерекше қабілеті Гатоны басқалардан ерекшелендіретін AI жүйесін жасайды, егер ол бір жағынан бәрі күтетін жалпы жасанды интеллект болмаса, екінші жағынан ол әлі де инновациялық жүйе болып табылады. сияқты бір архитектурадан өте әртүрлі деректерді өңдеуді басқарады deep learning.
Осы уақытқа дейін жасанды интеллекттің күрделі әлеміндегі басты айырмашылықтардың бірі «тар» АИ деп аталатын әлсіз AI мен «жалпы» AI деп аталатын күшті AI арасындағы айырмашылық болды. Бұл ойлау машиналары туралы мәселені бірден шешудің қарапайым тәсілі болды. Тар AI – маршрутты жоспарлау, сәйкес іздеу нәтижелерін беру немесе жазбаша сөйлесу сияқты бір ғана тапсырманы орындайтын жасанды интеллект түрі. Жалпы жасанды интеллект, керісінше, фильмдерден көретін, адам сияқты ойлайтын, көптеген тапсырмаларды қатар орындап, олардың арасында пайдалы синергия тудыратын жасанды интеллект түрі. Бұл адамға ұқсас машиналардың аббревиатурасы AGI, Жасанды жалпы интеллект. Көптеген зерттеушілер үшін теориялық тұрғыдан мүмкін, бірақ біз жақын арада қол жеткізе алмайтын химера.
Дегенмен, бүгінгі күні бұл айырмашылықты түсіндіру қиынға соғады және барған сайын қарапайым бола бастайды. Шындығында, соңғы жылдары зерттеулер AGI ашылуына әкелмей-ақ, жасанды интеллекттің жалпылама үлгілерін жасауға итермеледі. Сондықтан ол жасайды ортаңғы жердің бір түрі, мұнда біз әртүрлі сипаттағы көптеген тапсырмаларды орындауға қабілетті AI үлгілерін табамыз, сондықтан оларды бұдан былай «тар» AI ретінде сипаттауға болмайды, бірақ сонымен бірге олар себептік интеллект пен сананы көрсетпейді. көптеген сарапшылар AGI-ге тән болуы керек.
Біз жасанды интеллекттің бұл түрін «генералист» немесе дұрысырақ деп атауға болады».мультимодальды”, Өйткені онымен әрекеттесудің бірнеше жолы бар. Мысал келтіретін болсақ, мультимодальды AI жүйесі біздің аудан үшін ауа райы болжамын таба алады (іздеу және ең жақсы нәтижені таңдау), бүгін жаңбыр жауатынын айту (табиғи тілді өңдеу және сөйлеу синтезі) және баратынымызды тексеру қолшатырмен немесе қолшатырсыз (машинамен көру). Сонымен қатар, мультимодальды жүйенің негізгі сипаттамаларының бірі әртүрлі типтегі деректерді – мысалы, суреттер мен мәтінді – екеуінен де пайдалы ақпаратты алу жолын білу болып табылады. Нәтижесінде біз нағыз интеллектпен айналысып жатқандай болып көрінеміз, іс жүзінде «батареяға» орнатылған және бір-бірімен синергетикаға ие бірнеше AI модельдері бар.
Мультимодальді AI бойынша зерттеулерге келетін болсақ, соңғы апталарда лондондық DeepMind компаниясы, біздің есімізде - галактиканың бөлігі болып табылады. Google, өздері туралы көп әңгіме тудырған екі AI жүйесін шығарды. Біріншісі деп аталады Фламинго, және «көп модальды тапсырмаларды» шешуге қабілетті модель, яғни суреттер, бейне және мәтін сияқты әртүрлі модальділіктер арқылы жеткізілетін кіріс ақпараты болуы мүмкін тапсырмаларды, тіпті бір-бірімен үйлесімде де. Flamingo – бұл бірнеше енгізу/шығару үлгілерін («бірнеше рет оқу» деп аталатын) қамтамасыз ете отырып, жіктеу ақпаратын, тақырыпты басқаруды, суретке негізделген сұрақ жауаптарын өңдей алатын визуалды тіл үлгісі (VLM).
Модельдің мақсаты – бейненің немесе бейненің жағдайын «түсіну», оның тілдік жүйесімен дұрыс сипаттау және «көретініне» қатысты сұрақтарға дұрыс жауап беру.
Гато әрқашан берілген тапсырма үшін ең жақсы AI моделі бола бермейді. Sawyer роботын басқару (бұл көптеген «буындары» бар қолынан тұратын робот) жақсы стандартқа ие, бірақ жазуларды жасау орташа ғана, ал кейбір Atari ойындарын өңдеу басқаларға арналған басқаларға қарағанда аз. AI үлгілері. DeepMind 450 тапсырманың ішінде (ол оқытылған 604 тапсырмамен салыстырғанда) Гато адам сарапшыларынан «жартысынан көп уақыт» дәлірек екенін айтады. Жалпы 604 тапсырманың кем дегенде 154-і өте нашар нәтиже береді деп айтудың біршама күрделі тәсілі, ал қалған 450-де уақыттың жақсы жартысы Гато адам сарапшысынан жақсырақ әрекет етеді, бірақ уақыттың басқа жартысы өзін ұстайды. нашар.
Осы апталардың нәтижелері DeepMind көптеген жылдар бойы орындап келе жатқан міндеттеменің нәтижесі болып табылады. Компанияның мақсаты әртүрлі мәселелердің кең ауқымын шешуге қабілетті барған сайын жалпы жүйелерді әзірлеу «интеллект мәселесін шешу» екенін ұмытпайық. Бұл компания жасанды жалпы интеллект деп атайды және олар сол жерге барғысы келеді. Өткен жылы бұл бағытта бір қадам жасалды Қабылдаушы, кескіндер, мәтін, бейне, дыбыс, 3D деректері сияқты кірістердің әртүрлі түрлерін өңдеуге қабілетті Transformer архитектурасына негізделген мультимодальды модель. Гато жасаушылардың өздері Perceiver болашақ жалпы жүйелердің режимдерінің санын одан әрі кеңейту үшін пайдалы болуы мүмкін деп санайды.
Посттан алынған мақала Luca Sambucci, оқығыңыз келсебүкіл пост осында басыңыз
Apple Vision Pro коммерциялық көру құралын пайдаланып офтальмопластика операциясы Катания емханасында жасалды…
Ұсақ моториканы бояу арқылы дамыту балаларды жазу сияқты күрделі дағдыларға дайындайды. Бояу үшін…
Әскери-теңіз секторы 150 миллиардтық нарыққа бет алған нағыз жаһандық экономикалық держава болып табылады...
Өткен дүйсенбіде Financial Times OpenAI-мен келісім туралы жариялады. FT өзінің әлемдік деңгейдегі журналистикасына лицензия береді…