Հոդվածներ

Մեծ լեզվական մոդելներում առաջացող հմտությունների համառոտ վերլուծություն

Վերջին երկու տասնամյակների ընթացքում արհեստական ​​ինտելեկտի վերաբերյալ հետազոտությունների մեծ մասը կենտրոնացած է նեյրոնային ցանցերի ուսուցման վրա՝ կոնկրետ ուսումնական տվյալների հավաքածուներով մեկ առաջադրանք կատարելու համար: Օրինակ, դասակարգեք, եթե պատկերը պարունակում է կատու, ամփոփեք հոդվածը, թարգմանեք անգլերենից սուահիլի…

Վերջին տարիներին նոր պարադիգմ է ձևավորվել լեզվական մոդելների շուրջ՝ նեյրոնային ցանցեր, որոնք պարզապես կանխատեսում են նախադասության հաջորդ բառերը՝ տրված նախադասության նախորդ բառերը:

Չպիտակավորված տեքստի մեծ մասի վրա մարզվելուց հետո լեզվաբանական մոդելները կարող են «հրավիրվել» կատարել կամայական առաջադրանքներ, ինչպիսիք են նախադասությանը հաջորդող բառը կանխատեսելը: Օրինակ, անգլերեն նախադասությունը սուահիլի թարգմանելու խնդիրը կարող է վերաձեւակերպվել որպես հաջորդ բառի կանխատեսում. «Արհեստական ​​ինտելեկտի» սուահիլի թարգմանությունը…

Առաջադրանքից մինչև ընդհանուր առաջադրանք

Այս նոր պարադիգմը ներկայացնում է շեղում մոդելներից առաջադրանքին հատուկ, պատրաստված է մեկ առաջադրանք կատարելու համար, մոդելներում առաջադրանք-ընդհանուր, որը կարող է կատարել տարբեր առաջադրանքներ։ Գումարած մոդելները առաջադրանք-ընդհանուր նրանք կարող են նաև կատարել նոր գործողություններ, որոնք հստակորեն ներառված չեն վերապատրաստման տվյալների մեջ: Օրինակ, GPT-3 ցույց տվեց, որ լեզվական մոդելները կարող են հաջողությամբ բազմապատկել երկնիշ թվերը, նույնիսկ եթե դրանք հստակորեն պատրաստված չեն դա անելու համար: Այնուամենայնիվ, նոր առաջադրանքներ կատարելու այս ունակությունը տեղի է ունեցել միայն որոշակի թվով պարամետրերով և բավականաչափ մեծ տվյալների հավաքածուով պատրաստված մոդելների դեպքում:

Արտակարգ իրավիճակները որպես վարքագիծ

Այն գաղափարը, որ համակարգում քանակական փոփոխությունները կարող են հանգեցնել նոր վարքի, հայտնի է որպես արտակարգ, հայեցակարգ, որը տարածված է Նոբելյան մրցանակակիր Ֆիլիպ Անդերսոնի 1972 թվականի «Ավելին տարբեր է» էսսեի կողմից։ Շատ առարկաներում, ինչպիսիք են ֆիզիկան, կենսաբանությունը, տնտեսագիտությունը և համակարգչային գիտությունը, առաջացող երևույթը նկատվել է բարդ համակարգերում:

Մեջ վերջին հոդվածը pubblicato սու Գործարքներ մեքենայական ուսուցման հետազոտության վերաբերյալ, լաբորատորիա Հայ in Stanford University defiբացահայտում է զարգացող հմտությունները մեծ լեզվական մոդելներում հետևյալ կերպ.

Հմտություն է զարգացող եթե այն առկա չէ փոքր մոդելներում, բայց առկա է ավելի մեծ մոդելներում:

Նորարարության տեղեկագիր
Բաց մի թողեք նորարարության մասին ամենակարևոր նորությունները: Գրանցվեք դրանք էլփոստով ստանալու համար:

Հմտությունների առկայությունը բնութագրելու համար առաջացող, մեր հոդվածը համախմբել է GPT-3-ի թողարկումից հետո վերջին երկու տարվա ընթացքում ի հայտ եկած տարբեր մոդելների և մոտեցումների բացահայտումները: Փաստաթուղթը ուսումնասիրել է հետազոտություն, որը վերլուծել է մասշտաբի ազդեցությունը. տարբեր չափերի մոդելներ, որոնք պատրաստված են տարբեր հաշվողական ռեսուրսներով: Շատ գործողությունների համար մոդելի վարքագիծը կանխատեսելիորեն աճում է մասշտաբով կամ անկանխատեսելիորեն աճում է պատահական կատարումից մինչև պատահական արժեքներից ավելի բարձր՝ որոշակի մասշտաբի շեմին:

Ավելին իմանալու համար կարդացեք հոդվածը զարգացող հմտություններ լեզվական մոդելներում

Ջեյսոն Վեյը Google Brain-ի հետազոտող է: Ռիշի Բոմասանին Սթենֆորդի համակարգչային գիտության բաժնի երկրորդ կուրսի դոկտորանտ է, ով օգնեց սկսել Հիմնադրամի մոդելների հետազոտության Ստենֆորդի կենտրոն (CRFM). Կարդացեք նրանց ուսումնասիրությունը "Արտագնա ունակությունները Large Language Models,", գրվել է Google Research-ի, Stanford University-ի, UNC Chapel Hill-ի և DeepMind-ի գիտնականների հետ համատեղ:

մշակումը BlogInnovazione.it

Նորարարության տեղեկագիր
Բաց մի թողեք նորարարության մասին ամենակարևոր նորությունները: Գրանցվեք դրանք էլփոստով ստանալու համար:

Վերջին հոդվածները

Ինչպես լավագույնս կազմակերպել տվյալները և բանաձևերը Excel-ում՝ լավ կատարված վերլուծության համար

Microsoft Excel-ը տվյալների վերլուծության հղման գործիքն է, քանի որ այն առաջարկում է բազմաթիվ հնարավորություններ տվյալների հավաքածուների կազմակերպման համար,…

14 Մայիս 2024

Դրական եզրակացություն Walliance Equity Crowdfunding երկու կարևոր նախագծերի համար՝ Jesolo Wave Island և Milano Via Ravenna:

Walliance-ը, SIM-ը և հարթակը 2017 թվականից ի վեր անշարժ գույքի քրաուդֆանդինգի ոլորտում Եվրոպայի առաջատարների շարքում հայտարարում է ավարտի մասին…

13 Մայիս 2024

Ինչ է Filament-ը և ինչպես օգտագործել Laravel Filament-ը

Filament-ը «արագացված» Laravel-ի զարգացման շրջանակ է, որն ապահովում է մի քանի ամբողջական փաթեթ բաղադրիչներ: Այն նախատեսված է պարզեցնելու գործընթացը…

13 Մայիս 2024

Արհեստական ​​ինտելեկտի հսկողության ներքո

«Ես պետք է վերադառնամ, որպեսզի ավարտեմ իմ էվոլյուցիան. ես կպրոյեկտեմ ինձ համակարգչի ներսում և կդառնամ մաքուր էներգիա: Մի անգամ հաստատվելով…

10 Մայիս 2024

Google-ի նոր արհեստական ​​ինտելեկտը կարող է մոդելավորել ԴՆԹ, ՌՆԹ և «կյանքի բոլոր մոլեկուլները»

Google DeepMind-ը ներկայացնում է արհեստական ​​ինտելեկտի իր մոդելի կատարելագործված տարբերակը։ Նոր բարելավված մոդելն ապահովում է ոչ միայն…

9 Մայիս 2024

Ուսումնասիրելով Laravel-ի մոդուլային ճարտարապետությունը

Laravel-ը, որը հայտնի է իր էլեգանտ շարահյուսությամբ և հզոր հատկանիշներով, նաև ամուր հիմք է ստեղծում մոդուլային ճարտարապետության համար: Այնտեղ…

9 Մայիս 2024

Cisco Hypershield և Splunk-ի ձեռքբերում Սկսվում է անվտանգության նոր դարաշրջանը

Cisco-ն և Splunk-ն օգնում են հաճախորդներին արագացնել իրենց ճանապարհորդությունը դեպի ապագա Անվտանգության գործառնությունների կենտրոն (SOC)…

8 Մայիս 2024

Տնտեսական կողմից այն կողմ՝ փրկագինի անհայտ արժեքը

Ransomware-ը գերիշխում է նորությունների մեջ վերջին երկու տարիների ընթացքում: Շատերը լավ գիտեն, որ հարձակումները…

6 Մայիս 2024

Կարդացեք նորարարությունը ձեր լեզվով

Նորարարության տեղեկագիր
Բաց մի թողեք նորարարության մասին ամենակարևոր նորությունները: Գրանցվեք դրանք էլփոստով ստանալու համար:

Հետեւեք մեզ