Վերջին տարիներին նոր պարադիգմ է ձևավորվել լեզվական մոդելների շուրջ՝ նեյրոնային ցանցեր, որոնք պարզապես կանխատեսում են նախադասության հաջորդ բառերը՝ տրված նախադասության նախորդ բառերը:
Չպիտակավորված տեքստի մեծ մասի վրա մարզվելուց հետո լեզվաբանական մոդելները կարող են «հրավիրվել» կատարել կամայական առաջադրանքներ, ինչպիսիք են նախադասությանը հաջորդող բառը կանխատեսելը: Օրինակ, անգլերեն նախադասությունը սուահիլի թարգմանելու խնդիրը կարող է վերաձեւակերպվել որպես հաջորդ բառի կանխատեսում. «Արհեստական ինտելեկտի» սուահիլի թարգմանությունը…
Այս նոր պարադիգմը ներկայացնում է շեղում մոդելներից առաջադրանքին հատուկ, պատրաստված է մեկ առաջադրանք կատարելու համար, մոդելներում առաջադրանք-ընդհանուր, որը կարող է կատարել տարբեր առաջադրանքներ։ Գումարած մոդելները առաջադրանք-ընդհանուր նրանք կարող են նաև կատարել նոր գործողություններ, որոնք հստակորեն ներառված չեն վերապատրաստման տվյալների մեջ: Օրինակ, GPT-3 ցույց տվեց, որ լեզվական մոդելները կարող են հաջողությամբ բազմապատկել երկնիշ թվերը, նույնիսկ եթե դրանք հստակորեն պատրաստված չեն դա անելու համար: Այնուամենայնիվ, նոր առաջադրանքներ կատարելու այս ունակությունը տեղի է ունեցել միայն որոշակի թվով պարամետրերով և բավականաչափ մեծ տվյալների հավաքածուով պատրաստված մոդելների դեպքում:
Այն գաղափարը, որ համակարգում քանակական փոփոխությունները կարող են հանգեցնել նոր վարքի, հայտնի է որպես արտակարգ, հայեցակարգ, որը տարածված է Նոբելյան մրցանակակիր Ֆիլիպ Անդերսոնի 1972 թվականի «Ավելին տարբեր է» էսսեի կողմից։ Շատ առարկաներում, ինչպիսիք են ֆիզիկան, կենսաբանությունը, տնտեսագիտությունը և համակարգչային գիտությունը, առաջացող երևույթը նկատվել է բարդ համակարգերում:
Մեջ վերջին հոդվածը pubblicato սու Գործարքներ մեքենայական ուսուցման հետազոտության վերաբերյալ, լաբորատորիա Հայ in Stanford University defiբացահայտում է զարգացող հմտությունները մեծ լեզվական մոդելներում հետևյալ կերպ.
Հմտություն է զարգացող եթե այն առկա չէ փոքր մոդելներում, բայց առկա է ավելի մեծ մոդելներում:
Հմտությունների առկայությունը բնութագրելու համար առաջացող, մեր հոդվածը համախմբել է GPT-3-ի թողարկումից հետո վերջին երկու տարվա ընթացքում ի հայտ եկած տարբեր մոդելների և մոտեցումների բացահայտումները: Փաստաթուղթը ուսումնասիրել է հետազոտություն, որը վերլուծել է մասշտաբի ազդեցությունը. տարբեր չափերի մոդելներ, որոնք պատրաստված են տարբեր հաշվողական ռեսուրսներով: Շատ գործողությունների համար մոդելի վարքագիծը կանխատեսելիորեն աճում է մասշտաբով կամ անկանխատեսելիորեն աճում է պատահական կատարումից մինչև պատահական արժեքներից ավելի բարձր՝ որոշակի մասշտաբի շեմին:
Ավելին իմանալու համար կարդացեք հոդվածը զարգացող հմտություններ լեզվական մոդելներում
Ջեյսոն Վեյը Google Brain-ի հետազոտող է: Ռիշի Բոմասանին Սթենֆորդի համակարգչային գիտության բաժնի երկրորդ կուրսի դոկտորանտ է, ով օգնեց սկսել Հիմնադրամի մոդելների հետազոտության Ստենֆորդի կենտրոն (CRFM). Կարդացեք նրանց ուսումնասիրությունը "Արտագնա ունակությունները Large Language Models,", գրվել է Google Research-ի, Stanford University-ի, UNC Chapel Hill-ի և DeepMind-ի գիտնականների հետ համատեղ:
մշակումը BlogInnovazione.it
Microsoft Excel-ը տվյալների վերլուծության հղման գործիքն է, քանի որ այն առաջարկում է բազմաթիվ հնարավորություններ տվյալների հավաքածուների կազմակերպման համար,…
Walliance-ը, SIM-ը և հարթակը 2017 թվականից ի վեր անշարժ գույքի քրաուդֆանդինգի ոլորտում Եվրոպայի առաջատարների շարքում հայտարարում է ավարտի մասին…
Filament-ը «արագացված» Laravel-ի զարգացման շրջանակ է, որն ապահովում է մի քանի ամբողջական փաթեթ բաղադրիչներ: Այն նախատեսված է պարզեցնելու գործընթացը…
«Ես պետք է վերադառնամ, որպեսզի ավարտեմ իմ էվոլյուցիան. ես կպրոյեկտեմ ինձ համակարգչի ներսում և կդառնամ մաքուր էներգիա: Մի անգամ հաստատվելով…
Google DeepMind-ը ներկայացնում է արհեստական ինտելեկտի իր մոդելի կատարելագործված տարբերակը։ Նոր բարելավված մոդելն ապահովում է ոչ միայն…
Laravel-ը, որը հայտնի է իր էլեգանտ շարահյուսությամբ և հզոր հատկանիշներով, նաև ամուր հիմք է ստեղծում մոդուլային ճարտարապետության համար: Այնտեղ…
Cisco-ն և Splunk-ն օգնում են հաճախորդներին արագացնել իրենց ճանապարհորդությունը դեպի ապագա Անվտանգության գործառնությունների կենտրոն (SOC)…
Ransomware-ը գերիշխում է նորությունների մեջ վերջին երկու տարիների ընթացքում: Շատերը լավ գիտեն, որ հարձակումները…