Bidh Meta a’ cur air bhog modal LLaMA, inneal sgrùdaidh nas cumhachdaiche na GPT-3 aig OpenAI

meta lama

O chionn ghoirid tha Meta air gineadair cànain AI ùr fhoillseachadh leis an t-ainm LLaMA, a’ dearbhadh àite companaidh air leth ùr-ghnàthach.

“An-diugh tha sinn a’ leigeil a-mach modal cànain mòr AI ùr leis an t-ainm LLaMA a chaidh a dhealbhadh gus luchd-rannsachaidh a chuideachadh gus an cuid obrach adhartachadh, ”thuirt an Ceannard Mark Zuckerberg ann am post Facebook.

Carson a tha LLaMA

Tha modalan cànain sgoinneil air saoghal teicneòlais a thoirt gu mòr. Bidh iad a 'toirt cumhachd dha innealan inntleachd fuadain, coltach Bruidhinn GPT e altri modelli conversazionali. Tuttavia, l’utilizzo di questi strumenti comporta un rischio significativo, dichiarazioni plausibili ma false, generare contenuti tossici e imitare il pregiudizio radicato nei dati di addestramento dell’IA

Gus luchd-rannsachaidh a chuideachadh gus na duilgheadasan sin fhuasgladh, air Dihaoine, Gearran 25, Meta  dh’ainmich an foillseachadh de mhodail cànain mòr ùr ris an canar LLaMA (Large Language Model Meta AI) . 

Dè a th’ ann an LLaMA?

Chan eil LLaMA a chatbot, ach is e inneal sgrùdaidh a th’ ann a dh’ fhuasglas, a rèir Meta ai, duilgheadasan co-cheangailte ri modalan cànain AI. “Tha modalan nas lugha agus nas fheàrr mar LLaMA a’ toirt cothrom do dhaoine eile sa choimhearsnachd rannsachaidh aig nach eil cothrom air mòran bun-structair sgrùdadh a dhèanamh air na modalan sin, a’ dèanamh tuilleadh deamocratach air ruigsinneachd san raon chudromach seo a tha ag atharrachadh gu luath," thuirt Meta anns a’ bhlog aige. oifigeil .

Tha LLaMA na chruinneachadh de mhodalan cànain eadar paramadairean 7B gu 65B. Thuirt a’ chompanaidh gu bheil iad a’ trèanadh a mhodalan air trilleanan de chomharran, ag ràdh gun urrainn dhaibh modalan ùr-nodha a thrèanadh a’ cleachdadh stòran-dàta poblach agus gun a bhith an urra ri stòran-dàta seilbhe, do-ruigsinneach.

Tha LLaMA eadar-dhealaichte

A rèir Meta, feumaidh trèanadh modail mar LLaMA glè bheag de chumhachd coimpiutaireachd gus cùisean cleachdaidh ùra a dhearbhadh, a dhearbhadh agus a sgrùdadh. Bidh modalan cànain bunaiteach a’ trèanadh air blocaichean mòra de dhàta gun bhileig, gan dèanamh air leth freagarrach airson diofar ghnìomhan a ghnàthachadh. 

Anns a phàipear rannsachaidh, thug Meta fa-near gun do rinn LLaMA-13B nas fheàrr na GPT-3 (175B) OpenAI air a’ mhòr-chuid de shlatan-tomhais agus tha LLaMA-65B farpaiseach le prìomh mhodalan, Chinchilla70B le DeepMindPaLM-540B bho Google

Chan eil LLaMA ga chleachdadh an-dràsta air gin de na toraidhean Meta ai, ge-tà, tha planaichean aig a’ chompanaidh gum bi e ri fhaighinn do luchd-rannsachaidh. Bha a’ chompanaidh air an LLM OPT-175B aca a chuir air bhog roimhe seo, ach is e LLaMA an siostam as adhartaiche aca. 

Tha a’ chompanaidh ga thoirt seachad fo chead neo-mhalairteach le fòcas air cùisean cleachdadh rannsachaidh. Bidh e ri fhaotainn do luchd-rannsachaidh acadaimigeach; an fheadhainn a tha ceangailte ris an riaghaltas, comann catharra agus buidhnean acadaimigeach; agus deuchainn-lannan rannsachaidh gnìomhachais air feadh an t-saoghail.

Ercole Palmeri

Autore