Članki

Meta lansira model LLaMA, močnejše iskalno orodje kot GPT-3 OpenAI

Meta je pred kratkim izdala nov generator jezikov AI, imenovan LLaMA, ki potrjuje vlogo zelo inovativnega podjetja.

"Danes izdajamo nov, vrhunski AI velik jezikovni model, imenovan LLaMA, zasnovan za pomoč raziskovalcem pri napredovanju njihovega dela," je v objavi na Facebooku povedal izvršni direktor Mark Zuckerberg.

Zakaj LLaMA

Veliki jezikovni modeli so prevzeli tehnološki svet. Poganjajo orodja umetne inteligence, kot je npr ChatGPT in drugi pogovorni modeli. Vendar je uporaba teh orodij povezana s precejšnjim tveganjem, verjetnimi, vendar napačnimi trditvami, ustvarjanjem strupene vsebine in posnemanjem pristranskosti, ki izvira iz podatkov o usposabljanju AI.

Za pomoč raziskovalcem pri reševanju teh težav je v petek, 25. februarja, Meta napovedal izid novega velikega jezikovnega modela, imenovanega LlaMA (Large Language Model Meta AI) .

Kaj je LLaMA?

LLaMA ni a chatbot, vendar je iskalno orodje, ki bo po Meta ai rešilo težave, povezane z jezikovnimi modeli AI. "Manjši, bolje zmogljivi modeli, kot je LLaMA, omogočajo drugim v raziskovalni skupnosti, ki nimajo dostopa do velike količine infrastrukture, da preučujejo te modele, kar dodatno demokratizira dostop na tem pomembnem in hitro razvijajočem se področju," je dejal Meta v svojem blogu. uradni .

LLaMA je zbirka jezikovnih modelov s parametri od 7B do 65B. Podjetje je dejalo, da usposablja svoje modele na bilijonih žetonov, pri čemer pravi, da lahko usposablja vrhunske modele z uporabo javnih naborov podatkov in se ne zanaša na lastniške, nedostopne nabore podatkov.

LLaMA je drugačna

Po mnenju Mete usposabljanje modelov, kot je LLaMA, zahteva zelo malo računalniške moči za testiranje, potrjevanje in raziskovanje novih primerov uporabe. Osnovni jezikovni modeli se urijo na velikih blokih neoznačenih podatkov, zaradi česar so idealni za prilagajanje različnim nalogam.

V svojem raziskovalnem prispevku je Meta ugotovil, da je LLaMA-13B prekašal OpenAI-jev GPT-3 (175B) pri večini meril uspešnosti in da je LLaMA-65B konkurenčen vrhunskim modelom, Chinchilla70B proizvajalca DeepMind e PaLM-540B iz Googla.

LLaMA trenutno ni v uporabi v nobenem od izdelkov Meta ai, vendar ima podjetje načrte, da bo na voljo raziskovalcem. Podjetje je že lansiralo svoj LLM OPT-175B, vendar je LLaMA njegov najnaprednejši sistem.

Podjetje ga daje na voljo pod nekomercialno licenco, osredotočeno na raziskovalne primere uporabe. Na voljo bo akademskim raziskovalcem; tisti, ki so povezani z vlado, civilno družbo in akademskimi organizacijami; in industrijskih raziskovalnih laboratorijev po vsem svetu.

Ercole Palmeri