"Danes izdajamo nov, vrhunski AI velik jezikovni model, imenovan LLaMA, zasnovan za pomoč raziskovalcem pri napredovanju njihovega dela," je v objavi na Facebooku povedal izvršni direktor Mark Zuckerberg.
Veliki jezikovni modeli so prevzeli tehnološki svet. Poganjajo orodja umetne inteligence, kot je npr ChatGPT in drugi pogovorni modeli. Vendar je uporaba teh orodij povezana s precejšnjim tveganjem, verjetnimi, vendar napačnimi trditvami, ustvarjanjem strupene vsebine in posnemanjem pristranskosti, ki izvira iz podatkov o usposabljanju AI.
Za pomoč raziskovalcem pri reševanju teh težav je v petek, 25. februarja, Meta napovedal izid novega velikega jezikovnega modela, imenovanega LlaMA (Large Language Model Meta AI) .
LLaMA ni a chatbot, vendar je iskalno orodje, ki bo po Meta ai rešilo težave, povezane z jezikovnimi modeli AI. "Manjši, bolje zmogljivi modeli, kot je LLaMA, omogočajo drugim v raziskovalni skupnosti, ki nimajo dostopa do velike količine infrastrukture, da preučujejo te modele, kar dodatno demokratizira dostop na tem pomembnem in hitro razvijajočem se področju," je dejal Meta v svojem blogu. uradni .
LLaMA je zbirka jezikovnih modelov s parametri od 7B do 65B. Podjetje je dejalo, da usposablja svoje modele na bilijonih žetonov, pri čemer pravi, da lahko usposablja vrhunske modele z uporabo javnih naborov podatkov in se ne zanaša na lastniške, nedostopne nabore podatkov.
Po mnenju Mete usposabljanje modelov, kot je LLaMA, zahteva zelo malo računalniške moči za testiranje, potrjevanje in raziskovanje novih primerov uporabe. Osnovni jezikovni modeli se urijo na velikih blokih neoznačenih podatkov, zaradi česar so idealni za prilagajanje različnim nalogam.
V svojem raziskovalnem prispevku je Meta ugotovil, da je LLaMA-13B prekašal OpenAI-jev GPT-3 (175B) pri večini meril uspešnosti in da je LLaMA-65B konkurenčen vrhunskim modelom, Chinchilla70B proizvajalca DeepMind e PaLM-540B iz Googla.
LLaMA trenutno ni v uporabi v nobenem od izdelkov Meta ai, vendar ima podjetje načrte, da bo na voljo raziskovalcem. Podjetje je že lansiralo svoj LLM OPT-175B, vendar je LLaMA njegov najnaprednejši sistem.
Podjetje ga daje na voljo pod nekomercialno licenco, osredotočeno na raziskovalne primere uporabe. Na voljo bo akademskim raziskovalcem; tisti, ki so povezani z vlado, civilno družbo in akademskimi organizacijami; in industrijskih raziskovalnih laboratorijev po vsem svetu.
Ercole Palmeri
Operacija oftalmoplastike s komercialnim pregledovalnikom Apple Vision Pro je bila opravljena na polikliniki Catania…
Razvijanje finih motoričnih spretnosti z barvanjem otroke pripravi na kompleksnejše spretnosti, kot je pisanje. Za barvanje…
Pomorski sektor je prava svetovna gospodarska sila, ki je krmarila proti 150 milijardnemu trgu...
Prejšnji ponedeljek je Financial Times objavil dogovor z OpenAI. FT licencira svoje vrhunsko novinarstvo ...