Članki

Meta lansira model LLaMA, močnejše iskalno orodje kot GPT-3 OpenAI

Meta je pred kratkim izdala nov generator jezikov AI, imenovan LLaMA, ki potrjuje vlogo zelo inovativnega podjetja.

"Danes izdajamo nov, vrhunski AI velik jezikovni model, imenovan LLaMA, zasnovan za pomoč raziskovalcem pri napredovanju njihovega dela," je v objavi na Facebooku povedal izvršni direktor Mark Zuckerberg.

Zakaj LLaMA

Veliki jezikovni modeli so prevzeli tehnološki svet. Poganjajo orodja umetne inteligence, kot je npr ChatGPT in drugi pogovorni modeli. Vendar je uporaba teh orodij povezana s precejšnjim tveganjem, verjetnimi, vendar napačnimi trditvami, ustvarjanjem strupene vsebine in posnemanjem pristranskosti, ki izvira iz podatkov o usposabljanju AI. 

Za pomoč raziskovalcem pri reševanju teh težav je v petek, 25. februarja, Meta  napovedal izid novega velikega jezikovnega modela, imenovanega LlaMA (Large Language Model Meta AI) . 

Kaj je LLaMA?

LLaMA ni a chatbot, vendar je iskalno orodje, ki bo po Meta ai rešilo težave, povezane z jezikovnimi modeli AI. "Manjši, bolje zmogljivi modeli, kot je LLaMA, omogočajo drugim v raziskovalni skupnosti, ki nimajo dostopa do velike količine infrastrukture, da preučujejo te modele, kar dodatno demokratizira dostop na tem pomembnem in hitro razvijajočem se področju," je dejal Meta v svojem blogu. uradni .

LLaMA je zbirka jezikovnih modelov s parametri od 7B do 65B. Podjetje je dejalo, da usposablja svoje modele na bilijonih žetonov, pri čemer pravi, da lahko usposablja vrhunske modele z uporabo javnih naborov podatkov in se ne zanaša na lastniške, nedostopne nabore podatkov.

LLaMA je drugačna

Po mnenju Mete usposabljanje modelov, kot je LLaMA, zahteva zelo malo računalniške moči za testiranje, potrjevanje in raziskovanje novih primerov uporabe. Osnovni jezikovni modeli se urijo na velikih blokih neoznačenih podatkov, zaradi česar so idealni za prilagajanje različnim nalogam. 

Glasilo o inovacijah
Ne zamudite najpomembnejših novic o inovacijah. Prijavite se, če jih želite prejemati po e-pošti.

V svojem raziskovalnem prispevku je Meta ugotovil, da je LLaMA-13B prekašal OpenAI-jev GPT-3 (175B) pri večini meril uspešnosti in da je LLaMA-65B konkurenčen vrhunskim modelom, Chinchilla70B proizvajalca DeepMindPaLM-540B iz Googla

LLaMA trenutno ni v uporabi v nobenem od izdelkov Meta ai, vendar ima podjetje načrte, da bo na voljo raziskovalcem. Podjetje je že lansiralo svoj LLM OPT-175B, vendar je LLaMA njegov najnaprednejši sistem. 

Podjetje ga daje na voljo pod nekomercialno licenco, osredotočeno na raziskovalne primere uporabe. Na voljo bo akademskim raziskovalcem; tisti, ki so povezani z vlado, civilno družbo in akademskimi organizacijami; in industrijskih raziskovalnih laboratorijev po vsem svetu.

Ercole Palmeri

Glasilo o inovacijah
Ne zamudite najpomembnejših novic o inovacijah. Prijavite se, če jih želite prejemati po e-pošti.

Nedavni članki

Inovativna intervencija v obogateni resničnosti z Apple viewerjem na polikliniki Catania

Operacija oftalmoplastike s komercialnim pregledovalnikom Apple Vision Pro je bila opravljena na polikliniki Catania…

3 maja 2024

Prednosti pobarvank za otroke - svet čarovnije za vse starosti

Razvijanje finih motoričnih spretnosti z barvanjem otroke pripravi na kompleksnejše spretnosti, kot je pisanje. Za barvanje…

2 maja 2024

Prihodnost je tukaj: Kako ladjarska industrija revolucionira svetovno gospodarstvo

Pomorski sektor je prava svetovna gospodarska sila, ki je krmarila proti 150 milijardnemu trgu...

1 maja 2024

Založniki in OpenAI podpisujejo sporazume za urejanje pretoka informacij, ki jih obdeluje umetna inteligenca

Prejšnji ponedeljek je Financial Times objavil dogovor z OpenAI. FT licencira svoje vrhunsko novinarstvo ...

April 30 2024