"I dag udgiver vi en ny, banebrydende AI-storsprogmodel kaldet LLaMA designet til at hjælpe forskere med at fremme deres arbejde," sagde CEO Mark Zuckerberg i et Facebook-opslag.
Store sprogmodeller har taget teknologiverdenen med storm. De driver kunstig intelligens værktøjer, som f.eks ChatGPT og andre samtalemodeller. Men brugen af disse værktøjer medfører betydelige risici, plausible, men falske påstande, genererer giftigt indhold og efterligner bias forankret i AI-træningsdata.
For at hjælpe forskere med at løse disse problemer, fredag den 25. februar, blev Meta annoncerede udgivelsen af en ny stor sprogmodel kaldet LLaMA (Large Language Model Meta AI) .
LLaMA er ikke en chatbot, men det er et søgeværktøj, der ifølge Meta ai skal løse problemer relateret til sprogmodeller AI. "Mindre, bedre ydende modeller som LLaMA giver andre i forskningsmiljøet, der mangler adgang til store mængder infrastruktur, mulighed for at studere disse modeller, hvilket yderligere demokratiserer adgangen i dette vigtige og hurtigt udviklende felt," sagde Meta i sin blog officielle .
LLaMA er en samling af sprogmodeller, der spænder fra 7B til 65B parametre. Virksomheden sagde, at det træner sine modeller på billioner af tokens og sagde, at det kan træne banebrydende modeller ved hjælp af offentlige datasæt og ikke stole på proprietære, utilgængelige datasæt.
Ifølge Meta kræver modeltræning som LLaMA meget lidt computerkraft for at teste, validere og udforske nye use cases. Grundlæggende sprogmodeller træner på store blokke af umærkede data, hvilket gør dem ideelle til tilpasning til forskellige opgaver.
I sit forskningspapir bemærkede Meta, at LLaMA-13B klarede sig bedre end OpenAI's GPT-3 (175B) på de fleste benchmarks, og LLaMA-65B er konkurrencedygtig med topmodeller, Chinchilla70B fra DeepMind e PaLM-540B fra Google.
LLaMA er i øjeblikket ikke i brug på nogen af Meta ai-produkterne, men virksomheden har planer om at gøre det tilgængeligt for forskere. Virksomheden havde tidligere lanceret sin LLM OPT-175B, men LLaMA er dets mest avancerede system.
Virksomheden gør det tilgængeligt under en ikke-kommerciel licens med fokus på forskningsbrug. Det vil være tilgængeligt for akademiske forskere; dem, der er tilknyttet regeringen, civilsamfundet og akademiske organisationer; og industrielle forskningslaboratorier rundt om i verden.
Ercole Palmeri
Coveware by Veeam vil fortsætte med at levere responstjenester til cyberafpresning. Coveware vil tilbyde kriminaltekniske og afhjælpende funktioner...
Forudsigende vedligeholdelse revolutionerer olie- og gassektoren med en innovativ og proaktiv tilgang til anlægsstyring...
Det britiske CMA har udsendt en advarsel om Big Techs adfærd på markedet for kunstig intelligens. Der…
Dekretet om "grønne huse", der er formuleret af Den Europæiske Union for at øge bygningers energieffektivitet, har afsluttet sin lovgivningsproces med...