Artikler

Meta lancerer LLaMA-modellen, et mere kraftfuldt søgeværktøj end OpenAI's GPT-3

Meta har for nylig udgivet en ny AI-sproggenerator kaldet LLaMA, der bekræfter rollen som en meget innovativ virksomhed.

"I dag udgiver vi en ny, banebrydende AI-storsprogmodel kaldet LLaMA designet til at hjælpe forskere med at fremme deres arbejde," sagde CEO Mark Zuckerberg i et Facebook-opslag.

Hvorfor LLaMA

Store sprogmodeller har taget teknologiverdenen med storm. De driver kunstig intelligens værktøjer, som f.eks ChatGPT og andre samtalemodeller. Men brugen af disse værktøjer medfører betydelige risici, plausible, men falske påstande, genererer giftigt indhold og efterligner bias forankret i AI-træningsdata.

For at hjælpe forskere med at løse disse problemer, fredag den 25. februar, blev Meta annoncerede udgivelsen af en ny stor sprogmodel kaldet LLaMA (Large Language Model Meta AI) .

Hvad er LLaMA?

LLaMA er ikke en chatbot, men det er et søgeværktøj, der ifølge Meta ai skal løse problemer relateret til sprogmodeller AI. "Mindre, bedre ydende modeller som LLaMA giver andre i forskningsmiljøet, der mangler adgang til store mængder infrastruktur, mulighed for at studere disse modeller, hvilket yderligere demokratiserer adgangen i dette vigtige og hurtigt udviklende felt," sagde Meta i sin blog officielle .

LLaMA er en samling af sprogmodeller, der spænder fra 7B til 65B parametre. Virksomheden sagde, at det træner sine modeller på billioner af tokens og sagde, at det kan træne banebrydende modeller ved hjælp af offentlige datasæt og ikke stole på proprietære, utilgængelige datasæt.

LLaMA er anderledes

Ifølge Meta kræver modeltræning som LLaMA meget lidt computerkraft for at teste, validere og udforske nye use cases. Grundlæggende sprogmodeller træner på store blokke af umærkede data, hvilket gør dem ideelle til tilpasning til forskellige opgaver.

I sit forskningspapir bemærkede Meta, at LLaMA-13B klarede sig bedre end OpenAI's GPT-3 (175B) på de fleste benchmarks, og LLaMA-65B er konkurrencedygtig med topmodeller, Chinchilla70B fra DeepMind e PaLM-540B fra Google.

LLaMA er i øjeblikket ikke i brug på nogen af Meta ai-produkterne, men virksomheden har planer om at gøre det tilgængeligt for forskere. Virksomheden havde tidligere lanceret sin LLM OPT-175B, men LLaMA er dets mest avancerede system.

Virksomheden gør det tilgængeligt under en ikke-kommerciel licens med fokus på forskningsbrug. Det vil være tilgængeligt for akademiske forskere; dem, der er tilknyttet regeringen, civilsamfundet og akademiske organisationer; og industrielle forskningslaboratorier rundt om i verden.

Ercole Palmeri

tags: chat gptfacebookkunstig intelligenslarge language modelsLLMmeta

25. februar 2023 kl. 10

Efter Oprettelse af en CRUD-app med Laravel og Vue.js »

Forrige « Google Fotos introducerer det "magiske viskelæder" på ikke-Pixel-enheder

Seneste artikler

Comunicati Stampa

Veeam har den mest omfattende support til ransomware, fra beskyttelse til respons og gendannelse

Coveware by Veeam vil fortsætte med at levere responstjenester til cyberafpresning. Coveware vil tilbyde kriminaltekniske og afhjælpende funktioner...

23 April 2024

Artikler

Grøn og digital revolution: Hvordan prædiktiv vedligeholdelse transformerer olie- og gasindustrien

Forudsigende vedligeholdelse revolutionerer olie- og gassektoren med en innovativ og proaktiv tilgang til anlægsstyring...

22 April 2024

Artikler

Britisk antitrust-tilsynsmyndighed rejser BigTech-alarm over GenAI

Det britiske CMA har udsendt en advarsel om Big Techs adfærd på markedet for kunstig intelligens. Der…

18 April 2024

Comunicati Stampa

Casa Green: energirevolution for en bæredygtig fremtid i Italien

Dekretet om "grønne huse", der er formuleret af Den Europæiske Union for at øge bygningers energieffektivitet, har afsluttet sin lovgivningsproces med...

18 April 2024