Artikler

Meta lanserer LLaMA-modellen, et kraftigere søkeverktøy enn OpenAIs GPT-3

Meta har nylig gitt ut en ny AI-språkgenerator kalt LLaMA, som bekrefter rollen til et svært innovativt selskap.

"I dag slipper vi en ny, banebrytende AI-modell for stort språk kalt LLaMA designet for å hjelpe forskere med å fremme arbeidet deres," sa administrerende direktør Mark Zuckerberg i et Facebook-innlegg.

Hvorfor LLaMA

Store språkmodeller har tatt teknologiverdenen med storm. De driver kunstig intelligens-verktøy, som f.eks ChatGPT og andre samtalemodeller. Bruk av disse verktøyene medfører imidlertid betydelig risiko, plausible, men falske påstander, genererer giftig innhold og etterligner skjevheter forankret i AI-treningsdata.

For å hjelpe forskere med å løse disse problemene, fredag 25. februar, ble Meta annonserte utgivelsen av en ny stor språkmodell kalt LLaMA (Large Language Model Meta AI) .

Hva er LLaMA?

LLaMA er ikke en chatbot, men det er et søkeverktøy som ifølge Meta ai skal løse problemer knyttet til språkmodeller AI. "Mindre modeller med bedre resultater som LLaMA lar andre i forskningsmiljøet som mangler tilgang til store mengder infrastruktur studere disse modellene, og demokratiserer tilgangen ytterligere i dette viktige og raskt utviklende feltet," sa Meta i bloggen sin offisielt .

LLaMA er en samling språkmodeller som spenner fra 7B til 65B parametere. Selskapet sa at det trener modellene sine på billioner av tokens, og sa at de kan trene banebrytende modeller ved å bruke offentlige datasett og ikke stole på proprietære, utilgjengelige datasett.

LLaMA er annerledes

I følge Meta krever modelltrening som LLaMA svært lite datakraft for å teste, validere og utforske nye brukstilfeller. Grunnleggende språkmodeller trener på store blokker med umerkede data, noe som gjør dem ideelle for tilpasning til ulike oppgaver.

I sin forskningsartikkel bemerket Meta at LLaMA-13B overgikk OpenAIs GPT-3 (175B) på de fleste benchmarks og LLaMA-65B er konkurransedyktig med toppmodeller, Chinchilla70B av DeepMind e PaLM-540B fra Google.

LLaMA er foreløpig ikke i bruk på noen av Meta ai-produktene, men selskapet har planer om å gjøre det tilgjengelig for forskere. Selskapet hadde allerede lansert sin LLM OPT-175B, men LLaMA er det mest avanserte systemet.

Selskapet gjør det tilgjengelig under en ikke-kommersiell lisens fokusert på forskningsbruk. Den vil være tilgjengelig for akademiske forskere; de som er tilknyttet regjeringen, sivilsamfunnet og akademiske organisasjoner; og industrielle forskningslaboratorier rundt om i verden.

Ercole Palmeri