Artikler

Meta lanserer LLaMA-modellen, et kraftigere søkeverktøy enn OpenAIs GPT-3

Meta har nylig gitt ut en ny AI-språkgenerator kalt LLaMA, som bekrefter rollen til et svært innovativt selskap.

"I dag slipper vi en ny, banebrytende AI-modell for stort språk kalt LLaMA designet for å hjelpe forskere med å fremme arbeidet deres," sa administrerende direktør Mark Zuckerberg i et Facebook-innlegg.

Hvorfor LLaMA

Store språkmodeller har tatt teknologiverdenen med storm. De driver kunstig intelligens-verktøy, som f.eks ChatGPT og andre samtalemodeller. Bruk av disse verktøyene medfører imidlertid betydelig risiko, plausible, men falske påstander, genererer giftig innhold og etterligner skjevheter forankret i AI-treningsdata. 

For å hjelpe forskere med å løse disse problemene, fredag ​​25. februar, ble Meta  annonserte utgivelsen av en ny stor språkmodell kalt LLaMA (Large Language Model Meta AI) . 

Hva er LLaMA?

LLaMA er ikke en chatbot, men det er et søkeverktøy som ifølge Meta ai skal løse problemer knyttet til språkmodeller AI. "Mindre modeller med bedre resultater som LLaMA lar andre i forskningsmiljøet som mangler tilgang til store mengder infrastruktur studere disse modellene, og demokratiserer tilgangen ytterligere i dette viktige og raskt utviklende feltet," sa Meta i bloggen sin offisielt .

LLaMA er en samling språkmodeller som spenner fra 7B til 65B parametere. Selskapet sa at det trener modellene sine på billioner av tokens, og sa at de kan trene banebrytende modeller ved å bruke offentlige datasett og ikke stole på proprietære, utilgjengelige datasett.

LLaMA er annerledes

I følge Meta krever modelltrening som LLaMA svært lite datakraft for å teste, validere og utforske nye brukstilfeller. Grunnleggende språkmodeller trener på store blokker med umerkede data, noe som gjør dem ideelle for tilpasning til ulike oppgaver. 

Nyhetsbrev for innovasjon
Ikke gå glipp av de viktigste nyhetene om innovasjon. Registrer deg for å motta dem på e-post.

I sin forskningsartikkel bemerket Meta at LLaMA-13B overgikk OpenAIs GPT-3 (175B) på de fleste benchmarks og LLaMA-65B er konkurransedyktig med toppmodeller, Chinchilla70B av DeepMindPaLM-540B fra Google

LLaMA er foreløpig ikke i bruk på noen av Meta ai-produktene, men selskapet har planer om å gjøre det tilgjengelig for forskere. Selskapet hadde allerede lansert sin LLM OPT-175B, men LLaMA er det mest avanserte systemet. 

Selskapet gjør det tilgjengelig under en ikke-kommersiell lisens fokusert på forskningsbruk. Den vil være tilgjengelig for akademiske forskere; de som er tilknyttet regjeringen, sivilsamfunnet og akademiske organisasjoner; og industrielle forskningslaboratorier rundt om i verden.

Ercole Palmeri

Nyhetsbrev for innovasjon
Ikke gå glipp av de viktigste nyhetene om innovasjon. Registrer deg for å motta dem på e-post.

Siste artikler

Fremtiden er her: Hvordan shippingindustrien revolusjonerer den globale økonomien

Marinesektoren er en ekte global økonomisk makt, som har navigert mot et 150 milliarder marked...

1 mai 2024

Utgivere og OpenAI signerer avtaler for å regulere flyten av informasjon som behandles av kunstig intelligens

Sist mandag kunngjorde Financial Times en avtale med OpenAI. FT lisensierer sin journalistikk i verdensklasse...

30 april 2024

Nettbetalinger: Her er hvordan strømmetjenester får deg til å betale for alltid

Millioner av mennesker betaler for strømmetjenester og betaler månedlige abonnementsavgifter. Det er vanlig oppfatning at du...

29 april 2024

Veeam har den mest omfattende støtten for løsepengevare, fra beskyttelse til respons og gjenoppretting

Coveware by Veeam vil fortsette å tilby responstjenester for cyberutpressing. Coveware vil tilby kriminaltekniske og utbedringsmuligheter...

23 april 2024