Artikkelit

Meta julkaisee LLaMA-mallin, tehokkaamman hakutyökalun kuin OpenAI:n GPT-3

Meta on hiljattain julkaissut uuden tekoälyn kieligeneraattorin nimeltä LLaMA, mikä vahvistaa erittäin innovatiivisen yrityksen roolia.

"Julkaisemme tänään uuden, huippuluokan tekoälyn suuren kielimallin nimeltä LLaMA, joka on suunniteltu auttamaan tutkijoita edistämään työtään", toimitusjohtaja Mark Zuckerberg sanoi Facebook-viestissä.

Miksi LLaMA

Suuret kielimallit ovat valloittaneet teknologiamaailman. Ne käyttävät tekoälytyökaluja, kuten ChatGPT ja muut keskustelumallit. Näiden työkalujen käyttämiseen liittyy kuitenkin merkittäviä riskejä, uskottavia mutta vääriä väitteitä, myrkyllisen sisällön tuottamista ja tekoälyn harjoitusdatasta peräisin olevan harhan jäljittelyä.

Auttaakseen tutkijoita ratkaisemaan nämä ongelmat perjantaina 25. helmikuuta Meta ilmoitti julkaisusta uudesta suuresta kielimallista nimeltä LLAMA (Large Language Model Meta AI) .

Mikä on LLaMA?

LLaMA ei ole a chatbot, mutta se on hakutyökalu, joka Meta ai:n mukaan ratkaisee kielimalleihin liittyviä ongelmia AI. "Pienemmät, paremmin toimivat mallit, kuten LLaMA, antavat muille tutkimusyhteisön jäsenille, joilla ei ole pääsyä suuriin infrastruktuurimääriin, tutkia näitä malleja, mikä demokratisoi edelleen pääsyä tällä tärkeällä ja nopeasti kehittyvällä alalla", Meta sanoi blogissaan. virallinen .

LLaMA on kokoelma kielimalleja, joiden parametrit vaihtelevat 7B - 65B. Yhtiö sanoi, että se kouluttaa mallejaan biljoonien tunnuksien avulla, sanoen, että se voi kouluttaa huippuluokan malleja käyttämällä julkisia tietojoukkoja eikä luota omistettuihin, saavuttamattomiin tietokokonaisuuksiin.

LLAMA on erilainen

Metan mukaan mallikoulutus, kuten LLaMA, vaatii hyvin vähän laskentatehoa testatakseen, validoidakseen ja tutkiakseen uusia käyttötapauksia. Peruskielimallit harjoittelevat suuria merkitsemättömiä datalohkoja, joten ne ovat ihanteellisia eri tehtävien mukauttamiseen.

Tutkimuspaperissaan Meta totesi, että LLaMA-13B ylitti OpenAI:n GPT-3:n (175B) useimmissa vertailuissa ja LLaMA-65B on kilpailukykyinen huippumallien kanssa. Chinchilla70B by DeepMind e PaLM-540B Googlelta.

LLaMA ei ole tällä hetkellä käytössä missään Meta ai -tuotteessa, mutta yhtiö aikoo saattaa sen tutkijoiden käyttöön. Yritys oli aiemmin julkaissut LLM OPT-175B:n, mutta LLaMA on sen edistynein järjestelmä.

Yhtiö tuo sen saataville ei-kaupallisella lisenssillä, joka keskittyy tutkimuskäyttötapauksiin. Se on akateemisten tutkijoiden saatavilla; hallitukseen, kansalaisyhteiskuntaan ja akateemisiin organisaatioihin sidoksissa olevat; ja teolliset tutkimuslaboratoriot ympäri maailmaa.

Ercole Palmeri