Artikkelit

Meta julkaisee LLaMA-mallin, tehokkaamman hakutyökalun kuin OpenAI:n GPT-3

Meta on hiljattain julkaissut uuden tekoälyn kieligeneraattorin nimeltä LLaMA, mikä vahvistaa erittäin innovatiivisen yrityksen roolia.

"Julkaisemme tänään uuden, huippuluokan tekoälyn suuren kielimallin nimeltä LLaMA, joka on suunniteltu auttamaan tutkijoita edistämään työtään", toimitusjohtaja Mark Zuckerberg sanoi Facebook-viestissä.

Miksi LLaMA

Suuret kielimallit ovat valloittaneet teknologiamaailman. Ne käyttävät tekoälytyökaluja, kuten ChatGPT ja muut keskustelumallit. Näiden työkalujen käyttämiseen liittyy kuitenkin merkittäviä riskejä, uskottavia mutta vääriä väitteitä, myrkyllisen sisällön tuottamista ja tekoälyn harjoitusdatasta peräisin olevan harhan jäljittelyä. 

Auttaakseen tutkijoita ratkaisemaan nämä ongelmat perjantaina 25. helmikuuta Meta  ilmoitti julkaisusta uudesta suuresta kielimallista nimeltä LLAMA (Large Language Model Meta AI) . 

Mikä on LLaMA?

LLaMA ei ole a chatbot, mutta se on hakutyökalu, joka Meta ai:n mukaan ratkaisee kielimalleihin liittyviä ongelmia AI. "Pienemmät, paremmin toimivat mallit, kuten LLaMA, antavat muille tutkimusyhteisön jäsenille, joilla ei ole pääsyä suuriin infrastruktuurimääriin, tutkia näitä malleja, mikä demokratisoi edelleen pääsyä tällä tärkeällä ja nopeasti kehittyvällä alalla", Meta sanoi blogissaan. virallinen .

LLaMA on kokoelma kielimalleja, joiden parametrit vaihtelevat 7B - 65B. Yhtiö sanoi, että se kouluttaa mallejaan biljoonien tunnuksien avulla, sanoen, että se voi kouluttaa huippuluokan malleja käyttämällä julkisia tietojoukkoja eikä luota omistettuihin, saavuttamattomiin tietokokonaisuuksiin.

LLAMA on erilainen

Metan mukaan mallikoulutus, kuten LLaMA, vaatii hyvin vähän laskentatehoa testatakseen, validoidakseen ja tutkiakseen uusia käyttötapauksia. Peruskielimallit harjoittelevat suuria merkitsemättömiä datalohkoja, joten ne ovat ihanteellisia eri tehtävien mukauttamiseen. 

Innovaatio-uutiskirje
Älä missaa tärkeimpiä innovaatioita koskevia uutisia. Rekisteröidy saadaksesi ne sähköpostitse.

Tutkimuspaperissaan Meta totesi, että LLaMA-13B ylitti OpenAI:n GPT-3:n (175B) useimmissa vertailuissa ja LLaMA-65B on kilpailukykyinen huippumallien kanssa. Chinchilla70B by DeepMindPaLM-540B Googlelta

LLaMA ei ole tällä hetkellä käytössä missään Meta ai -tuotteessa, mutta yhtiö aikoo saattaa sen tutkijoiden käyttöön. Yritys oli aiemmin julkaissut LLM OPT-175B:n, mutta LLaMA on sen edistynein järjestelmä. 

Yhtiö tuo sen saataville ei-kaupallisella lisenssillä, joka keskittyy tutkimuskäyttötapauksiin. Se on akateemisten tutkijoiden saatavilla; hallitukseen, kansalaisyhteiskuntaan ja akateemisiin organisaatioihin sidoksissa olevat; ja teolliset tutkimuslaboratoriot ympäri maailmaa.

Ercole Palmeri

Innovaatio-uutiskirje
Älä missaa tärkeimpiä innovaatioita koskevia uutisia. Rekisteröidy saadaksesi ne sähköpostitse.

Viimeaikaiset artikkelit

Veeam tarjoaa kattavimman tuen kiristysohjelmille suojauksesta vastaukseen ja palautukseen

Veeamin Coveware tarjoaa jatkossakin kyberkiristystapahtumien reagointipalveluita. Coveware tarjoaa rikosteknisiä ja korjaavia ominaisuuksia…

Huhtikuu 23 2024

Vihreä ja digitaalinen vallankumous: Kuinka ennakoiva huolto muuttaa öljy- ja kaasuteollisuutta

Ennakoiva huolto mullistaa öljy- ja kaasualan innovatiivisella ja ennakoivalla lähestymistavalla laitosten hallintaan.…

Huhtikuu 22 2024

Ison-Britannian kilpailuviranomainen herättää BigTech-hälytyksen GenAI:sta

Britannian CMA on antanut varoituksen Big Techin käyttäytymisestä tekoälymarkkinoilla. Siellä…

Huhtikuu 18 2024

Casa Green: energiavallankumous kestävän tulevaisuuden puolesta Italiassa

Euroopan unionin rakennusten energiatehokkuuden parantamiseksi laatima "Green Houses" -asetus on saanut lainsäädäntöprosessinsa päätökseen…

Huhtikuu 18 2024