Artikel

Meta ngluncurake model LLaMA, alat telusuran sing luwih kuat tinimbang GPT-3 OpenAI

Meta bubar ngrilis generator basa AI anyar sing diarani LLaMA, ngonfirmasi peran perusahaan sing inovatif banget.

"Dina iki kita ngeculake model basa gedhe AI anyar sing diarani LLaMA sing dirancang kanggo mbantu para peneliti maju," ujare CEO Mark Zuckerberg ing kiriman Facebook.

LLaMA kok

Model basa gedhe wis ngrebut jagad teknologi. Dheweke duwe alat intelijen buatan, kayata Ngobrol GPT lan model pacelathon liyane. Nanging, nggunakake alat kasebut ana risiko sing signifikan, pratelan sing bisa dipercaya nanging palsu, ngasilake konten beracun, lan niru bias sing didhasarake ing data latihan AI.

Kanggo mbantu peneliti ngatasi masalah kasebut, ing dina Jumuah, 25 Februari, Meta ngumumake release saka model basa gedhe anyar disebut LLaMA (Large Language Model Meta AI) .

Apa LLaMA?

LLaMA dudu a chatbot, nanging minangka alat telusuran sing, miturut Meta ai, bakal ngatasi masalah sing ana gandhengane karo model basa AI. "Model sing luwih cilik, luwih apik kaya LLaMA ngidini wong liya ing komunitas riset sing ora duwe akses menyang infrastruktur sing akeh kanggo sinau model kasebut, luwih demokratisasi akses ing lapangan sing penting lan berkembang kanthi cepet iki," ujare Meta ing bloge. pejabat .

LLaMA minangka koleksi model basa wiwit saka 7B nganti 65B paramèter. Perusahaan kasebut ujar manawa nglatih model kasebut kanthi triliunan token, ujar manawa bisa nglatih model mutakhir nggunakake dataset umum lan ora ngandelake dataset sing ora bisa diakses.

LLaMA beda

Miturut Meta, latihan model kaya LLaMA mbutuhake daya komputasi sing sithik banget kanggo nyoba, validasi, lan njelajah kasus panggunaan anyar. Model basa dhasar nglatih ing pamblokiran gedhe saka data sing ora dilabeli, dadi cocog kanggo kustomisasi kanggo macem-macem tugas.

Ing makalah riset, Meta nyathet yen LLaMA-13B ngluwihi OpenAI's GPT-3 (175B) ing umume benchmark lan LLaMA-65B kompetitif karo model paling dhuwur, Chinchilla70B dening DeepMind e PaLM-540B saka Google.

LLaMA saiki ora digunakake ing produk Meta ai, nanging perusahaan duwe rencana supaya kasedhiya kanggo peneliti. Perusahaan kasebut sadurunge ngluncurake LLM OPT-175B, nanging LLaMA minangka sistem sing paling maju.

Perusahaan nggawe kasedhiya ing lisensi non-komersial sing fokus ing kasus panggunaan riset. Bakal kasedhiya kanggo peneliti akademik; sing afiliasi karo pemerintah, masyarakat sipil lan organisasi akademisi; lan laboratorium riset industri ing saindenging jagad.

Ercole Palmeri