Artikel

Meta ngluncurake model LLaMA, alat telusuran sing luwih kuat tinimbang GPT-3 OpenAI

Meta bubar ngrilis generator basa AI anyar sing diarani LLaMA, ngonfirmasi peran perusahaan sing inovatif banget.

"Dina iki kita ngeculake model basa gedhe AI ​​anyar sing diarani LLaMA sing dirancang kanggo mbantu para peneliti maju," ujare CEO Mark Zuckerberg ing kiriman Facebook.

LLaMA kok

Model basa gedhe wis ngrebut jagad teknologi. Dheweke duwe alat intelijen buatan, kayata Ngobrol GPT lan model pacelathon liyane. Nanging, nggunakake alat kasebut ana risiko sing signifikan, pratelan sing bisa dipercaya nanging palsu, ngasilake konten beracun, lan niru bias sing didhasarake ing data latihan AI. 

Kanggo mbantu peneliti ngatasi masalah kasebut, ing dina Jumuah, 25 Februari, Meta  ngumumake release saka model basa gedhe anyar disebut LLaMA (Large Language Model Meta AI) . 

Apa LLaMA?

LLaMA dudu a chatbot, nanging minangka alat telusuran sing, miturut Meta ai, bakal ngatasi masalah sing ana gandhengane karo model basa AI. "Model sing luwih cilik, luwih apik kaya LLaMA ngidini wong liya ing komunitas riset sing ora duwe akses menyang infrastruktur sing akeh kanggo sinau model kasebut, luwih demokratisasi akses ing lapangan sing penting lan berkembang kanthi cepet iki," ujare Meta ing bloge. pejabat .

LLaMA minangka koleksi model basa wiwit saka 7B nganti 65B paramèter. Perusahaan kasebut ujar manawa nglatih model kasebut kanthi triliunan token, ujar manawa bisa nglatih model mutakhir nggunakake dataset umum lan ora ngandelake dataset sing ora bisa diakses.

LLaMA beda

Miturut Meta, latihan model kaya LLaMA mbutuhake daya komputasi sing sithik banget kanggo nyoba, validasi, lan njelajah kasus panggunaan anyar. Model basa dhasar nglatih ing pamblokiran gedhe saka data sing ora dilabeli, dadi cocog kanggo kustomisasi kanggo macem-macem tugas. 

newsletter inovasi
Aja kantun warta paling penting babagan inovasi. Mlebu kanggo nampa wong-wong mau liwat email.

Ing makalah riset, Meta nyathet yen LLaMA-13B ngluwihi OpenAI's GPT-3 (175B) ing umume benchmark lan LLaMA-65B kompetitif karo model paling dhuwur, Chinchilla70B dening DeepMindPaLM-540B saka Google

LLaMA saiki ora digunakake ing produk Meta ai, nanging perusahaan duwe rencana supaya kasedhiya kanggo peneliti. Perusahaan kasebut sadurunge ngluncurake LLM OPT-175B, nanging LLaMA minangka sistem sing paling maju. 

Perusahaan nggawe kasedhiya ing lisensi non-komersial sing fokus ing kasus panggunaan riset. Bakal kasedhiya kanggo peneliti akademik; sing afiliasi karo pemerintah, masyarakat sipil lan organisasi akademisi; lan laboratorium riset industri ing saindenging jagad.

Ercole Palmeri

newsletter inovasi
Aja kantun warta paling penting babagan inovasi. Mlebu kanggo nampa wong-wong mau liwat email.

Artikel anyar

Intervensi inovatif ing Augmented Reality, karo panampil Apple ing Poliklinik Catania

Operasi ophthalmoplasty nggunakake penampil komersial Apple Vision Pro ditindakake ing Poliklinik Catania…

3 May 2024

Keuntungan saka Mewarnai Kaca kanggo Bocah-bocah - jagad sihir kanggo kabeh umur

Ngembangake katrampilan motorik sing apik liwat pewarnaan nyiapake bocah kanggo katrampilan sing luwih rumit kaya nulis. Kanggo mewarnai…

2 May 2024

Masa Depan Iki: Kepiye Industri Pengiriman Revolusi Ekonomi Global

Sektor angkatan laut minangka kekuwatan ekonomi global sing sejatine, sing wis ngarahake pasar 150 milyar ...

1 May 2024

Penerbit lan OpenAI menehi tandha persetujuan kanggo ngatur aliran informasi sing diproses dening Artificial Intelligence

Senin kepungkur, Financial Times ngumumake kesepakatan karo OpenAI. FT menehi lisensi jurnalisme kelas donya…

30 April 2024