Artikuj

Meta lançon modelin LLaMA, një mjet kërkimi më i fuqishëm se GPT-3 i OpenAI

Meta ka lëshuar së fundmi një gjenerator të ri të gjuhës AI të quajtur LLaMA, duke konfirmuar rolin e një kompanie shumë inovative.

“Sot ne po nxjerrim një model të ri të gjuhës së madhe të AI të quajtur LLaMA, i krijuar për të ndihmuar studiuesit të avancojnë punën e tyre”, tha CEO Mark Zuckerberg në një postim në Facebook.

Pse LLaMA

Modelet e mëdha të gjuhëve kanë pushtuar botën e teknologjisë. Ato fuqizojnë mjetet e inteligjencës artificiale, si p.sh Biseda GPT dhe modele të tjera të bisedës. Sidoqoftë, përdorimi i këtyre mjeteve vjen me rrezik të konsiderueshëm, pretendime të besueshme, por të rreme, gjenerimin e përmbajtjes toksike dhe imitimin e paragjykimeve të rrënjosura në të dhënat e trajnimit të AI. 

Për të ndihmuar studiuesit në zgjidhjen e këtyre problemeve, të premten, më 25 shkurt, Meta  njoftoi lirimin i një modeli të ri të madh gjuhësor të quajtur LLaMA (Large Language Model Meta AI) . 

Çfarë është LLaMA?

LLaMA nuk është një chatbot, por është një mjet kërkimi që sipas Meta ai do të zgjidhë probleme që lidhen me modelet gjuhësore AI. “Modele më të vogla dhe me performancë më të mirë si LLaMA u lejojnë të tjerëve në komunitetin e kërkimit, të cilëve u mungon aksesi në sasi të mëdha të infrastrukturës, të studiojnë këto modele, duke demokratizuar më tej aksesin në këtë fushë të rëndësishme dhe me zhvillim të shpejtë”, tha Meta në blogun e tij. zyrtar .

LLaMA është një koleksion i modeleve gjuhësore që variojnë nga parametrat 7B deri në 65B. Kompania tha se i trajnon modelet e saj me triliona argumente, duke thënë se mund të trajnojë modele më të avancuara duke përdorur grupe të dhënash publike dhe të mos mbështetet në grupe të dhënash të pronarit dhe të paarritshëm.

LLaMA është ndryshe

Sipas Metës, trajnimi i modeleve si LLaMA kërkon shumë pak fuqi kompjuterike për të testuar, vërtetuar dhe eksploruar raste të reja përdorimi. Modelet bazë të gjuhëve stërviten në blloqe të mëdha të dhënash të paetiketuara, duke i bërë ato ideale për personalizim për detyra të ndryshme. 

Buletini i inovacionit
Mos humbisni lajmet më të rëndësishme mbi inovacionin. Regjistrohuni për t'i marrë ato me email.

Në punimin e tij kërkimor, Meta vuri në dukje se LLaMA-13B e tejkaloi GPT-3 (175B) të OpenAI në shumicën e standardeve dhe LLaMA-65B është konkurrues me modelet më të mira. Chinchilla70B nga DeepMindPaLM-540B nga Google

LLaMA nuk është aktualisht në përdorim në asnjë prej produkteve Meta ai, megjithatë, kompania ka plane për ta vënë atë në dispozicion të studiuesve. Kompania kishte lançuar tashmë LLM OPT-175B, por LLaMA është sistemi i saj më i avancuar. 

Kompania po e vë atë në dispozicion nën një licencë jo-tregtare të fokusuar në rastet e përdorimit të kërkimit. Do të jetë në dispozicion të studiuesve akademikë; ata që janë të lidhur me qeverinë, shoqërinë civile dhe organizatat akademike; dhe laboratorët e kërkimit industrial në mbarë botën.

Ercole Palmeri

Buletini i inovacionit
Mos humbisni lajmet më të rëndësishme mbi inovacionin. Regjistrohuni për t'i marrë ato me email.

Artikujt e fundit

Ndërhyrje novatore në realitetin e shtuar, me një shikues Apple në Poliklinikën Catania

Një operacion oftalmoplastik duke përdorur shikuesin komercial Apple Vision Pro u krye në Poliklinikën Catania…

3 Maj 2024

Përfitimet e Faqeve të Ngjyrosjes për Fëmijë - një botë magjike për të gjitha moshat

Zhvillimi i aftësive të shkëlqyera motorike përmes ngjyrosjes i përgatit fëmijët për aftësi më komplekse si shkrimi. Për të ngjyrosur…

2 Maj 2024

E ardhmja është këtu: Si industria e transportit po revolucionarizon ekonominë globale

Sektori detar është një fuqi e vërtetë ekonomike globale, e cila ka lundruar drejt një tregu prej 150 miliardë...

1 Maj 2024

Botuesit dhe OpenAI nënshkruajnë marrëveshje për të rregulluar rrjedhën e informacionit të përpunuar nga Inteligjenca Artificiale

Të hënën e kaluar, Financial Times njoftoi një marrëveshje me OpenAI. FT licencon gazetarinë e saj të klasit botëror…

30 Prill 2024