Artikuj

Meta lançon modelin LLaMA, një mjet kërkimi më i fuqishëm se GPT-3 i OpenAI

Meta ka lëshuar së fundmi një gjenerator të ri të gjuhës AI të quajtur LLaMA, duke konfirmuar rolin e një kompanie shumë inovative.

“Sot ne po nxjerrim një model të ri të gjuhës së madhe të AI të quajtur LLaMA, i krijuar për të ndihmuar studiuesit të avancojnë punën e tyre”, tha CEO Mark Zuckerberg në një postim në Facebook.

Pse LLaMA

Modelet e mëdha të gjuhëve kanë pushtuar botën e teknologjisë. Ato fuqizojnë mjetet e inteligjencës artificiale, si p.sh Biseda GPT dhe modele të tjera të bisedës. Sidoqoftë, përdorimi i këtyre mjeteve vjen me rrezik të konsiderueshëm, pretendime të besueshme, por të rreme, gjenerimin e përmbajtjes toksike dhe imitimin e paragjykimeve të rrënjosura në të dhënat e trajnimit të AI.

Për të ndihmuar studiuesit në zgjidhjen e këtyre problemeve, të premten, më 25 shkurt, Meta njoftoi lirimin i një modeli të ri të madh gjuhësor të quajtur LLaMA (Large Language Model Meta AI) .

Çfarë është LLaMA?

LLaMA nuk është një chatbot, por është një mjet kërkimi që sipas Meta ai do të zgjidhë probleme që lidhen me modelet gjuhësore AI. “Modele më të vogla dhe me performancë më të mirë si LLaMA u lejojnë të tjerëve në komunitetin e kërkimit, të cilëve u mungon aksesi në sasi të mëdha të infrastrukturës, të studiojnë këto modele, duke demokratizuar më tej aksesin në këtë fushë të rëndësishme dhe me zhvillim të shpejtë”, tha Meta në blogun e tij. zyrtar .

LLaMA është një koleksion i modeleve gjuhësore që variojnë nga parametrat 7B deri në 65B. Kompania tha se i trajnon modelet e saj me triliona argumente, duke thënë se mund të trajnojë modele më të avancuara duke përdorur grupe të dhënash publike dhe të mos mbështetet në grupe të dhënash të pronarit dhe të paarritshëm.

LLaMA është ndryshe

Sipas Metës, trajnimi i modeleve si LLaMA kërkon shumë pak fuqi kompjuterike për të testuar, vërtetuar dhe eksploruar raste të reja përdorimi. Modelet bazë të gjuhëve stërviten në blloqe të mëdha të dhënash të paetiketuara, duke i bërë ato ideale për personalizim për detyra të ndryshme.

Në punimin e tij kërkimor, Meta vuri në dukje se LLaMA-13B e tejkaloi GPT-3 (175B) të OpenAI në shumicën e standardeve dhe LLaMA-65B është konkurrues me modelet më të mira. Chinchilla70B nga DeepMind e PaLM-540B nga Google.

LLaMA nuk është aktualisht në përdorim në asnjë prej produkteve Meta ai, megjithatë, kompania ka plane për ta vënë atë në dispozicion të studiuesve. Kompania kishte lançuar tashmë LLM OPT-175B, por LLaMA është sistemi i saj më i avancuar.

Kompania po e vë atë në dispozicion nën një licencë jo-tregtare të fokusuar në rastet e përdorimit të kërkimit. Do të jetë në dispozicion të studiuesve akademikë; ata që janë të lidhur me qeverinë, shoqërinë civile dhe organizatat akademike; dhe laboratorët e kërkimit industrial në mbarë botën.

Ercole Palmeri