“Sot ne po nxjerrim një model të ri të gjuhës së madhe të AI të quajtur LLaMA, i krijuar për të ndihmuar studiuesit të avancojnë punën e tyre”, tha CEO Mark Zuckerberg në një postim në Facebook.
Modelet e mëdha të gjuhëve kanë pushtuar botën e teknologjisë. Ato fuqizojnë mjetet e inteligjencës artificiale, si p.sh Biseda GPT dhe modele të tjera të bisedës. Sidoqoftë, përdorimi i këtyre mjeteve vjen me rrezik të konsiderueshëm, pretendime të besueshme, por të rreme, gjenerimin e përmbajtjes toksike dhe imitimin e paragjykimeve të rrënjosura në të dhënat e trajnimit të AI.
Për të ndihmuar studiuesit në zgjidhjen e këtyre problemeve, të premten, më 25 shkurt, Meta njoftoi lirimin i një modeli të ri të madh gjuhësor të quajtur LLaMA (Large Language Model Meta AI) .
LLaMA nuk është një chatbot, por është një mjet kërkimi që sipas Meta ai do të zgjidhë probleme që lidhen me modelet gjuhësore AI. “Modele më të vogla dhe me performancë më të mirë si LLaMA u lejojnë të tjerëve në komunitetin e kërkimit, të cilëve u mungon aksesi në sasi të mëdha të infrastrukturës, të studiojnë këto modele, duke demokratizuar më tej aksesin në këtë fushë të rëndësishme dhe me zhvillim të shpejtë”, tha Meta në blogun e tij. zyrtar .
LLaMA është një koleksion i modeleve gjuhësore që variojnë nga parametrat 7B deri në 65B. Kompania tha se i trajnon modelet e saj me triliona argumente, duke thënë se mund të trajnojë modele më të avancuara duke përdorur grupe të dhënash publike dhe të mos mbështetet në grupe të dhënash të pronarit dhe të paarritshëm.
Sipas Metës, trajnimi i modeleve si LLaMA kërkon shumë pak fuqi kompjuterike për të testuar, vërtetuar dhe eksploruar raste të reja përdorimi. Modelet bazë të gjuhëve stërviten në blloqe të mëdha të dhënash të paetiketuara, duke i bërë ato ideale për personalizim për detyra të ndryshme.
Në punimin e tij kërkimor, Meta vuri në dukje se LLaMA-13B e tejkaloi GPT-3 (175B) të OpenAI në shumicën e standardeve dhe LLaMA-65B është konkurrues me modelet më të mira. Chinchilla70B nga DeepMind e PaLM-540B nga Google.
LLaMA nuk është aktualisht në përdorim në asnjë prej produkteve Meta ai, megjithatë, kompania ka plane për ta vënë atë në dispozicion të studiuesve. Kompania kishte lançuar tashmë LLM OPT-175B, por LLaMA është sistemi i saj më i avancuar.
Kompania po e vë atë në dispozicion nën një licencë jo-tregtare të fokusuar në rastet e përdorimit të kërkimit. Do të jetë në dispozicion të studiuesve akademikë; ata që janë të lidhur me qeverinë, shoqërinë civile dhe organizatat akademike; dhe laboratorët e kërkimit industrial në mbarë botën.
Ercole Palmeri
Një operacion oftalmoplastik duke përdorur shikuesin komercial Apple Vision Pro u krye në Poliklinikën Catania…
Zhvillimi i aftësive të shkëlqyera motorike përmes ngjyrosjes i përgatit fëmijët për aftësi më komplekse si shkrimi. Për të ngjyrosur…
Sektori detar është një fuqi e vërtetë ekonomike globale, e cila ka lundruar drejt një tregu prej 150 miliardë...
Të hënën e kaluar, Financial Times njoftoi një marrëveshje me OpenAI. FT licencon gazetarinë e saj të klasit botëror…