„Dnes vydáváme nový, špičkový model velkého jazyka umělé inteligence nazvaný LLaMA navržený tak, aby pomohl výzkumníkům pokročit v jejich práci,“ uvedl generální ředitel Mark Zuckerberg na Facebooku.
Velké jazykové modely vzaly technologický svět útokem. Pohánějí nástroje umělé inteligence, jako např ChatGPT a další konverzační modely. Používání těchto nástrojů však přináší značné riziko, věrohodná, ale nepravdivá tvrzení, generování toxického obsahu a napodobování zkreslení zakořeněných v datech školení AI.
Aby výzkumníci pomohli vyřešit tyto problémy, v pátek 25. února Meta oznámil vydání nového velkého jazykového modelu tzv LLaMA (Large Language Model Meta AI) .
LLaMA není a chatbot, ale je to vyhledávací nástroj, který podle Meta ai vyřeší problémy související s jazykovými modely AI. „Menší a výkonnější modely, jako je LLaMA, umožňují ostatním ve výzkumné komunitě, kteří nemají přístup k velkému množství infrastruktury, studovat tyto modely, čímž dále demokratizují přístup v této důležité a rychle se vyvíjející oblasti,“ uvedl Meta na svém blogu. oficiální .
LLaMA je sbírka jazykových modelů s parametry od 7B do 65B. Společnost uvedla, že své modely trénuje na bilionech tokenů a uvedla, že může trénovat špičkové modely pomocí veřejných datových sad a nespoléhat se na proprietární, nedostupné datové sady.
Podle Meta vyžaduje školení modelů, jako je LLaMA, velmi malý výpočetní výkon k testování, ověřování a zkoumání nových případů použití. Základní jazykové modely trénují na velkých blocích neoznačených dat, takže jsou ideální pro přizpůsobení různým úkolům.
Meta ve své výzkumné práci poznamenal, že LLaMA-13B překonala OpenAI GPT-3 (175B) ve většině benchmarků a LLaMA-65B je konkurenceschopná se špičkovými modely, Chinchilla70B od DeepMind e PaLM-540B od společnosti Google.
LLaMA se v současné době nepoužívá na žádném z produktů Meta ai, nicméně společnost má v plánu ji zpřístupnit výzkumníkům. Společnost již uvedla na trh svůj LLM OPT-175B, ale LLaMA je její nejpokročilejší systém.
Společnost jej zpřístupňuje pod nekomerční licencí zaměřenou na případy použití ve výzkumu. Bude k dispozici akademickým výzkumníkům; ti, kteří jsou přidruženi k vládě, občanské společnosti a akademickým organizacím; a průmyslové výzkumné laboratoře po celém světě.
Ercole Palmeri
Rozvíjení jemné motoriky prostřednictvím vybarvování připravuje děti na složitější dovednosti, jako je psaní. Barvit…
Námořní sektor je skutečnou globální ekonomickou velmocí, která se dostala na 150miliardový trh...
Minulé pondělí Financial Times oznámily dohodu s OpenAI. FT licencuje svou prvotřídní žurnalistiku…
Miliony lidí platí za streamovací služby a platí měsíční předplatné. Je obecný názor, že jste…