Články

Meta spouští model LLaMA, výkonnější vyhledávací nástroj než OpenAI GPT-3

Meta nedávno vydala nový generátor jazyků AI nazvaný LLaMA, který potvrzuje roli vysoce inovativní společnosti.

„Dnes vydáváme nový, špičkový model velkého jazyka umělé inteligence nazvaný LLaMA navržený tak, aby pomohl výzkumníkům pokročit v jejich práci,“ uvedl generální ředitel Mark Zuckerberg na Facebooku.

Proč LLaMA

Velké jazykové modely vzaly technologický svět útokem. Pohánějí nástroje umělé inteligence, jako např ChatGPT a další konverzační modely. Používání těchto nástrojů však přináší značné riziko, věrohodná, ale nepravdivá tvrzení, generování toxického obsahu a napodobování zkreslení zakořeněných v datech školení AI.

Aby výzkumníci pomohli vyřešit tyto problémy, v pátek 25. února Meta oznámil vydání nového velkého jazykového modelu tzv LLaMA (Large Language Model Meta AI) .

Co je LLaMA?

LLaMA není a chatbot, ale je to vyhledávací nástroj, který podle Meta ai vyřeší problémy související s jazykovými modely AI. „Menší a výkonnější modely, jako je LLaMA, umožňují ostatním ve výzkumné komunitě, kteří nemají přístup k velkému množství infrastruktury, studovat tyto modely, čímž dále demokratizují přístup v této důležité a rychle se vyvíjející oblasti,“ uvedl Meta na svém blogu. oficiální .

LLaMA je sbírka jazykových modelů s parametry od 7B do 65B. Společnost uvedla, že své modely trénuje na bilionech tokenů a uvedla, že může trénovat špičkové modely pomocí veřejných datových sad a nespoléhat se na proprietární, nedostupné datové sady.

LLaMA je jiná

Podle Meta vyžaduje školení modelů, jako je LLaMA, velmi malý výpočetní výkon k testování, ověřování a zkoumání nových případů použití. Základní jazykové modely trénují na velkých blocích neoznačených dat, takže jsou ideální pro přizpůsobení různým úkolům.

Meta ve své výzkumné práci poznamenal, že LLaMA-13B překonala OpenAI GPT-3 (175B) ve většině benchmarků a LLaMA-65B je konkurenceschopná se špičkovými modely, Chinchilla70B od DeepMind e PaLM-540B od společnosti Google.

LLaMA se v současné době nepoužívá na žádném z produktů Meta ai, nicméně společnost má v plánu ji zpřístupnit výzkumníkům. Společnost již uvedla na trh svůj LLM OPT-175B, ale LLaMA je její nejpokročilejší systém.

Společnost jej zpřístupňuje pod nekomerční licencí zaměřenou na případy použití ve výzkumu. Bude k dispozici akademickým výzkumníkům; ti, kteří jsou přidruženi k vládě, občanské společnosti a akademickým organizacím; a průmyslové výzkumné laboratoře po celém světě.

Ercole Palmeri