Články

Meta spouští model LLaMA, výkonnější vyhledávací nástroj než OpenAI GPT-3

Meta nedávno vydala nový generátor jazyků AI nazvaný LLaMA, který potvrzuje roli vysoce inovativní společnosti.

„Dnes vydáváme nový, špičkový model velkého jazyka umělé inteligence nazvaný LLaMA navržený tak, aby pomohl výzkumníkům pokročit v jejich práci,“ uvedl generální ředitel Mark Zuckerberg na Facebooku.

Proč LLaMA

Velké jazykové modely vzaly technologický svět útokem. Pohánějí nástroje umělé inteligence, jako např ChatGPT a další konverzační modely. Používání těchto nástrojů však přináší značné riziko, věrohodná, ale nepravdivá tvrzení, generování toxického obsahu a napodobování zkreslení zakořeněných v datech školení AI. 

Aby výzkumníci pomohli vyřešit tyto problémy, v pátek 25. února Meta  oznámil vydání nového velkého jazykového modelu tzv LLaMA (Large Language Model Meta AI) . 

Co je LLaMA?

LLaMA není a chatbot, ale je to vyhledávací nástroj, který podle Meta ai vyřeší problémy související s jazykovými modely AI. „Menší a výkonnější modely, jako je LLaMA, umožňují ostatním ve výzkumné komunitě, kteří nemají přístup k velkému množství infrastruktury, studovat tyto modely, čímž dále demokratizují přístup v této důležité a rychle se vyvíjející oblasti,“ uvedl Meta na svém blogu. oficiální .

LLaMA je sbírka jazykových modelů s parametry od 7B do 65B. Společnost uvedla, že své modely trénuje na bilionech tokenů a uvedla, že může trénovat špičkové modely pomocí veřejných datových sad a nespoléhat se na proprietární, nedostupné datové sady.

LLaMA je jiná

Podle Meta vyžaduje školení modelů, jako je LLaMA, velmi malý výpočetní výkon k testování, ověřování a zkoumání nových případů použití. Základní jazykové modely trénují na velkých blocích neoznačených dat, takže jsou ideální pro přizpůsobení různým úkolům. 

Inovační zpravodaj
Nenechte si ujít nejdůležitější novinky o inovacích. Přihlaste se k jejich odběru e-mailem.

Meta ve své výzkumné práci poznamenal, že LLaMA-13B překonala OpenAI GPT-3 (175B) ve většině benchmarků a LLaMA-65B je konkurenceschopná se špičkovými modely, Chinchilla70B od DeepMindPaLM-540B od společnosti Google

LLaMA se v současné době nepoužívá na žádném z produktů Meta ai, nicméně společnost má v plánu ji zpřístupnit výzkumníkům. Společnost již uvedla na trh svůj LLM OPT-175B, ale LLaMA je její nejpokročilejší systém. 

Společnost jej zpřístupňuje pod nekomerční licencí zaměřenou na případy použití ve výzkumu. Bude k dispozici akademickým výzkumníkům; ti, kteří jsou přidruženi k vládě, občanské společnosti a akademickým organizacím; a průmyslové výzkumné laboratoře po celém světě.

Ercole Palmeri

Inovační zpravodaj
Nenechte si ujít nejdůležitější novinky o inovacích. Přihlaste se k jejich odběru e-mailem.

Nedávné články

Výhody omalovánek pro děti - svět kouzel pro všechny věkové kategorie

Rozvíjení jemné motoriky prostřednictvím vybarvování připravuje děti na složitější dovednosti, jako je psaní. Barvit…

2. května 2024

Budoucnost je tady: Jak lodní průmysl revolucionizuje globální ekonomiku

Námořní sektor je skutečnou globální ekonomickou velmocí, která se dostala na 150miliardový trh...

1. května 2024

Vydavatelé a OpenAI podepisují dohody o regulaci toku informací zpracovávaných umělou inteligencí

Minulé pondělí Financial Times oznámily dohodu s OpenAI. FT licencuje svou prvotřídní žurnalistiku…

30. dubna 2024

Online platby: Zde je návod, jak vám streamovací služby umožňují platit navždy

Miliony lidí platí za streamovací služby a platí měsíční předplatné. Je obecný názor, že jste…

29. dubna 2024