товары

Meta запускает модель LLaMA, более мощный инструмент поиска, чем OpenAI GPT-3.

Meta недавно выпустила новый генератор языка ИИ под названием LLaMA, подтверждая роль высоко инновационной компании.

«Сегодня мы выпускаем новую, передовую крупноязыковую модель ИИ под названием LLaMA, призванную помочь исследователям продвигать свою работу», — заявил генеральный директор Марк Цукерберг в сообщении на Facebook.

Почему LLaMA

Большие языковые модели штурмом захватили мир технологий. Они приводят в действие инструменты искусственного интеллекта, такие как ChatGPT и другие разговорные модели. Однако использование этих инструментов сопряжено со значительным риском, правдоподобными, но ложными утверждениями, созданием токсичного контента и имитацией предвзятости, основанной на данных обучения ИИ.

Чтобы помочь исследователям решить эти проблемы, в пятницу, 25 февраля, Meta объявил о выпуске новой большой языковой модели под названием ЛЛАМА (Large Language Model Мета ИИ) .

Что такое ЛАМА?

LLaMA не является Chatbot, но это инструмент поиска, который, по мнению Meta ai, решит проблемы, связанные с языковыми моделями. AI. «Меньшие, более эффективные модели, такие как LLaMA, позволяют другим членам исследовательского сообщества, у которых нет доступа к большому объему инфраструктуры, изучать эти модели, еще больше демократизируя доступ в этой важной и быстро развивающейся области», — сказал Мета в своем блоге. официальный .

LLaMA — это набор языковых моделей с параметрами от 7 до 65 миллиардов. Компания заявила, что обучает свои модели на триллионах токенов, заявив, что она может обучать передовые модели, используя общедоступные наборы данных, а не полагаться на проприетарные, недоступные наборы данных.

LLaMA отличается

По словам Меты, обучение модели, такое как LLaMA, требует очень мало вычислительной мощности для тестирования, проверки и изучения новых вариантов использования. Базовые языковые модели обучаются на больших блоках неразмеченных данных, что делает их идеальными для адаптации к различным задачам.

В своей исследовательской работе Мета отметил, что LLaMA-13B превзошел OpenAI GPT-3 (175B) в большинстве тестов, а LLaMA-65B конкурирует с топовыми моделями. Chinchilla70B от DeepMind e PaLM-540B от Google.

В настоящее время LLaMA не используется ни в одном из продуктов Meta ai, однако компания планирует сделать его доступным для исследователей. Ранее компания выпустила LLM OPT-175B, но LLaMA — ее самая передовая система.

Компания делает его доступным по некоммерческой лицензии, ориентированной на исследовательские варианты использования. Он будет доступен академическим исследователям; лица, связанные с правительством, гражданским обществом и академическими организациями; и промышленных исследовательских лабораторий по всему миру.

Ercole Palmeri