«Сегодня мы выпускаем новую, передовую крупноязыковую модель ИИ под названием LLaMA, призванную помочь исследователям продвигать свою работу», — заявил генеральный директор Марк Цукерберг в сообщении на Facebook.
Большие языковые модели штурмом захватили мир технологий. Они приводят в действие инструменты искусственного интеллекта, такие как ChatGPT и другие разговорные модели. Однако использование этих инструментов сопряжено со значительным риском, правдоподобными, но ложными утверждениями, созданием токсичного контента и имитацией предвзятости, основанной на данных обучения ИИ.
Чтобы помочь исследователям решить эти проблемы, в пятницу, 25 февраля, Meta объявил о выпуске новой большой языковой модели под названием ЛЛАМА (Large Language Model Мета ИИ) .
LLaMA не является Chatbot, но это инструмент поиска, который, по мнению Meta ai, решит проблемы, связанные с языковыми моделями. AI. «Меньшие, более эффективные модели, такие как LLaMA, позволяют другим членам исследовательского сообщества, у которых нет доступа к большому объему инфраструктуры, изучать эти модели, еще больше демократизируя доступ в этой важной и быстро развивающейся области», — сказал Мета в своем блоге. официальный .
LLaMA — это набор языковых моделей с параметрами от 7 до 65 миллиардов. Компания заявила, что обучает свои модели на триллионах токенов, заявив, что она может обучать передовые модели, используя общедоступные наборы данных, а не полагаться на проприетарные, недоступные наборы данных.
По словам Меты, обучение модели, такое как LLaMA, требует очень мало вычислительной мощности для тестирования, проверки и изучения новых вариантов использования. Базовые языковые модели обучаются на больших блоках неразмеченных данных, что делает их идеальными для адаптации к различным задачам.
В своей исследовательской работе Мета отметил, что LLaMA-13B превзошел OpenAI GPT-3 (175B) в большинстве тестов, а LLaMA-65B конкурирует с топовыми моделями. Chinchilla70B от DeepMind e PaLM-540B от Google.
В настоящее время LLaMA не используется ни в одном из продуктов Meta ai, однако компания планирует сделать его доступным для исследователей. Ранее компания выпустила LLM OPT-175B, но LLaMA — ее самая передовая система.
Компания делает его доступным по некоммерческой лицензии, ориентированной на исследовательские варианты использования. Он будет доступен академическим исследователям; лица, связанные с правительством, гражданским обществом и академическими организациями; и промышленных исследовательских лабораторий по всему миру.
Ercole Palmeri
Развитие мелкой моторики посредством раскрашивания готовит детей к более сложным навыкам, таким как письмо. Раскрасить…
Военно-морской сектор является настоящей глобальной экономической державой, которая достигла 150-миллиардного рынка...
В прошлый понедельник Financial Times объявила о сделке с OpenAI. FT лицензирует свою журналистику мирового уровня…
Миллионы людей платят за стриминговые сервисы, выплачивая ежемесячную абонентскую плату. Распространено мнение, что вы…