마크 저커버그 CEO는 페이스북 게시물에서 “오늘 우리는 연구원들이 연구를 발전시키는 데 도움이 되도록 설계된 LLaMA라는 새로운 최첨단 AI 대규모 언어 모델을 출시합니다.
큰 언어 모델이 기술 세계를 강타했습니다. 다음과 같은 인공 지능 도구를 지원합니다. ChatGPT 및 기타 대화형 모델. 그러나 이러한 도구를 사용하면 상당한 위험, 그럴듯하지만 잘못된 주장, 독성 콘텐츠 생성, AI 교육 데이터에 뿌리를 둔 편향 모방이 수반됩니다.
연구자들이 이러한 문제를 해결할 수 있도록 25월 XNUMX일 금요일 Meta 발매를 발표했다 라는 새로운 대규모 언어 모델의 LLaMA(Large Language Model 메타 AI) .
LLaMA는 채팅 봇,하지만 Metaai에 따르면 언어 모델과 관련된 문제를 해결할 검색 도구입니다. AI. Meta는 자신의 블로그에서 "LLaMA와 같은 더 작고 성능이 뛰어난 모델을 사용하면 많은 인프라에 액세스할 수 없는 연구 커뮤니티의 다른 사람들이 이러한 모델을 연구할 수 있으므로 이 중요하고 빠르게 발전하는 분야에서 액세스를 더욱 민주화할 수 있습니다."라고 말했습니다. 공식 .
LLaMA는 7B에서 65B 매개변수 범위의 언어 모델 모음입니다. 이 회사는 공개 데이터 세트를 사용하여 최첨단 모델을 훈련할 수 있고 독점적이고 액세스할 수 없는 데이터 세트에 의존하지 않고 수조 개의 토큰으로 모델을 훈련한다고 말했습니다.
Meta에 따르면 LLaMA와 같은 모델 교육에는 새로운 사용 사례를 테스트, 검증 및 탐색하는 데 컴퓨팅 성능이 거의 필요하지 않습니다. 기본 언어 모델은 레이블이 지정되지 않은 대규모 데이터 블록에서 학습하므로 다양한 작업에 대한 사용자 지정에 적합합니다.
Meta는 연구 논문에서 LLaMA-13B가 대부분의 벤치마크에서 OpenAI의 GPT-3(175B)보다 성능이 뛰어났으며 LLaMA-65B는 상위 모델과 경쟁력이 있다고 언급했습니다. DeepMind의 Chinchilla70B e Google의 PaLM-540B.
LLaMA는 현재 Meta ai 제품에서 사용되지 않지만 회사는 연구원들이 사용할 수 있도록 할 계획입니다. 이 회사는 이전에 LLM OPT-175B를 출시했지만 LLaMA는 가장 진보된 시스템입니다.
이 회사는 연구 사용 사례에 초점을 맞춘 비상업적 라이선스로 사용할 수 있도록 하고 있습니다. 학술 연구원이 사용할 수 있습니다. 정부, 시민 사회 및 학술 단체와 관련된 사람들; 및 전 세계의 산업 연구 실험실.
Ercole Palmeri
색칠을 통해 소근육 운동 능력을 키우면 아이들이 글쓰기와 같은 보다 복잡한 기술을 준비할 수 있습니다. 색칠하다…
지난 월요일, Financial Times는 OpenAI와의 계약을 발표했습니다. FT는 세계적 수준의 저널리즘에 라이선스를 부여합니다…
수백만 명의 사람들이 스트리밍 서비스 비용을 지불하고 월간 구독료를 지불합니다. 당신은…