품목

Meta, OpenAI의 GPT-3보다 강력한 검색 도구인 LLaMA 모델 출시

Meta는 최근 LLaMA라는 새로운 AI 언어 생성기를 출시하여 매우 혁신적인 회사의 역할을 확인했습니다.

마크 저커버그 CEO는 페이스북 게시물에서 “오늘 우리는 연구원들이 연구를 발전시키는 데 도움이 되도록 설계된 LLaMA라는 새로운 최첨단 AI 대규모 언어 모델을 출시합니다.

라마를 선택해야 하는 이유

큰 언어 모델이 기술 세계를 강타했습니다. 다음과 같은 인공 지능 도구를 지원합니다. ChatGPT 및 기타 대화형 모델. 그러나 이러한 도구를 사용하면 상당한 위험, 그럴듯하지만 잘못된 주장, 독성 콘텐츠 생성, AI 교육 데이터에 뿌리를 둔 편향 모방이 수반됩니다. 

연구자들이 이러한 문제를 해결할 수 있도록 25월 XNUMX일 금요일 Meta  발매를 발표했다 라는 새로운 대규모 언어 모델의 LLaMA(Large Language Model 메타 AI) . 

라마가 무엇인가요?

LLaMA는 채팅 봇,하지만 Metaai에 따르면 언어 모델과 관련된 문제를 해결할 검색 도구입니다. AI. Meta는 자신의 블로그에서 "LLaMA와 같은 더 작고 성능이 뛰어난 모델을 사용하면 많은 인프라에 액세스할 수 없는 연구 커뮤니티의 다른 사람들이 이러한 모델을 연구할 수 있으므로 이 중요하고 빠르게 발전하는 분야에서 액세스를 더욱 민주화할 수 있습니다."라고 말했습니다. 공식 .

LLaMA는 7B에서 65B 매개변수 범위의 언어 모델 모음입니다. 이 회사는 공개 데이터 세트를 사용하여 최첨단 모델을 훈련할 수 있고 독점적이고 액세스할 수 없는 데이터 세트에 의존하지 않고 수조 개의 토큰으로 모델을 훈련한다고 말했습니다.

라마는 다르다

Meta에 따르면 LLaMA와 같은 모델 교육에는 새로운 사용 사례를 테스트, 검증 및 탐색하는 데 컴퓨팅 성능이 거의 필요하지 않습니다. 기본 언어 모델은 레이블이 지정되지 않은 대규모 데이터 블록에서 학습하므로 다양한 작업에 대한 사용자 지정에 적합합니다. 

혁신 뉴스레터
혁신에 관한 가장 중요한 뉴스를 놓치지 마세요. 이메일로 받으려면 가입하세요.

Meta는 연구 논문에서 LLaMA-13B가 대부분의 벤치마크에서 OpenAI의 GPT-3(175B)보다 성능이 뛰어났으며 LLaMA-65B는 상위 모델과 경쟁력이 있다고 언급했습니다. DeepMind의 Chinchilla70BGoogle의 PaLM-540B

LLaMA는 현재 Meta ai 제품에서 사용되지 않지만 회사는 연구원들이 사용할 수 있도록 할 계획입니다. 이 회사는 이전에 LLM OPT-175B를 출시했지만 LLaMA는 가장 진보된 시스템입니다. 

이 회사는 연구 사용 사례에 초점을 맞춘 비상업적 라이선스로 사용할 수 있도록 하고 있습니다. 학술 연구원이 사용할 수 있습니다. 정부, 시민 사회 및 학술 단체와 관련된 사람들; 및 전 세계의 산업 연구 실험실.

Ercole Palmeri

혁신 뉴스레터
혁신에 관한 가장 중요한 뉴스를 놓치지 마세요. 이메일로 받으려면 가입하세요.

최근 기사

어린이를 위한 컬러링 페이지의 장점 - 모든 연령대를 위한 마법의 세계

색칠을 통해 소근육 운동 능력을 키우면 아이들이 글쓰기와 같은 보다 복잡한 기술을 준비할 수 있습니다. 색칠하다…

2 월 2024

미래가 여기에 있습니다: 해운 산업이 글로벌 경제를 어떻게 혁신하고 있습니까?

해군 부문은 150억 시장을 향해 항해해온 진정한 글로벌 경제강국입니다.

1 월 2024

출판사와 OpenAI, 인공지능이 처리하는 정보의 흐름을 규제하기 위한 계약 체결

지난 월요일, Financial Times는 OpenAI와의 계약을 발표했습니다. FT는 세계적 수준의 저널리즘에 라이선스를 부여합니다…

4월 30 2024

온라인 결제: 스트리밍 서비스를 통해 영원히 결제하는 방법은 다음과 같습니다.

수백만 명의 사람들이 스트리밍 서비스 비용을 지불하고 월간 구독료를 지불합니다. 당신은…

4월 29 2024