用品

Meta 推出 LLaMA 模型,比 OpenAI 的 GPT-3 更強大的搜索工具

Meta 最近發布了一款名為 LLaMA 的新型 AI 語言生成器,證實了其高度創新公司的作用。

“今天我們發布了一種新的、尖端的人工智能大型語言模型,稱為 LLaMA,旨在幫助研究人員推進他們的工作,”首席執行官馬克扎克伯格在 Facebook 的帖子中說。

為什麼選擇美洲駝

大語言模型席捲了科技界。 它們為人工智能工具提供動力,例如 ChatGPT 和其他會話模型。 然而,使用這些工具會帶來巨大的風險、似是而非的虛假聲明、產生有毒內容以及模仿 AI 訓練數據中根深蒂固的偏見。 

為了幫助研究人員解決這些問題,25 月 XNUMX 日星期五,Meta  宣布發布 一個新的大型語言模型稱為 駱駝(Large Language Model 元人工智慧) . 

什麼是美洲駝?

LLaMA 不是 聊天機器人,但根據 Meta ai 的說法,它是一種搜索工具,將解決與語言模型相關的問題 AI. “像 LLaMA 這樣更小、性能更好的模型允許研究社區中無法訪問大量基礎設施的其他人來研究這些模型,進一步使這個重要且快速發展的領域的訪問民主化,”Meta 在他的博客中說 官方 .

LLaMA 是 7B 到 65B 參數的語言模型的集合。 該公司表示,它在數万億個代幣上訓練其模型,並表示它可以使用公共數據集訓練尖端模型,而不依賴於專有的、無法訪問的數據集。

LLaMA 是不同的

根據 Meta 的說法,像 LLaMA 這樣的模型訓練需要很少的計算能力來測試、驗證和探索新的用例。 基本語言模型在大塊未標記數據上進行訓練,使其成為定制各種任務的理想選擇。 

創新通訊
不要錯過有關創新的最重要新聞。 註冊以通過電子郵件接收它們。

Meta 在他的研究論文中指出,LLaMA-13B 在大多數基準測試中都優於 OpenAI 的 GPT-3 (175B),而 LLaMA-65B 與頂級模型具有競爭力, DeepMind 的 Chinchilla70B來自 Google 的 PaLM-540B

LLaMA 目前未在任何 Meta ai 產品上使用,但是,該公司計劃將其提供給研究人員。 該公司此前推出了 LLM OPT-175B,但 LLaMA 是其最先進的系統。 

該公司根據專注於研究用例的非商業許可提供它。 它將提供給學術研究人員; 隸屬於政府、民間社會和學術組織的機構; 和世界各地的工業研究實驗室。

Ercole Palmeri

創新通訊
不要錯過有關創新的最重要新聞。 註冊以通過電子郵件接收它們。

最近的文章

兒童著色頁的好處 - 適合所有年齡層的魔法世界

透過著色培養精細運動技能可以幫助孩子為寫作等更複雜的技能做好準備。填色…

2五月2024

未來已來:航運業如何徹底改變全球經濟

海軍部門是真正的全球經濟力量,已邁向 150 億美元的市場…

1五月2024

出版商與 OpenAI 簽署協議以規範人工智慧處理的資訊流

上週一,英國《金融時報》宣布與 OpenAI 達成協議。英國《金融時報》授予其世界級新聞報道許可…

30月2024

線上支付:串流服務如何讓您永遠付款

數百萬人為串流媒體服務付費,每月支付訂閱費用。人們普遍認為您...

29月2024