ਲੇਖ

ਮੈਟਾ ਨੇ LLaMA ਮਾਡਲ ਲਾਂਚ ਕੀਤਾ, OpenAI ਦੇ GPT-3 ਨਾਲੋਂ ਵਧੇਰੇ ਸ਼ਕਤੀਸ਼ਾਲੀ ਖੋਜ ਸਾਧਨ

ਮੈਟਾ ਨੇ ਹਾਲ ਹੀ ਵਿੱਚ LLaMA ਨਾਮਕ ਇੱਕ ਨਵਾਂ AI ਭਾਸ਼ਾ ਜਨਰੇਟਰ ਜਾਰੀ ਕੀਤਾ ਹੈ, ਇੱਕ ਉੱਚ ਨਵੀਨਤਾਕਾਰੀ ਕੰਪਨੀ ਦੀ ਭੂਮਿਕਾ ਦੀ ਪੁਸ਼ਟੀ ਕਰਦਾ ਹੈ।

ਸੀਈਓ ਮਾਰਕ ਜ਼ੁਕਰਬਰਗ ਨੇ ਇੱਕ ਫੇਸਬੁੱਕ ਪੋਸਟ ਵਿੱਚ ਕਿਹਾ, "ਅੱਜ ਅਸੀਂ ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਉਹਨਾਂ ਦੇ ਕੰਮ ਨੂੰ ਅੱਗੇ ਵਧਾਉਣ ਵਿੱਚ ਮਦਦ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ LLaMA ਨਾਮਕ ਇੱਕ ਨਵਾਂ, ਆਧੁਨਿਕ AI ਵਿਸ਼ਾਲ ਭਾਸ਼ਾ ਮਾਡਲ ਜਾਰੀ ਕਰ ਰਹੇ ਹਾਂ।"

ਕਿਉਂ ਲਾਮਾ

ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਨੇ ਤੂਫਾਨ ਦੁਆਰਾ ਤਕਨੀਕੀ ਸੰਸਾਰ ਨੂੰ ਲਿਆ ਹੈ. ਉਹ ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ ਟੂਲਸ ਨੂੰ ਪਾਵਰ ਦਿੰਦੇ ਹਨ, ਜਿਵੇਂ ਕਿ ਚੈਟਜੀਪੀਟੀ ਅਤੇ ਹੋਰ ਗੱਲਬਾਤ ਮਾਡਲ। ਹਾਲਾਂਕਿ, ਇਹਨਾਂ ਸਾਧਨਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨ ਨਾਲ ਮਹੱਤਵਪੂਰਨ ਜੋਖਮ, ਪ੍ਰਸ਼ੰਸਾਯੋਗ ਪਰ ਝੂਠੇ ਦਾਅਵਿਆਂ, ਜ਼ਹਿਰੀਲੀ ਸਮੱਗਰੀ ਪੈਦਾ ਕਰਨਾ, ਅਤੇ AI ਸਿਖਲਾਈ ਡੇਟਾ ਵਿੱਚ ਜੜ੍ਹਾਂ ਵਾਲੇ ਪੱਖਪਾਤ ਦੀ ਨਕਲ ਕਰਨਾ ਆਉਂਦਾ ਹੈ।

ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਇਹਨਾਂ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਹੱਲ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਨ ਲਈ, ਸ਼ੁੱਕਰਵਾਰ, 25 ਫਰਵਰੀ ਨੂੰ ਮੈਟਾ ਜਾਰੀ ਕਰਨ ਦਾ ਐਲਾਨ ਕੀਤਾ ਇੱਕ ਨਵੇਂ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲ ਦਾ ਜਿਸਨੂੰ ਕਿਹਾ ਜਾਂਦਾ ਹੈ ਲਾਮਾ (Large Language Model ਮੈਟਾ AI) .

LLaMA ਕੀ ਹੈ?

LLaMA ਇੱਕ ਨਹੀਂ ਹੈ ਚੈਟਬੋਟ, ਪਰ ਇਹ ਇੱਕ ਖੋਜ ਟੂਲ ਹੈ ਜੋ, ਮੈਟਾ ਏਆਈ ਦੇ ਅਨੁਸਾਰ, ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਨਾਲ ਸਬੰਧਤ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਹੱਲ ਕਰੇਗਾ AI. ਮੈਟਾ ਨੇ ਆਪਣੇ ਬਲੌਗ ਵਿੱਚ ਕਿਹਾ, "ਛੋਟੇ, ਬਿਹਤਰ ਪ੍ਰਦਰਸ਼ਨ ਕਰਨ ਵਾਲੇ ਮਾਡਲ ਜਿਵੇਂ ਕਿ LLaMA ਖੋਜ ਭਾਈਚਾਰੇ ਵਿੱਚ ਦੂਜਿਆਂ ਨੂੰ ਇਹਨਾਂ ਮਾਡਲਾਂ ਦਾ ਅਧਿਐਨ ਕਰਨ ਲਈ ਵੱਡੀ ਮਾਤਰਾ ਵਿੱਚ ਬੁਨਿਆਦੀ ਢਾਂਚੇ ਤੱਕ ਪਹੁੰਚ ਦੀ ਘਾਟ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦੇ ਹਨ, ਇਸ ਮਹੱਤਵਪੂਰਨ ਅਤੇ ਤੇਜ਼ੀ ਨਾਲ ਵਿਕਸਤ ਹੋ ਰਹੇ ਖੇਤਰ ਵਿੱਚ ਪਹੁੰਚ ਨੂੰ ਹੋਰ ਲੋਕਤੰਤਰੀਕਰਨ ਕਰਦੇ ਹਨ," ਮੇਟਾ ਨੇ ਆਪਣੇ ਬਲੌਗ ਵਿੱਚ ਕਿਹਾ. ਅਧਿਕਾਰੀ .

LLaMA 7B ਤੋਂ 65B ਪੈਰਾਮੀਟਰਾਂ ਤੱਕ ਦੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਦਾ ਸੰਗ੍ਰਹਿ ਹੈ। ਕੰਪਨੀ ਨੇ ਕਿਹਾ ਕਿ ਉਹ ਆਪਣੇ ਮਾਡਲਾਂ ਨੂੰ ਖਰਬਾਂ ਟੋਕਨਾਂ 'ਤੇ ਸਿਖਲਾਈ ਦਿੰਦੀ ਹੈ, ਇਹ ਕਹਿੰਦੇ ਹੋਏ ਕਿ ਇਹ ਜਨਤਕ ਡੇਟਾਸੈਟਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਅਤਿ ਆਧੁਨਿਕ ਮਾਡਲਾਂ ਨੂੰ ਸਿਖਲਾਈ ਦੇ ਸਕਦੀ ਹੈ ਅਤੇ ਮਲਕੀਅਤ, ਪਹੁੰਚਯੋਗ ਡੇਟਾਸੈਟਾਂ 'ਤੇ ਭਰੋਸਾ ਨਹੀਂ ਕਰਦੀ ਹੈ।

ਲਾਮਾ ਵੱਖਰਾ ਹੈ

ਮੈਟਾ ਦੇ ਅਨੁਸਾਰ, LLaMA ਵਰਗੀ ਮਾਡਲ ਸਿਖਲਾਈ ਨੂੰ ਨਵੇਂ ਵਰਤੋਂ ਦੇ ਮਾਮਲਿਆਂ ਦੀ ਜਾਂਚ, ਪ੍ਰਮਾਣਿਤ ਕਰਨ ਅਤੇ ਖੋਜ ਕਰਨ ਲਈ ਬਹੁਤ ਘੱਟ ਕੰਪਿਊਟਿੰਗ ਸ਼ਕਤੀ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਮੂਲ ਭਾਸ਼ਾ ਮਾਡਲ ਬਿਨਾਂ ਲੇਬਲ ਕੀਤੇ ਡੇਟਾ ਦੇ ਵੱਡੇ ਬਲਾਕਾਂ 'ਤੇ ਸਿਖਲਾਈ ਦਿੰਦੇ ਹਨ, ਉਹਨਾਂ ਨੂੰ ਵੱਖ-ਵੱਖ ਕੰਮਾਂ ਲਈ ਅਨੁਕੂਲਿਤ ਕਰਨ ਲਈ ਆਦਰਸ਼ ਬਣਾਉਂਦੇ ਹਨ।

ਆਪਣੇ ਖੋਜ ਪੱਤਰ ਵਿੱਚ, ਮੈਟਾ ਨੇ ਨੋਟ ਕੀਤਾ ਕਿ LLaMA-13B ਨੇ ਜ਼ਿਆਦਾਤਰ ਬੈਂਚਮਾਰਕਾਂ 'ਤੇ OpenAI ਦੇ GPT-3 (175B) ਨੂੰ ਪਛਾੜ ਦਿੱਤਾ ਹੈ ਅਤੇ LLaMA-65B ਚੋਟੀ ਦੇ ਮਾਡਲਾਂ ਨਾਲ ਮੁਕਾਬਲੇਬਾਜ਼ ਹੈ, DeepMind ਦੁਆਰਾ Chinchilla70B e Google ਤੋਂ PaLM-540B.

LLaMA ਵਰਤਮਾਨ ਵਿੱਚ ਕਿਸੇ ਵੀ Meta ai ਉਤਪਾਦਾਂ 'ਤੇ ਵਰਤੋਂ ਵਿੱਚ ਨਹੀਂ ਹੈ, ਹਾਲਾਂਕਿ, ਕੰਪਨੀ ਦੀ ਇਸ ਨੂੰ ਖੋਜਕਰਤਾਵਾਂ ਲਈ ਉਪਲਬਧ ਕਰਾਉਣ ਦੀ ਯੋਜਨਾ ਹੈ। ਕੰਪਨੀ ਨੇ ਪਹਿਲਾਂ ਆਪਣਾ LLM OPT-175B ਲਾਂਚ ਕੀਤਾ ਸੀ, ਪਰ LLaMA ਇਸਦਾ ਸਭ ਤੋਂ ਉੱਨਤ ਸਿਸਟਮ ਹੈ।

ਕੰਪਨੀ ਇਸ ਨੂੰ ਖੋਜ ਵਰਤੋਂ ਦੇ ਮਾਮਲਿਆਂ 'ਤੇ ਕੇਂਦ੍ਰਿਤ ਗੈਰ-ਵਪਾਰਕ ਲਾਇਸੈਂਸ ਦੇ ਤਹਿਤ ਉਪਲਬਧ ਕਰਵਾ ਰਹੀ ਹੈ। ਇਹ ਅਕਾਦਮਿਕ ਖੋਜਕਰਤਾਵਾਂ ਲਈ ਉਪਲਬਧ ਹੋਵੇਗਾ; ਜਿਹੜੇ ਸਰਕਾਰ, ਸਿਵਲ ਸੁਸਾਇਟੀ ਅਤੇ ਅਕਾਦਮਿਕ ਸੰਸਥਾਵਾਂ ਨਾਲ ਜੁੜੇ ਹੋਏ ਹਨ; ਅਤੇ ਸੰਸਾਰ ਭਰ ਵਿੱਚ ਉਦਯੋਗਿਕ ਖੋਜ ਪ੍ਰਯੋਗਸ਼ਾਲਾਵਾਂ।

Ercole Palmeri