مقالات

GPT4 بمقابلہ ChatGPT: اسان تجزيو ڪيو تربيتي طريقن، ڪارڪردگي، صلاحيتون ۽ حدون

نئين نسلي ٻولي ماڊل جي توقع ڪئي وئي آهي ته مڪمل طور تي پوري صنعتن کي تبديل ڪري، بشمول ميڊيا، تعليم، قانون ۽ ٽيڪنالاجي.

تازن مهينن ۾، جنهن رفتار سان جديد وڏي ٻولي جا ماڊل جاري ڪيا ويا آهن، حيرت انگيز آهي. هن آرٽيڪل ۾، اسين GPT4 بمقابله ChatGPT جي وچ ۾ بنيادي هڪجهڙائي ۽ فرق کي ڍڪينداسين، بشمول تربيتي طريقا، ڪارڪردگي، صلاحيتون ۽ حدون.

مواد انڊيڪس

GPT4 بمقابلہ چيٽ GPT: تربيت جي طريقن ۾ هڪجهڙائي ۽ اختلاف

GPT4 ۽ ChatGPT GPT ماڊلز جي پراڻن ورزن تي ٺھيل آھن ماڊل آرڪيٽيڪچر کي بھتر ڪرڻ سان، وڌيڪ نفيس تربيتي طريقا استعمال ڪندي، ۽ ٽريننگ پيرا ميٽرن جي وڏي تعداد سان.

ٻئي ڊزائينز ٽرانسفارمر آرڪيٽيڪچر تي ٻڌل آهن، جيڪي ان پٽ جي ترتيبن کي پروسيس ڪرڻ لاءِ انڪوڊر استعمال ڪن ٿا ۽ آئوٽ پُٽ جي ترتيبن کي پيدا ڪرڻ لاءِ ڊيڪوڊر. انڪوڊر ۽ ڊيڪوڊر هڪ ميکانيزم سان ڳنڍيل آهن، جيڪا ڊيڪوڊر کي سڀ کان اهم ان پٽ جي ترتيبن تي وڌيڪ ڌيان ڏيڻ جي اجازت ڏئي ٿي.

GPT4 ٽيڪنيڪل رپورٽ OpenAI جو ماڊل آرڪيٽيڪچر ۽ GPT4 ٺاھڻ جي عمل ۾ ٿورو بصيرت پيش ڪري ٿو، بيان ڪندي "competitive landscape and the safety implications of large-scale models“. جيڪو اسان ڄاڻون ٿا اهو آهي ته GPT4 ۽ ChatGPT شايد ساڳئي طرح تربيت ڪئي وئي آهي، جيڪو GPT-2 ۽ GPT-3 لاء استعمال ڪيل تربيتي طريقن کان ڪافي فرق آهي. اسان GPT4 جي ڀيٽ ۾ ChatGPT لاءِ تربيتي طريقن بابت گهڻو ڪجهه ڄاڻون ٿا، تنهنڪري اسان اتي شروع ڪنداسين.

چيٽ GPT

ChatGPT dialogue datasets سان تربيت ڪئي وئي آهي، بشمول ڊيمو ڊيٽا، جتي انساني تشريح ڪندڙ مخصوص درخواستن جي جواب ۾ چيٽ بوٽ اسسٽنٽ جي متوقع پيداوار جو مظاهرو ڪندا آهن. هي ڊيٽا GPT3.5 کي نگراني ڪيل سکيا سان گڏ ڪرڻ لاءِ استعمال ڪيو ويندو آهي، هڪ پاليسي ماڊل ٺاهيندي، جنهن کي استعمال ڪيو ويندو آهي ڪيترن ئي جوابن کي پيدا ڪرڻ لاءِ جڏهن درخواستون مهيا ڪيون وڃن. انساني تشريح ڪندڙ پوءِ درجه بندي ڪن ٿا ته ڏنل جوابن مان ڪھڙو جواب ڏنو ويو آھي بھترين نتيجا، جيڪو انعام جي ماڊل کي تربيت ڏيڻ لاءِ استعمال ڪيو ويندو آھي. ان کان پوءِ انعام وارو ماڊل استعمال ڪيو ويندو آهي پاليسي ماڊل کي ٻيهر سڌارڻ لاءِ reinforcement لرننگ استعمال ڪندي.

ChatGPT استعمال ڪندي تربيت ڏني وئي آهي انساني راءِ کان مضبوطي جي سکيا (RLHF)، تربيت دوران ٻوليء جي ماڊل کي بهتر ڪرڻ لاء انساني راء کي شامل ڪرڻ جو هڪ طريقو. هي ماڊل آئوٽ کي اجازت ڏئي ٿو ته صارف پاران درخواست ڪيل سرگرمي سان ترتيب ڏيڻ جي بجاءِ، صرف هڪ جملي ۾ ايندڙ لفظ جي اڳڪٿي ڪرڻ بجاءِ عام ٽريننگ ڊيٽا جي جسم جي بنياد تي، جهڙوڪ GPT-3.

جي پي ٽي 4

OpenAI اڃا تائين تفصيل بيان ڪري چڪو آهي ته اهو ڪيئن GPT4 کي تربيت ڏني. انهن جي ٽيڪنيڪل رپورٽ ۾ شامل نه آهي "details about the architecture (including model size), hardware, training compute, dataset construction, training method, or similar“. جيڪو اسان ڄاڻون ٿا اهو آهي ته GPT4 هڪ تربيت يافته ٽرانسفارمر طرز پيدا ڪندڙ ملٽي موڊ ماڊل آهي. ٻئي عوامي طور تي دستياب ڊيٽا تي ۽ ٽئين پارٽي جي ڊيٽا تي لائسنس يافته ۽ بعد ۾ RLHF استعمال ڪندي ٺيڪ ٺاڪ. دلچسپ ڳالهه اها آهي ته، OpenAI انهن جي تازه ڪاري ٿيل RLHF ٽيڪنالاجي جي حوالي سان تفصيلات شيئر ڪيو ته ماڊل جوابن کي وڌيڪ صحيح ۽ گهٽ ۾ گهٽ حفاظتي گارڊن کان ٻاهر نڪرڻ جو امڪان.

پاليسي ماڊل کي تربيت ڏيڻ کان پوءِ (جيئن ChatGPT سان)، RLHF مخالف ڌر جي تربيت ۾ استعمال ڪيو ويندو آهي، هڪ اهڙو عمل جيڪو هڪ ماڊل کي ٽريننگ ڪري ٿو بدسلوڪي مثالن تي جنهن جو مقصد ماڊل کي چالاڪ ڪرڻ لاءِ مستقبل ۾ اهڙن مثالن جي خلاف دفاع ڪرڻ لاءِ. GPT4 جي صورت ۾، ماهر متضاد مطالبن جي سياسي ماڊل جي جوابن جو جائزو وٺندا آهن. اهي جواب وري اضافي انعام واري ماڊل کي تربيت ڏيڻ لاءِ استعمال ڪيا ويندا آهن جيڪي پاليسي ماڊل کي ٻيهر بهتر بڻائيندا آهن، نتيجي ۾ هڪ ماڊل جنهن جو امڪان گهٽ هوندو آهي ته خطرناڪ، گمراهه ڪندڙ، يا غلط جواب مهيا ڪن.

GPT4 بمقابلہ ChatGPT هڪجهڙائي ۽ فرق ڪارڪردگي ۽ صلاحيتن جي لحاظ کان

ظرف

ڪارڪردگي جي لحاظ کان، ChatGPT ۽ GPT4 مختلف کان وڌيڪ ساڳيا آهن. ان جي اڳڪٿي وانگر، GPT-4 پڻ گفتگو واري انداز ۾ رابطو ڪري ٿو جنهن جو مقصد صارف سان ترتيب ڏيڻ آهي. جئين توهان هيٺ ڏسي سگهو ٿا، هڪ وسيع سوال لاء ٻن ماڊلن جي وچ ۾ جواب بلڪل ساڳيا آهن.

OpenAI اتفاق ڪري ٿو ته ماڊل جي وچ ۾ فرق ذيلي ٿي سگهي ٿو ۽ ٻڌائي ٿو ته "فرق تڏهن نڪرندو آهي جڏهن ڪم جي پيچيدگي ڪافي حد تائين پهچي ٿي". ڇهن مهينن جي مخالف ڌر جي تربيت کي ڏنو ويو ته GPT4 بنيادي ماڊل ان جي پوسٽ ٽريننگ مرحلي ۾ گذريو، اهو شايد هڪ صحيح خصوصيت آهي.

ChatGPT جي برعڪس، جيڪو صرف ٽيڪسٽ قبول ڪري ٿو، GPT4 ٻنهي تصويرن ۽ متن جي اشارن کي قبول ڪري ٿو، متن جي جوابن کي واپس ڪري ٿو. هن لکڻين جي طور تي، بدقسمتي سان، تصويري ان پٽ استعمال ڪرڻ جي صلاحيت اڃا تائين عوامي طور تي دستياب ناهي.

ڪارڪردگي

جيئن مٿي ذڪر ڪيو ويو آهي، OpenAI رپورٽ ڪري ٿو GPT4 لاءِ سيڪيورٽي ڪارڪردگي ۾ اهم سڌارو، GPT-3.5 جي مقابلي ۾ (جنهن مان ChatGPT ٽيون ڪيو ويو هو). بهرحال، اهو في الحال واضح ناهي ته ڇا:

ممنوع مواد جي درخواستن جي جوابن جي گھٽتائي،
زهري مواد جي نسل جي گھٽتائي e
حساس موضوعن تي جوابن کي بهتر بنائڻ

خود GPT4 ماڊل يا اضافي متضاد ٽيسٽن جي ڪري آهن.

اضافي طور تي، GPT4 CPT-3.5 کان وڌيڪ انساني طور تي ورتو ويو تعليمي ۽ پيشه ورانه امتحانن ۾. خاص طور تي، يونيفارم بار جي امتحان ۾ GPT4 اسڪور 90 هين پرسنٽائل ۾ GPT-3.5 جي مقابلي ۾، جيڪو 10 هين پرسنٽائل ۾ سکور ڪري ٿو. GPT4 پڻ خاص طور تي روايتي ٻولي ماڊل معيارن ۽ ٻين SOTA ماڊلز (جيتوڻيڪ ڪڏهن ڪڏهن تنگيءَ سان) تي پنهنجي اڳڪٿي کان وڌيڪ ڪم ڪري ٿو.

GPT4 بمقابلہ ChatGPT: فرق ۽ حدونi

ٻئي ChatGPT ۽ GPT4 اهم حدون ۽ خطرا آهن. GPT-4 سسٽم شيٽ ۾ OpenAI پاران ڪيل خطرن جي تفصيلي ڳولا کان بصيرت شامل آهي.

اهي صرف ڪجهه خطرا آهن جيڪي ٻنهي ماڊل سان لاڳاپيل آهن:

Hallucinations (غير معقول يا حقيقت ۾ غلط مواد پيدا ڪرڻ جو رجحان)
نقصانڪار مواد پيدا ڪريو جيڪو OpenAI پاليسين جي ڀڃڪڙي ڪري ٿو (مثال طور نفرت واري تقرير، تشدد جي ترغيب)
پسمانده ماڻهن جي اسٽريٽائپائپ کي وڌايو ۽ برقرار رکڻ
ٺڳيءَ جو مقصد حقيقي غلط ڄاڻ پيدا ڪريو

جڏهن ته ChatGPT ۽ GPT-4 ساڳين حدن ۽ خطرن سان وڙهندا آهن، OpenAI خاص ڪوششون ڪيون آهن، جن ۾ ڪيترائي متضاد ٽيسٽون شامل آهن، انهن کي GPT-4 لاءِ گھٽ ڪرڻ لاءِ. جڏهن ته هي حوصلا افزائي آهي، GPT-4 سسٽم شيٽ آخرڪار اهو ظاهر ڪري ٿو ته ChatGPT ڪيترو خطرناڪ هو (۽ شايد اڃا به آهي). نقصانڪار غير ارادي نتيجن جي وڌيڪ تفصيلي وضاحت لاءِ، مان GPT-4 سسٽم شيٽ پڙهڻ جي صلاح ڏيان ٿو، جيڪا صفحي 38 تي شروع ٿئي ٿي. GPT-4 ٽيڪنيڪل رپورٽ .

ٿڪل

جڏهن ته اسان ماڊل آرڪيٽيڪچر بابت ٿورڙي ڄاڻون ٿا، ۽ GPT4 جي پويان تربيتي طريقا، اتي ظاهر ٿئي ٿو ChatGPT جو هڪ بهتر نسخو. حقيقت ۾، في الحال GPT4 تصويرون ۽ ٽيڪسٽ ان پٽ قبول ڪرڻ جي قابل آهي، ۽ نتيجا محفوظ، وڌيڪ صحيح ۽ وڌيڪ تخليقي آهن. بدقسمتي سان، اسان کي ان لاء OpenAI جو لفظ وٺڻو پوندو، جيئن GPT4 صرف ChatGPT پلس سبسڪرپشن جي حصي طور موجود آهي.

انهن ماڊلز جي ترقي، خطرن ۽ حدن جي باري ۾ باخبر رهڻ ضروري آهي جيئن اسان وڏي ٻولي جي ماڊلز جي هن دلچسپ پر تيزيءَ سان اڀرندڙ منظرنامي کي نيويگيٽ ڪريون.

BlogInnovazione.it