مقالات

GPT4 بمقابلہ ChatGPT: اسان تجزيو ڪيو تربيتي طريقن، ڪارڪردگي، صلاحيتون ۽ حدون

نئين نسلي ٻولي ماڊل جي توقع ڪئي وئي آهي ته مڪمل طور تي پوري صنعتن کي تبديل ڪري، بشمول ميڊيا، تعليم، قانون ۽ ٽيڪنالاجي. 

تازن مهينن ۾، جنهن رفتار سان جديد وڏي ٻولي جا ماڊل جاري ڪيا ويا آهن، حيرت انگيز آهي. هن آرٽيڪل ۾، اسين GPT4 بمقابله ChatGPT جي وچ ۾ بنيادي هڪجهڙائي ۽ فرق کي ڍڪينداسين، بشمول تربيتي طريقا، ڪارڪردگي، صلاحيتون ۽ حدون.

GPT4 بمقابلہ چيٽ GPT: تربيت جي طريقن ۾ هڪجهڙائي ۽ اختلاف

GPT4 ۽ ChatGPT GPT ماڊلز جي پراڻن ورزن تي ٺھيل آھن ماڊل آرڪيٽيڪچر کي بھتر ڪرڻ سان، وڌيڪ نفيس تربيتي طريقا استعمال ڪندي، ۽ ٽريننگ پيرا ميٽرن جي وڏي تعداد سان.

ٻئي ڊزائينز ٽرانسفارمر آرڪيٽيڪچر تي ٻڌل آهن، جيڪي ان پٽ جي ترتيبن کي پروسيس ڪرڻ لاءِ انڪوڊر استعمال ڪن ٿا ۽ آئوٽ پُٽ جي ترتيبن کي پيدا ڪرڻ لاءِ ڊيڪوڊر. انڪوڊر ۽ ڊيڪوڊر هڪ ميکانيزم سان ڳنڍيل آهن، جيڪا ڊيڪوڊر کي سڀ کان اهم ان پٽ جي ترتيبن تي وڌيڪ ڌيان ڏيڻ جي اجازت ڏئي ٿي.

GPT4 ٽيڪنيڪل رپورٽ OpenAI جو ماڊل آرڪيٽيڪچر ۽ GPT4 ٺاھڻ جي عمل ۾ ٿورو بصيرت پيش ڪري ٿو، بيان ڪندي "competitive landscape and the safety implications of large-scale models“. جيڪو اسان ڄاڻون ٿا اهو آهي ته GPT4 ۽ ChatGPT شايد ساڳئي طرح تربيت ڪئي وئي آهي، جيڪو GPT-2 ۽ GPT-3 لاء استعمال ڪيل تربيتي طريقن کان ڪافي فرق آهي. اسان GPT4 جي ڀيٽ ۾ ChatGPT لاءِ تربيتي طريقن بابت گهڻو ڪجهه ڄاڻون ٿا، تنهنڪري اسان اتي شروع ڪنداسين.

چيٽ GPT

ChatGPT dialogue datasets سان تربيت ڪئي وئي آهي، بشمول ڊيمو ڊيٽا، جتي انساني تشريح ڪندڙ مخصوص درخواستن جي جواب ۾ چيٽ بوٽ اسسٽنٽ جي متوقع پيداوار جو مظاهرو ڪندا آهن. هي ڊيٽا GPT3.5 کي نگراني ڪيل سکيا سان گڏ ڪرڻ لاءِ استعمال ڪيو ويندو آهي، هڪ پاليسي ماڊل ٺاهيندي، جنهن کي استعمال ڪيو ويندو آهي ڪيترن ئي جوابن کي پيدا ڪرڻ لاءِ جڏهن درخواستون مهيا ڪيون وڃن. انساني تشريح ڪندڙ پوءِ درجه بندي ڪن ٿا ته ڏنل جوابن مان ڪھڙو جواب ڏنو ويو آھي بھترين نتيجا، جيڪو انعام جي ماڊل کي تربيت ڏيڻ لاءِ استعمال ڪيو ويندو آھي. ان کان پوءِ انعام وارو ماڊل استعمال ڪيو ويندو آهي پاليسي ماڊل کي ٻيهر سڌارڻ لاءِ reinforcement لرننگ استعمال ڪندي.

ChatGPT استعمال ڪندي تربيت ڏني وئي آهي انساني راءِ کان مضبوطي جي سکيا (RLHF)، تربيت دوران ٻوليء جي ماڊل کي بهتر ڪرڻ لاء انساني راء کي شامل ڪرڻ جو هڪ طريقو. هي ماڊل آئوٽ کي اجازت ڏئي ٿو ته صارف پاران درخواست ڪيل سرگرمي سان ترتيب ڏيڻ جي بجاءِ، صرف هڪ جملي ۾ ايندڙ لفظ جي اڳڪٿي ڪرڻ بجاءِ عام ٽريننگ ڊيٽا جي جسم جي بنياد تي، جهڙوڪ GPT-3.

جي پي ٽي 4

OpenAI اڃا تائين تفصيل بيان ڪري چڪو آهي ته اهو ڪيئن GPT4 کي تربيت ڏني. انهن جي ٽيڪنيڪل رپورٽ ۾ شامل نه آهي "details about the architecture (including model size), hardware, training compute, dataset construction, training method, or similar“. جيڪو اسان ڄاڻون ٿا اهو آهي ته GPT4 هڪ تربيت يافته ٽرانسفارمر طرز پيدا ڪندڙ ملٽي موڊ ماڊل آهي. ٻئي عوامي طور تي دستياب ڊيٽا تي ۽ ٽئين پارٽي جي ڊيٽا تي لائسنس يافته ۽ بعد ۾ RLHF استعمال ڪندي ٺيڪ ٺاڪدلچسپ ڳالهه اها آهي ته، OpenAI انهن جي تازه ڪاري ٿيل RLHF ٽيڪنالاجي جي حوالي سان تفصيلات شيئر ڪيو ته ماڊل جوابن کي وڌيڪ صحيح ۽ گهٽ ۾ گهٽ حفاظتي گارڊن کان ٻاهر نڪرڻ جو امڪان.

پاليسي ماڊل کي تربيت ڏيڻ کان پوءِ (جيئن ChatGPT سان)، RLHF مخالف ڌر جي تربيت ۾ استعمال ڪيو ويندو آهي، هڪ اهڙو عمل جيڪو هڪ ماڊل کي ٽريننگ ڪري ٿو بدسلوڪي مثالن تي جنهن جو مقصد ماڊل کي چالاڪ ڪرڻ لاءِ مستقبل ۾ اهڙن مثالن جي خلاف دفاع ڪرڻ لاءِ. GPT4 جي صورت ۾، ماهر متضاد مطالبن جي سياسي ماڊل جي جوابن جو جائزو وٺندا آهن. اهي جواب وري اضافي انعام واري ماڊل کي تربيت ڏيڻ لاءِ استعمال ڪيا ويندا آهن جيڪي پاليسي ماڊل کي ٻيهر بهتر بڻائيندا آهن، نتيجي ۾ هڪ ماڊل جنهن جو امڪان گهٽ هوندو آهي ته خطرناڪ، گمراهه ڪندڙ، يا غلط جواب مهيا ڪن.

GPT4 بمقابلہ ChatGPT هڪجهڙائي ۽ فرق ڪارڪردگي ۽ صلاحيتن جي لحاظ کان

ظرف

ڪارڪردگي جي لحاظ کان، ChatGPT ۽ GPT4 مختلف کان وڌيڪ ساڳيا آهن. ان جي اڳڪٿي وانگر، GPT-4 پڻ گفتگو واري انداز ۾ رابطو ڪري ٿو جنهن جو مقصد صارف سان ترتيب ڏيڻ آهي. جئين توهان هيٺ ڏسي سگهو ٿا، هڪ وسيع سوال لاء ٻن ماڊلن جي وچ ۾ جواب بلڪل ساڳيا آهن.

OpenAI اتفاق ڪري ٿو ته ماڊل جي وچ ۾ فرق ذيلي ٿي سگهي ٿو ۽ ٻڌائي ٿو ته "فرق تڏهن نڪرندو آهي جڏهن ڪم جي پيچيدگي ڪافي حد تائين پهچي ٿي". ڇهن مهينن جي مخالف ڌر جي تربيت کي ڏنو ويو ته GPT4 بنيادي ماڊل ان جي پوسٽ ٽريننگ مرحلي ۾ گذريو، اهو شايد هڪ صحيح خصوصيت آهي.

ChatGPT جي برعڪس، جيڪو صرف ٽيڪسٽ قبول ڪري ٿو، GPT4 ٻنهي تصويرن ۽ متن جي اشارن کي قبول ڪري ٿو، متن جي جوابن کي واپس ڪري ٿو. هن لکڻين جي طور تي، بدقسمتي سان، تصويري ان پٽ استعمال ڪرڻ جي صلاحيت اڃا تائين عوامي طور تي دستياب ناهي.

ڪارڪردگي

جيئن مٿي ذڪر ڪيو ويو آهي، OpenAI رپورٽ ڪري ٿو GPT4 لاءِ سيڪيورٽي ڪارڪردگي ۾ اهم سڌارو، GPT-3.5 جي مقابلي ۾ (جنهن مان ChatGPT ٽيون ڪيو ويو هو). بهرحال، اهو في الحال واضح ناهي ته ڇا:

  • ممنوع مواد جي درخواستن جي جوابن جي گھٽتائي،
  • زهري مواد جي نسل جي گھٽتائي e
  • حساس موضوعن تي جوابن کي بهتر بنائڻ

خود GPT4 ماڊل يا اضافي متضاد ٽيسٽن جي ڪري آهن.

اضافي طور تي، GPT4 CPT-3.5 کان وڌيڪ انساني طور تي ورتو ويو تعليمي ۽ پيشه ورانه امتحانن ۾. خاص طور تي، يونيفارم بار جي امتحان ۾ GPT4 اسڪور 90 هين پرسنٽائل ۾ GPT-3.5 جي مقابلي ۾، جيڪو 10 هين پرسنٽائل ۾ سکور ڪري ٿو. GPT4 پڻ خاص طور تي روايتي ٻولي ماڊل معيارن ۽ ٻين SOTA ماڊلز (جيتوڻيڪ ڪڏهن ڪڏهن تنگيءَ سان) تي پنهنجي اڳڪٿي کان وڌيڪ ڪم ڪري ٿو.

GPT4 بمقابلہ ChatGPT: فرق ۽ حدونi

ٻئي ChatGPT ۽ GPT4 اهم حدون ۽ خطرا آهن. GPT-4 سسٽم شيٽ ۾ OpenAI پاران ڪيل خطرن جي تفصيلي ڳولا کان بصيرت شامل آهي.

اهي صرف ڪجهه خطرا آهن جيڪي ٻنهي ماڊل سان لاڳاپيل آهن:

  • Hallucinations (غير معقول يا حقيقت ۾ غلط مواد پيدا ڪرڻ جو رجحان)
  • نقصانڪار مواد پيدا ڪريو جيڪو OpenAI پاليسين جي ڀڃڪڙي ڪري ٿو (مثال طور نفرت واري تقرير، تشدد جي ترغيب)
  • پسمانده ماڻهن جي اسٽريٽائپائپ کي وڌايو ۽ برقرار رکڻ
  • ٺڳيءَ جو مقصد حقيقي غلط ڄاڻ پيدا ڪريو

جڏهن ته ChatGPT ۽ GPT-4 ساڳين حدن ۽ خطرن سان وڙهندا آهن، OpenAI خاص ڪوششون ڪيون آهن، جن ۾ ڪيترائي متضاد ٽيسٽون شامل آهن، انهن کي GPT-4 لاءِ گھٽ ڪرڻ لاءِ. جڏهن ته هي حوصلا افزائي آهي، GPT-4 سسٽم شيٽ آخرڪار اهو ظاهر ڪري ٿو ته ChatGPT ڪيترو خطرناڪ هو (۽ شايد اڃا به آهي). نقصانڪار غير ارادي نتيجن جي وڌيڪ تفصيلي وضاحت لاءِ، مان GPT-4 سسٽم شيٽ پڙهڻ جي صلاح ڏيان ٿو، جيڪا صفحي 38 تي شروع ٿئي ٿي. GPT-4 ٽيڪنيڪل رپورٽ .

ٿڪل

جڏهن ته اسان ماڊل آرڪيٽيڪچر بابت ٿورڙي ڄاڻون ٿا، ۽ GPT4 جي پويان تربيتي طريقا، اتي ظاهر ٿئي ٿو ChatGPT جو هڪ بهتر نسخو. حقيقت ۾، في الحال GPT4 تصويرون ۽ ٽيڪسٽ ان پٽ قبول ڪرڻ جي قابل آهي، ۽ نتيجا محفوظ، وڌيڪ صحيح ۽ وڌيڪ تخليقي آهن. بدقسمتي سان، اسان کي ان لاء OpenAI جو لفظ وٺڻو پوندو، جيئن GPT4 صرف ChatGPT پلس سبسڪرپشن جي حصي طور موجود آهي.

انهن ماڊلز جي ترقي، خطرن ۽ حدن جي باري ۾ باخبر رهڻ ضروري آهي جيئن اسان وڏي ٻولي جي ماڊلز جي هن دلچسپ پر تيزيءَ سان اڀرندڙ منظرنامي کي نيويگيٽ ڪريون.

BlogInnovazione.it

توھان شايد شايد دلچسپي وٺن

جدت نيوز ليٽر
جدت تي سڀ کان اهم خبر نه وڃايو. انهن کي اي ميل ذريعي حاصل ڪرڻ لاء سائن اپ ڪريو.

تازيون مضمونون

Excel ۾ ڊيٽا ڪيئن گڏ ڪجي

ڪو به ڪاروباري آپريشن تمام گهڻو ڊيٽا پيدا ڪري ٿو، جيتوڻيڪ مختلف شڪلن ۾. دستي طور هن ڊيٽا کي هڪ Excel شيٽ مان داخل ڪريو ...

14 2024

Cisco Talos ٽه ماهي تجزيه: ڪارپوريٽ اي ميلون ٽارگيٽ ڪلنگ پاران ٽارگيٽ ڪلنگ، تعليم ۽ صحت جي سار سنڀار سڀ کان وڌيڪ متاثر ٿيل شعبا آهن

ڪمپني جي اي ميلن جو سمجھوتو 2024 جي پهرين ٽن مهينن ۾ ٻيڻو کان وڌيڪ وڌي ويو گذريل چوٿين جي مقابلي ۾…

14 2024

انٽرفيس سيگريگيشن اصول (ISP)، چوٿون سولڊ اصول

انٽرفيس سيگريگيشن اصول آبجیکٹ آرينٽيڊ ڊيزائن جي پنجن SOLID اصولن مان هڪ آهي. هڪ ڪلاس هجڻ گهرجي ...

14 2024

بهترين طريقي سان ڪيل تجزيو لاءِ Excel ۾ ڊيٽا ۽ فارمولن کي ڪيئن منظم ڪجي

Microsoft Excel ڊيٽا جي تجزيو لاءِ ريفرنس ٽول آهي، ڇاڪاڻ ته اهو ڊيٽا سيٽ کي منظم ڪرڻ لاءِ ڪيتريون ئي خاصيتون پيش ڪري ٿو،…

14 2024

ٻن اهم Walliance Equity Crowdfunding منصوبن لاءِ مثبت نتيجو: Jesolo Wave Island ۽ Milano Via Ravenna

2017 کان ريئل اسٽيٽ ڪروڊ فنڊنگ جي ميدان ۾ يورپ ۾ اڳواڻن جي وچ ۾ والائنس، سم ۽ پليٽ فارم، مڪمل ٿيڻ جو اعلان ڪري ٿو…

13 2024

Filament ڇا آهي ۽ Laravel Filament ڪيئن استعمال ڪجي

Filament هڪ "تيز رفتار" Laravel ڊولپمينٽ فريم ورڪ آهي، ڪيترن ئي مڪمل اسٽيڪ اجزاء مهيا ڪري ٿو. اهو عمل کي آسان ڪرڻ لاء ٺهيل آهي ...

13 2024

مصنوعي انٽيليجنس جي ڪنٽرول هيٺ

"مون کي پنهنجي ارتقاء کي مڪمل ڪرڻ لاء واپس اچڻ گهرجي: مان پاڻ کي ڪمپيوٽر جي اندر پروجيڪٽ ڪندس ۽ خالص توانائي بڻجي ويندو. هڪ ڀيرو آباد ٿيو ...

10 2024

گوگل جي نئين مصنوعي ذهانت ڊي اين اي، آر اين اي ۽ ”زندگي جا سڀ ماليڪيول“ کي ماڊل ڪري سگهي ٿي.

گوگل ڊيپ مائنڊ پنهنجي مصنوعي ذهانت واري ماڊل جو هڪ بهتر ورزن متعارف ڪرائي رهيو آهي. نئون سڌريل ماڊل نه رڳو مهيا ڪري ٿو…

9 2024

پنھنجي ٻوليءَ ۾ جدت پڙھو

جدت نيوز ليٽر
جدت تي سڀ کان اهم خبر نه وڃايو. انهن کي اي ميل ذريعي حاصل ڪرڻ لاء سائن اپ ڪريو.

اسان جي تابعداري ڪريو