Artikel

GPT4 vs ChatGPT: Urang nganalisis métode latihan, kinerja, kamampuhan jeung watesan

Modél basa generatif anyar dipiharep bakal ngarobih sadayana industri, kalebet média, pendidikan, hukum sareng téknologi. 

Dina sasih-sasih ayeuna, laju ngaluncurkeun modél basa ageung anu inovatif luar biasa. Dina artikel ieu, urang bakal nutupan kamiripan utama jeung béda antara GPT4 vs ChatGPT, kaasup métode latihan, kinerja, kamampuhan jeung watesan.

GPT4 vs Ngobrol GPT: Kamiripan jeung béda dina métode latihan

GPT4 sareng ChatGPT ngawangun dina vérsi anu langkung lami tina modél GPT kalayan perbaikan arsitéktur modél, ngagunakeun metode latihan anu langkung canggih, sareng kalayan jumlah parameter pelatihan anu langkung luhur.

Kadua desain dumasar kana arsitektur trafo, anu ngagunakeun encoder pikeun ngolah sekuen input sareng decoder pikeun ngahasilkeun sekuen kaluaran. Encoder sareng decoder disambungkeun ku mékanisme, anu ngamungkinkeun decoder nengetan langkung caket kana urutan input anu paling penting.

The GPT4 laporan teknis OpenAI nawiskeun sakedik wawasan ngeunaan arsitéktur modél sareng prosés formasi GPT4, nyatakeun "competitive landscape and the safety implications of large-scale models“. Anu kami terang nyaéta yén GPT4 sareng ChatGPT sigana dilatih sami, anu rada béda ti metode latihan anu dianggo pikeun GPT-2 sareng GPT-3. Urang terang langkung seueur ngeunaan metode latihan pikeun ChatGPT tibatan GPT4, janten urang mimitian di dinya.

Ngobrol GPT

ChatGPT dilatih sareng datasets dialog, kaasup data demo, dimana annotators manusa demonstrate output ekspektasi tina asisten chatbot dina respon kana requests husus. Data ieu dianggo pikeun nyaluyukeun GPT3.5 sareng diajar anu diawaskeun, ngahasilkeun modél kawijakan, anu dianggo pikeun ngahasilkeun sababaraha réspon nalika paménta disayogikeun. Annotators manusa lajeng mengklasifikasikan mana tina réspon pikeun ajakan dibikeun yielded hasil pangalusna, nu dipaké pikeun ngalatih model ganjaran. Modél reward lajeng dipaké pikeun iteratively fine-tune model kawijakan ngagunakeun reinforcement learning.

ChatGPT dilatih ngagunakeun Panguatan Diajar tina Eupan Balik Manusa (RLHF), cara pikeun ngasupkeun eupan balik manusa pikeun ngaronjatkeun model basa salila latihan. Hal ieu ngamungkinkeun kaluaran modél pikeun saluyu sareng kagiatan anu dipénta ku pangguna, sanés ngan ukur ngaramalkeun kecap salajengna dina kalimah dumasar kana badan data latihan umum, sapertos GPT-3.

GPT4

OpenAI henteu acan ngungkabkeun detil ngeunaan kumaha éta ngalatih GPT4. Laporan téknisna henteu kalebet "details about the architecture (including model size), hardware, training compute, dataset construction, training method, or similar“. Anu kami terang nyaéta GPT4 mangrupikeun modél multimode generatif gaya trafo anu dilatih. Boh dina data anu sadia pikeun umum sareng dina data pihak katilu anu dilisensikeun sareng saterasna disaluyukeun nganggo RLHFNarikna, OpenAI ngabagikeun detil ngeunaan téknik RLHF anu diénggalan pikeun ngajantenkeun réspon modél langkung akurat sareng henteu gampang hanyut di luar pagar kaamanan.

Sanggeus latihan model kawijakan (sakumaha jeung ChatGPT), RLHF dipaké dina latihan adversarial, prosés nu ngalatih model on conto jahat dimaksudkeun pikeun trik model kana defending eta ngalawan conto misalna dina mangsa nu bakal datang. Dina kasus GPT4, para ahli meunteun réspon modél pulitik kana tungtutan anu kontradiktif. réspon ieu lajeng dipaké pikeun ngalatih model ganjaran tambahan nu iteratively nyaring model kawijakan, hasilna model nu kurang kamungkinan kana nyadiakeun réspon bahaya, evasive, atawa teu akurat.

GPT4 vs ChatGPT kamiripan sareng bédana dina hal kinerja sareng kamampuan

Kapasitas

Dina hal fungsionalitas, ChatGPT sareng GPT4 langkung mirip tibatan anu béda. Kawas miheulaan na, GPT-4 ogé berinteraksi dina gaya conversational nu boga tujuan pikeun align kalawan pamaké. Sakumaha anjeun tiasa tingali di handap, jawaban antara dua model pikeun patarosan lega pisan sarupa.

OpenAI satuju yén bédana antara modél tiasa halus sareng nyatakeun yén "bédana kaluar nalika pajeulitna tugas ngahontal ambang anu cekap". Dibikeun genep bulan latihan adversarial yén modél dasar GPT4 ngalaman dina fase pasca-latihan, ieu sigana mangrupikeun karakterisasi anu akurat.

Beda sareng ChatGPT, anu ngan ukur nampi téks, GPT4 nampi pesen gambar sareng téks, ngabalikeun réspon téks. Dina tulisan ieu, hanjakalna, kamampuan ngagunakeun input gambar henteu acan sayogi umum.

Performance

Sakumaha didadarkeun di luhur, OpenAI ngalaporkeun paningkatan anu signifikan dina kinerja kaamanan pikeun GPT4, dibandingkeun sareng GPT-3.5 (ti mana ChatGPT ditala). Nanging, ayeuna henteu écés naha:

  • pangurangan réspon kana pamundut pikeun eusi anu dilarang,
  • réduksi tina generasi eusi toksik e
  • ningkatkeun réspon kana topik sénsitip

Éta alatan model GPT4 sorangan atawa tés contradicting tambahan.

Sajaba ti, GPT4 outperforms CPT-3.5 dina paling ujian akademik sarta profésional-diambil manusa. Utamana, skor GPT4 dina persentil ka-90 dina ujian Bar Seragam dibandingkeun sareng GPT-3.5, anu skor dina persentil ka-10. GPT4 ogé sacara signifikan outperforms miheulaan na on tolok ukur model basa tradisional jeung model SOTA séjén (sanajan kadang ku sempit).

GPT4 vs ChatGPT: béda jeung watesani

Duanana ChatGPT sareng GPT4 gaduh watesan sareng résiko anu signifikan. Lembar sistem GPT-4 kalebet wawasan tina eksplorasi detil ngeunaan résiko anu dilakukeun ku OpenAI.

Ieu ngan sababaraha resiko pakait sareng duanana model:

  • Halusinasi (kacenderungan pikeun ngahasilkeun eusi nu teu sensitip atawa faktual teu akurat)
  • Ngahasilkeun kontén ngabahayakeun anu ngalanggar kabijakan OpenAI (contona ucapan hate, hasutan pikeun kekerasan)
  • Amplify jeung perpetuate stereotypes jalma marginalized
  • Ngahasilkeun disinformasi realistis anu dimaksudkeun pikeun nipu

Nalika ChatGPT sareng GPT-4 berjuang sareng watesan sareng résiko anu sami, OpenAI parantos ngadamel usaha khusus, kalebet seueur tes anu kontradiksi, pikeun ngirangan aranjeunna pikeun GPT-4. Sanaos ieu ngadorong, lembar sistem GPT-4 pamustunganana nunjukkeun kumaha rentan ChatGPT (sareng panginten masih aya). Pikeun katerangan anu langkung rinci ngeunaan akibat anu teu dihaja anu ngabahayakeun, kuring nyarankeun maca lambaran sistem GPT-4, anu dimimitian dina kaca 38 laporan teknis GPT-4 .

kacindekan

Sanaos urang terang sakedik ngeunaan arsitéktur modél, sareng metode latihan di tukangeun GPT4, sigana aya versi ChatGPT anu disampurnakeun. Nyatana, ayeuna GPT4 tiasa nampi gambar sareng input téks, sareng hasilna langkung aman, langkung akurat sareng langkung kreatif. Hanjakalna, urang kedah nyandak kecap OpenAI pikeun éta, sabab GPT4 ngan ukur sayogi salaku bagian tina langganan ChatGPT Plus.

Tetep terang ngeunaan kamajuan, résiko sareng keterbatasan modél ieu penting nalika urang nganapigasi bentang modél basa ageung anu pikaresepeun tapi ngembang pesat ieu.

BlogInnovazione.it

Anjeun ogé resep

newsletter inovasi
Entong luput warta anu paling penting ngeunaan inovasi. Ngadaptar pikeun nampa aranjeunna ku email.

Artikel panganyarna

Kumaha cara ngatur data sareng rumus pangsaéna dina Excel, pikeun analisa anu saé

Microsoft Excel mangrupikeun alat rujukan pikeun analisis data, sabab nawiskeun seueur fitur pikeun ngatur set data,…

14 Méi 2024

Kacindekan positif pikeun dua proyék Walliance Equity Crowdfunding penting: Jesolo Wave Island sareng Milano Via Ravenna

Walliance, SIM sareng platform diantara pamimpin di Éropa dina widang Real Estate Crowdfunding saprak 2017, ngumumkeun parantosan…

13 Méi 2024

Naon Filamén sareng kumaha ngagunakeun Filamén Laravel

Filamén mangrupikeun kerangka pangembangan Laravel anu "gancangan", nyayogikeun sababaraha komponén tumpukan pinuh. Éta dirancang pikeun nyederhanakeun prosés…

13 Méi 2024

Dina kadali kecerdasan jieunan

«Kuring kudu balik pikeun ngalengkepan évolusi kuring: Kuring bakal proyek sorangan di jero komputer tur jadi énergi murni. Sakali netep di…

10 Méi 2024

Kecerdasan jieunan anyar Google tiasa modél DNA, RNA sareng "sadayana molekul kahirupan"

Google DeepMind ngenalkeun vérsi anu ditingkatkeun tina modél kecerdasan buatan na. Modél anu ditingkatkeun énggal nyayogikeun sanés ngan ukur…

9 Méi 2024

Ngajalajah Arsitéktur Modular Laravel

Laravel, anu kasohor ku sintaksis anu elegan sareng fitur anu kuat, ogé nyayogikeun dasar anu kuat pikeun arsitektur modular. Tuh…

9 Méi 2024

Cisco Hypershield jeung akuisisi Splunk Era anyar kaamanan dimimitian

Cisco sareng Splunk ngabantosan para nasabah ngagancangkeun perjalanan ka Pusat Operasi Kaamanan (SOC) ka hareup kalayan…

8 Méi 2024

Saluareun sisi ékonomi: biaya anu teu jelas tina ransomware

Ransomware parantos ngadominasi warta salami dua taun ka pengker. Seueur jalma sadar yén serangan…

6 Méi 2024