Makaleler

GPT4 ve ChatGPT karşılaştırması: Eğitim yöntemlerini, performansı, yetenekleri ve sınırlamaları analiz ediyoruz

Yeni üretken dil modelinin medya, eğitim, hukuk ve teknoloji dahil olmak üzere tüm endüstrileri tamamen dönüştürmesi bekleniyor.

Son aylarda, yenilikçi büyük dil modellerinin piyasaya sürülme hızı hayret verici. Bu makalede, eğitim yöntemleri, performans, yetenekler ve sınırlamalar dahil olmak üzere GPT4 ile ChatGPT arasındaki temel benzerlikleri ve farklılıkları ele alacağız.

içerik dizini

GPT4'e karşı ChatGPT: Eğitim yöntemlerindeki benzerlikler ve farklılıklar

GPT4 ve ChatGPT, GPT modellerinin eski sürümlerini model mimarisinde iyileştirmeler yaparak, daha gelişmiş eğitim yöntemleri kullanarak ve daha yüksek sayıda eğitim parametresiyle oluşturur.

Her iki tasarım da giriş dizilerini işlemek için bir kodlayıcı ve çıkış dizilerini oluşturmak için bir kod çözücü kullanan transformatör mimarisine dayalıdır. Kodlayıcı ve kod çözücü, kod çözücünün en önemli girdi dizilerine daha yakından dikkat etmesini sağlayan bir mekanizma ile bağlanır.

GPT4 teknik raporu OpenAI, model mimarisi ve GPT4 oluşum süreci hakkında çok az bilgi sunuyor ve "competitive landscape and the safety implications of large-scale models“. Bildiğimiz şey, GPT4 ve ChatGPT'nin muhtemelen benzer şekilde eğitildiğidir; bu, GPT-2 ve GPT-3 için kullanılan eğitim yöntemlerinden oldukça farklıdır. ChatGPT için eğitim yöntemleri hakkında GPT4'ten çok daha fazla şey biliyoruz, o yüzden buradan başlayacağız.

ChatGPT

ChatGPT, insan açıklama yapanların belirli isteklere yanıt olarak bir sohbet robotu asistanının beklenen çıktısını gösterdiği demo verileri de dahil olmak üzere diyalog veri kümeleriyle eğitilmiştir. Bu veriler, GPT3.5'i denetimli öğrenmeyle ayarlamak için kullanılır ve istekler sağlandığında birden çok yanıt oluşturmak için kullanılan bir ilke modeli üretir. İnsan annotators daha sonra, belirli bir istem için yanıtlardan hangisinin en iyi sonuçları verdiğini sınıflandırır ve bu, bir ödül modelini eğitmek için kullanılır. Daha sonra ödül modeli, pekiştirmeli öğrenmeyi kullanarak politika modelinde yinelemeli olarak ince ayar yapmak için kullanılır.

ChatGPT kullanılarak eğitilmiştir İnsan Geri Bildiriminden Güçlendirmeli Öğrenim (RLHF), eğitim sırasında bir dil modelini geliştirmek için insan geri bildirimlerini dahil etmenin bir yolu. Bu, GPT-3 gibi bir genel eğitim verisi gövdesine dayalı olarak bir cümledeki bir sonraki kelimeyi tahmin etmek yerine, model çıktısının kullanıcı tarafından talep edilen aktivite ile uyumlu hale gelmesini sağlar.

GPT4

OpenAI, GPT4'ü nasıl eğittiğine ilişkin ayrıntıları henüz açıklamadı. Teknik raporlarında “details about the architecture (including model size), hardware, training compute, dataset construction, training method, or similar“. Bildiğimiz şey, GPT4'ün eğitimli bir trafo tarzı üretken çok modlu model olduğudur. Hem halka açık veriler hem de lisanslanan ve ardından RLHF kullanılarak ince ayarı yapılan üçüncü taraf verileri üzerinde. İlginç bir şekilde OpenAI, model yanıtlarını daha doğru hale getirmek ve güvenlik korkuluklarının dışına çıkma olasılığını azaltmak için güncellenmiş RLHF teknikleriyle ilgili ayrıntıları paylaştı.

Bir ilke modelini eğittikten sonra (ChatGPT'de olduğu gibi), RLHF, modeli gelecekte bu tür örneklere karşı savunması için kandırmayı amaçlayan kötü niyetli örnekler üzerinde bir model eğiten bir süreç olan rakip eğitimde kullanılır. GPT4 örneğinde uzmanlar, siyasi modelin çelişkili taleplere verdiği yanıtları değerlendirir. Bu yanıtlar daha sonra, politika modelini yinelemeli olarak iyileştiren ve tehlikeli, kaçamak veya yanlış yanıtlar verme olasılığı daha düşük olan bir modelle sonuçlanan ek ödül modellerini eğitmek için kullanılır.

Performans ve yetenekler açısından GPT4 ile ChatGPT arasındaki benzerlikler ve farklılıklar

Kapasite

İşlevsellik açısından, ChatGPT ve GPT4 farklı olmaktan çok benzerdir. Selefi gibi, GPT-4 de kullanıcıyla uyum sağlamayı amaçlayan bir konuşma tarzında etkileşime girer. Aşağıda görebileceğiniz gibi, iki model arasındaki geniş bir soruya verilen yanıtlar çok benzer.

OpenAI, modeller arasındaki ayrımın ince olabileceğini kabul ediyor ve "fark, görevin karmaşıklığı yeterli bir eşiğe ulaştığında ortaya çıkıyor" diyor. GPT4 temel modelinin eğitim sonrası aşamasında aldığı altı aylık çekişmeli eğitim göz önüne alındığında, bu muhtemelen doğru bir karakterizasyondur.

Yalnızca metin kabul eden ChatGPT'den farklı olarak GPT4, hem resim hem de metin istemlerini kabul ederek metin yanıtları verir. Bu yazı yazıldığı sırada, ne yazık ki, görüntü girdilerini kullanma yeteneği henüz herkese açık değil.

Verim

Yukarıda bahsedildiği gibi OpenAI, GPT-4'e kıyasla (ChatGPT'nin ayarlandığı yer) GPT3.5 için güvenlik performansında önemli bir gelişme olduğunu bildiriyor. Ancak, şu anda belirsiz olup olmadığı:

yasak içerik taleplerine verilen yanıtların azaltılması,
toksik içeriklerin oluşumunun azaltılması e
hassas konulara yanıtları iyileştirme

GPT4 modelinin kendisinden veya ek çelişkili testlerden kaynaklanmaktadır.

Ek olarak, GPT4, insanlar tarafından yapılan çoğu akademik ve profesyonel sınavda CPT-3.5'ten daha iyi performans gösterir. Özellikle, GPT4, Tek Tip Çubuk sınavında 90. yüzdelik dilimde puan alırken, 3.5. yüzdelik dilimde puan alan GPT-10'e kıyasla. GPT4 ayrıca geleneksel dil modeli kıyaslamalarında ve diğer SOTA modellerinde (bazen dar da olsa) öncülünden önemli ölçüde daha iyi performans gösterir.

GPT4 ve ChatGPT: farklılıklar ve sınırlamalari

Hem ChatGPT hem de GPT4'ün önemli sınırlamaları ve riskleri vardır. GPT-4 sistem sayfası, OpenAI tarafından yürütülen bu risklerin ayrıntılı bir araştırmasından elde edilen içgörüleri içerir.

Bunlar, her iki modelle ilişkili risklerden yalnızca birkaçı:

Halüsinasyonlar (saçma veya gerçeklere dayalı olarak yanlış içerik üretme eğilimi)
OpenAI politikalarını ihlal eden zararlı içerik üretmek (ör. nefret söylemi, şiddete teşvik)
Marjinalleştirilmiş insanların klişelerini büyütmek ve sürdürmek
Aldatmaya yönelik gerçekçi dezenformasyon üretmek

ChatGPT ve GPT-4 aynı sınırlamalar ve risklerle mücadele ederken, OpenAI bunları GPT-4 için hafifletmek için çok sayıda çelişkili test de dahil olmak üzere özel çaba sarf etmiştir. Bu cesaret verici olmakla birlikte, GPT-4 sistem sayfası nihayetinde ChatGPT'nin ne kadar savunmasız olduğunu (ve belki de hala öyle olduğunu) göstermektedir. İstenmeyen zararlı sonuçların daha ayrıntılı bir açıklaması için, kılavuzun 4. sayfasından başlayan GPT-38 sistem sayfasını okumanızı tavsiye ederim. GPT-4 teknik raporu .

Sonuç

Model mimarisi ve GPT4'ün arkasındaki eğitim yöntemleri hakkında çok az şey bilmemize rağmen, ChatGPT'nin geliştirilmiş bir sürümü var gibi görünüyor. Aslında, şu anda GPT4 resimleri ve metin girişini kabul edebiliyor ve sonuçlar daha güvenli, daha doğru ve daha yaratıcı. Ne yazık ki, OpenAI'nin sözüne güvenmemiz gerekecek, çünkü GPT4 yalnızca ChatGPT Plus aboneliğinin bir parçası olarak mevcut.

Büyük dil modellerinin bu heyecan verici ama hızla gelişen ortamında gezinirken, bu modellerin ilerlemesi, riskleri ve sınırlamaları hakkında bilgi sahibi olmak çok önemlidir.

BlogInnovazione.it

Ayrıca ilginizi çekebilir

Etiketler: chatbotsohbet gptyapay zekaMakine öğrenme

21 Mart 2023 5:52

sonraki Peroni Nastro Azzurro %0.0 sıfır alkol kategorisinde 2023 Yılın Ürünü seçildi »

önceki « Formula 1'de enerji tüketimi: madalyonun tersi

Son Makaleler

Makaleler

İyi bir analiz için verileri ve formülleri Excel'de en iyi şekilde nasıl organize edebilirsiniz?

Microsoft Excel, veri analizi için referans aracıdır, çünkü veri kümelerini düzenlemek için birçok özellik sunar,…

14 Mayıs 2024

Makaleler

İki önemli Walliance Equity Kitlesel Fonlama projesi için olumlu sonuç: Jesolo Wave Island ve Milano Via Ravenna

2017 yılından bu yana Gayrimenkul Kitlesel Fonlaması alanında Avrupa'nın liderleri arasında yer alan Walliance, SIM ve platform, tamamlandığını duyurdu…

13 Mayıs 2024