Son aylarda, yenilikçi büyük dil modellerinin piyasaya sürülme hızı hayret verici. Bu makalede, eğitim yöntemleri, performans, yetenekler ve sınırlamalar dahil olmak üzere GPT4 ile ChatGPT arasındaki temel benzerlikleri ve farklılıkları ele alacağız.
GPT4 ve ChatGPT, GPT modellerinin eski sürümlerini model mimarisinde iyileştirmeler yaparak, daha gelişmiş eğitim yöntemleri kullanarak ve daha yüksek sayıda eğitim parametresiyle oluşturur.
Her iki tasarım da giriş dizilerini işlemek için bir kodlayıcı ve çıkış dizilerini oluşturmak için bir kod çözücü kullanan transformatör mimarisine dayalıdır. Kodlayıcı ve kod çözücü, kod çözücünün en önemli girdi dizilerine daha yakından dikkat etmesini sağlayan bir mekanizma ile bağlanır.
GPT4 teknik raporu OpenAI, model mimarisi ve GPT4 oluşum süreci hakkında çok az bilgi sunuyor ve "competitive landscape and the safety implications of large-scale models
“. Bildiğimiz şey, GPT4 ve ChatGPT'nin muhtemelen benzer şekilde eğitildiğidir; bu, GPT-2 ve GPT-3 için kullanılan eğitim yöntemlerinden oldukça farklıdır. ChatGPT için eğitim yöntemleri hakkında GPT4'ten çok daha fazla şey biliyoruz, o yüzden buradan başlayacağız.
ChatGPT, insan açıklama yapanların belirli isteklere yanıt olarak bir sohbet robotu asistanının beklenen çıktısını gösterdiği demo verileri de dahil olmak üzere diyalog veri kümeleriyle eğitilmiştir. Bu veriler, GPT3.5'i denetimli öğrenmeyle ayarlamak için kullanılır ve istekler sağlandığında birden çok yanıt oluşturmak için kullanılan bir ilke modeli üretir. İnsan annotators daha sonra, belirli bir istem için yanıtlardan hangisinin en iyi sonuçları verdiğini sınıflandırır ve bu, bir ödül modelini eğitmek için kullanılır. Daha sonra ödül modeli, pekiştirmeli öğrenmeyi kullanarak politika modelinde yinelemeli olarak ince ayar yapmak için kullanılır.
ChatGPT kullanılarak eğitilmiştir İnsan Geri Bildiriminden Güçlendirmeli Öğrenim (RLHF), eğitim sırasında bir dil modelini geliştirmek için insan geri bildirimlerini dahil etmenin bir yolu. Bu, GPT-3 gibi bir genel eğitim verisi gövdesine dayalı olarak bir cümledeki bir sonraki kelimeyi tahmin etmek yerine, model çıktısının kullanıcı tarafından talep edilen aktivite ile uyumlu hale gelmesini sağlar.
OpenAI, GPT4'ü nasıl eğittiğine ilişkin ayrıntıları henüz açıklamadı. Teknik raporlarında “details about the architecture (including model size), hardware, training compute, dataset construction, training method, or similar
“. Bildiğimiz şey, GPT4'ün eğitimli bir trafo tarzı üretken çok modlu model olduğudur. Hem halka açık veriler hem de lisanslanan ve ardından RLHF kullanılarak ince ayarı yapılan üçüncü taraf verileri üzerinde. İlginç bir şekilde OpenAI, model yanıtlarını daha doğru hale getirmek ve güvenlik korkuluklarının dışına çıkma olasılığını azaltmak için güncellenmiş RLHF teknikleriyle ilgili ayrıntıları paylaştı.
Bir ilke modelini eğittikten sonra (ChatGPT'de olduğu gibi), RLHF, modeli gelecekte bu tür örneklere karşı savunması için kandırmayı amaçlayan kötü niyetli örnekler üzerinde bir model eğiten bir süreç olan rakip eğitimde kullanılır. GPT4 örneğinde uzmanlar, siyasi modelin çelişkili taleplere verdiği yanıtları değerlendirir. Bu yanıtlar daha sonra, politika modelini yinelemeli olarak iyileştiren ve tehlikeli, kaçamak veya yanlış yanıtlar verme olasılığı daha düşük olan bir modelle sonuçlanan ek ödül modellerini eğitmek için kullanılır.
İşlevsellik açısından, ChatGPT ve GPT4 farklı olmaktan çok benzerdir. Selefi gibi, GPT-4 de kullanıcıyla uyum sağlamayı amaçlayan bir konuşma tarzında etkileşime girer. Aşağıda görebileceğiniz gibi, iki model arasındaki geniş bir soruya verilen yanıtlar çok benzer.
OpenAI, modeller arasındaki ayrımın ince olabileceğini kabul ediyor ve "fark, görevin karmaşıklığı yeterli bir eşiğe ulaştığında ortaya çıkıyor" diyor. GPT4 temel modelinin eğitim sonrası aşamasında aldığı altı aylık çekişmeli eğitim göz önüne alındığında, bu muhtemelen doğru bir karakterizasyondur.
Yalnızca metin kabul eden ChatGPT'den farklı olarak GPT4, hem resim hem de metin istemlerini kabul ederek metin yanıtları verir. Bu yazı yazıldığı sırada, ne yazık ki, görüntü girdilerini kullanma yeteneği henüz herkese açık değil.
Yukarıda bahsedildiği gibi OpenAI, GPT-4'e kıyasla (ChatGPT'nin ayarlandığı yer) GPT3.5 için güvenlik performansında önemli bir gelişme olduğunu bildiriyor. Ancak, şu anda belirsiz olup olmadığı:
GPT4 modelinin kendisinden veya ek çelişkili testlerden kaynaklanmaktadır.
Ek olarak, GPT4, insanlar tarafından yapılan çoğu akademik ve profesyonel sınavda CPT-3.5'ten daha iyi performans gösterir. Özellikle, GPT4, Tek Tip Çubuk sınavında 90. yüzdelik dilimde puan alırken, 3.5. yüzdelik dilimde puan alan GPT-10'e kıyasla. GPT4 ayrıca geleneksel dil modeli kıyaslamalarında ve diğer SOTA modellerinde (bazen dar da olsa) öncülünden önemli ölçüde daha iyi performans gösterir.
Hem ChatGPT hem de GPT4'ün önemli sınırlamaları ve riskleri vardır. GPT-4 sistem sayfası, OpenAI tarafından yürütülen bu risklerin ayrıntılı bir araştırmasından elde edilen içgörüleri içerir.
Bunlar, her iki modelle ilişkili risklerden yalnızca birkaçı:
ChatGPT ve GPT-4 aynı sınırlamalar ve risklerle mücadele ederken, OpenAI bunları GPT-4 için hafifletmek için çok sayıda çelişkili test de dahil olmak üzere özel çaba sarf etmiştir. Bu cesaret verici olmakla birlikte, GPT-4 sistem sayfası nihayetinde ChatGPT'nin ne kadar savunmasız olduğunu (ve belki de hala öyle olduğunu) göstermektedir. İstenmeyen zararlı sonuçların daha ayrıntılı bir açıklaması için, kılavuzun 4. sayfasından başlayan GPT-38 sistem sayfasını okumanızı tavsiye ederim. GPT-4 teknik raporu .
Model mimarisi ve GPT4'ün arkasındaki eğitim yöntemleri hakkında çok az şey bilmemize rağmen, ChatGPT'nin geliştirilmiş bir sürümü var gibi görünüyor. Aslında, şu anda GPT4 resimleri ve metin girişini kabul edebiliyor ve sonuçlar daha güvenli, daha doğru ve daha yaratıcı. Ne yazık ki, OpenAI'nin sözüne güvenmemiz gerekecek, çünkü GPT4 yalnızca ChatGPT Plus aboneliğinin bir parçası olarak mevcut.
Büyük dil modellerinin bu heyecan verici ama hızla gelişen ortamında gezinirken, bu modellerin ilerlemesi, riskleri ve sınırlamaları hakkında bilgi sahibi olmak çok önemlidir.
BlogInnovazione.it
Microsoft Excel, veri analizi için referans aracıdır, çünkü veri kümelerini düzenlemek için birçok özellik sunar,…
2017 yılından bu yana Gayrimenkul Kitlesel Fonlaması alanında Avrupa'nın liderleri arasında yer alan Walliance, SIM ve platform, tamamlandığını duyurdu…
Filament, çeşitli tam yığın bileşenleri sağlayan "hızlandırılmış" bir Laravel geliştirme çerçevesidir. İşlemleri basitleştirmek için tasarlanmıştır…
«Evrimimi tamamlamak için geri dönmeliyim: Kendimi bilgisayarın içine yansıtacağım ve saf enerjiye dönüşeceğim. Bir kez yerleştikten sonra…
Google DeepMind, yapay zeka modelinin geliştirilmiş bir versiyonunu sunuyor. Yeni geliştirilmiş model yalnızca…
Zarif sözdizimi ve güçlü özellikleriyle ünlü Laravel, modüler mimari için de sağlam bir temel sağlar. Orada…
Cisco ve Splunk, müşterilerin geleceğin Güvenlik Operasyon Merkezine (SOC) olan yolculuklarını hızlandırmalarına yardımcı oluyor…
Fidye yazılımı son iki yıldır haberlere hakim oldu. Çoğu insan saldırıların farkındadır…