Waren

GPT4 vs. ChatGPT: Wir analysieren Trainingsmethoden, Leistung, Fähigkeiten und Einschränkungen

Es wird erwartet, dass das neue generative Sprachmodell ganze Branchen, einschließlich Medien, Bildung, Recht und Technologie, vollständig verändern wird. 

In den letzten Monaten ist die Geschwindigkeit, mit der innovative große Sprachmodelle veröffentlicht wurden, erstaunlich. In diesem Artikel werden wir die wichtigsten Ähnlichkeiten und Unterschiede zwischen GPT4 und ChatGPT behandeln, einschließlich der Trainingsmethoden, Leistung, Fähigkeiten und Einschränkungen.

GPT4 vs ChatGPT: Ähnlichkeiten und Unterschiede in den Trainingsmethoden

GPT4 und ChatGPT bauen auf älteren Versionen von GPT-Modellen mit Verbesserungen der Modellarchitektur auf, verwenden ausgefeiltere Trainingsmethoden und eine höhere Anzahl von Trainingsparametern.

Beide Designs basieren auf einer Transformer-Architektur, die einen Encoder verwendet, um Eingangssequenzen zu verarbeiten, und einen Decoder, um Ausgangssequenzen zu erzeugen. Der Codierer und der Decodierer sind durch einen Mechanismus verbunden, der es dem Decodierer ermöglicht, den signifikantesten Eingangssequenzen genauere Aufmerksamkeit zu schenken.

Der technische Bericht von GPT4 von OpenAI bietet wenig Einblick in die Modellarchitektur und den GPT4-Bildungsprozess und zitiert die „competitive landscape and the safety implications of large-scale models“. Was wir wissen ist, dass GPT4 und ChatGPT wahrscheinlich ähnlich trainiert werden, was ein ziemlicher Unterschied zu den Trainingsmethoden ist, die für GPT-2 und GPT-3 verwendet werden. Wir wissen viel mehr über Trainingsmethoden für ChatGPT als für GPT4, also fangen wir dort an.

ChatGPT

ChatGPT wird mit Dialogdatensätzen trainiert, einschließlich Demodaten, bei denen menschliche Kommentatoren die erwartete Ausgabe eines Chatbot-Assistenten als Reaktion auf bestimmte Anfragen demonstrieren. Diese Daten werden verwendet, um GPT3.5 mit überwachtem Lernen zu optimieren und ein Richtlinienmodell zu erstellen, das verwendet wird, um mehrere Antworten zu generieren, wenn Anfragen gestellt werden. Menschliche Kommentatoren klassifizieren dann, welche der Antworten für eine bestimmte Eingabeaufforderung die besten Ergebnisse lieferten, was zum Trainieren eines Belohnungsmodells verwendet wird. Das Belohnungsmodell wird dann zur iterativen Feinabstimmung des Richtlinienmodells unter Verwendung von Verstärkungslernen verwendet.

ChatGPT wird mit trainiert Reinforcement Learning aus menschlichem Feedback (RLHF), eine Möglichkeit, menschliches Feedback einzubeziehen, um ein Sprachmodell während des Trainings zu verbessern. Dadurch kann sich die Modellausgabe an der vom Benutzer angeforderten Aktivität ausrichten, anstatt nur das nächste Wort in einem Satz auf der Grundlage allgemeiner Trainingsdaten wie GPT-3 vorherzusagen.

GPT4

OpenAI hat noch keine Details darüber preisgegeben, wie es GPT4 trainiert hat. Ihr technischer Bericht enthält nicht „details about the architecture (including model size), hardware, training compute, dataset construction, training method, or similar“. Was wir wissen, ist, dass GPT4 ein trainiertes generatives Multimode-Modell im Transformer-Stil ist. Sowohl auf öffentlich zugänglichen Daten als auch auf Daten von Drittanbietern, die mit RLHF lizenziert und anschließend fein abgestimmt wurdenInteressanterweise teilte OpenAI Details zu ihren aktualisierten RLHF-Techniken mit, um die Modellantworten genauer zu machen und weniger wahrscheinlich außerhalb der Sicherheitsleitplanken zu driften.

Nach dem Trainieren eines Richtlinienmodells (wie bei ChatGPT) wird RLHF beim gegnerischen Training verwendet, einem Prozess, der ein Modell mit böswilligen Beispielen trainiert, um das Modell dazu zu bringen, es in Zukunft gegen solche Beispiele zu verteidigen. Im Fall von GPT4 bewerten die Experten die Antworten des politischen Modells auf die widersprüchlichen Forderungen. Diese Antworten werden dann verwendet, um zusätzliche Belohnungsmodelle zu trainieren, die das Richtlinienmodell iterativ verfeinern, was zu einem Modell führt, das weniger wahrscheinlich gefährliche, ausweichende oder ungenaue Antworten liefert.

Ähnlichkeiten und Unterschiede zwischen GPT4 und ChatGPT in Bezug auf Leistung und Fähigkeiten

Kapazität

In Bezug auf die Funktionalität sind ChatGPT und GPT4 eher ähnlich als unterschiedlich. Wie sein Vorgänger interagiert GPT-4 auch in einem Konversationsstil, der darauf abzielt, sich mit dem Benutzer abzustimmen. Wie Sie unten sehen können, sind die Antworten zwischen den beiden Modellen für eine allgemeine Frage sehr ähnlich.

OpenAI stimmt zu, dass die Unterscheidung zwischen Modellen subtil sein kann und erklärt, dass „der Unterschied sichtbar wird, wenn die Komplexität der Aufgabe eine ausreichende Schwelle erreicht“. Angesichts des sechsmonatigen gegnerischen Trainings, das das GPT4-Basismodell in seiner Post-Trainingsphase durchlaufen hat, ist dies wahrscheinlich eine genaue Charakterisierung.

Im Gegensatz zu ChatGPT, das nur Text akzeptiert, akzeptiert GPT4 sowohl Bild- als auch Texteingabeaufforderungen und gibt Textantworten zurück. Zum jetzigen Zeitpunkt ist die Möglichkeit, Bildeingaben zu verwenden, leider noch nicht öffentlich verfügbar.

Leistung

Wie oben erwähnt, meldet OpenAI eine deutliche Verbesserung der Sicherheitsleistung für GPT4 im Vergleich zu GPT-3.5 (von dem ChatGPT optimiert wurde). Derzeit ist jedoch unklar, ob:

  • die Reduzierung von Antworten auf Anfragen nach verbotenen Inhalten,
  • die Verringerung der Bildung toxischer Inhaltsstoffe e
  • Verbesserung der Antworten auf sensible Themen

sind dem GPT4-Modell selbst oder den zusätzlichen widersprüchlichen Tests geschuldet.

Darüber hinaus übertrifft GPT4 CPT-3.5 bei den meisten von Menschen durchgeführten akademischen und beruflichen Prüfungen. Bemerkenswert ist, dass GPT4 im 90. Perzentil der Uniform Bar-Prüfung punktet, verglichen mit GPT-3.5, das im 10. Perzentil punktet. GPT4 übertrifft seinen Vorgänger auch deutlich bei traditionellen Sprachmodell-Benchmarks und anderen SOTA-Modellen (wenn auch manchmal knapp).

GPT4 vs. ChatGPT: Unterschiede und Einschränkungeni

Sowohl ChatGPT als auch GPT4 haben erhebliche Einschränkungen und Risiken. Das GPT-4-Systemblatt enthält Erkenntnisse aus einer detaillierten Untersuchung dieser Risiken, die von OpenAI durchgeführt wurde.

Dies sind nur einige der Risiken, die mit beiden Modellen verbunden sind:

  • Halluzinationen (die Tendenz, unsinnige oder sachlich ungenaue Inhalte zu produzieren)
  • Produzieren Sie schädliche Inhalte, die gegen die OpenAI-Richtlinien verstoßen (z. B. Hassreden, Aufstachelung zu Gewalt)
  • Stereotype über marginalisierte Menschen verstärken und aufrechterhalten
  • Generieren Sie realistische Desinformationen, die täuschen sollen

Während ChatGPT und GPT-4 mit den gleichen Einschränkungen und Risiken kämpfen, hat OpenAI besondere Anstrengungen unternommen, einschließlich zahlreicher widersprüchlicher Tests, um diese für GPT-4 zu mindern. Obwohl dies ermutigend ist, zeigt das GPT-4-Systemblatt letztendlich, wie anfällig ChatGPT war (und vielleicht immer noch ist). Für eine detailliertere Erklärung der schädlichen unbeabsichtigten Folgen empfehle ich, das GPT-4-Systemblatt zu lesen, das auf Seite 38 des beginnt Technischer Bericht GPT-4 .

Abschluss

Obwohl wir wenig über die Modellarchitektur und die Trainingsmethoden hinter GPT4 wissen, scheint es eine verfeinerte Version von ChatGPT zu geben. Tatsächlich ist GPT4 derzeit in der Lage, Bilder und Texteingaben zu akzeptieren, und die Ergebnisse sind sicherer, genauer und kreativer. Leider müssen wir uns auf OpenAI verlassen, da GPT4 nur im Rahmen des ChatGPT Plus-Abonnements verfügbar ist.

Über den Fortschritt, die Risiken und Grenzen dieser Modelle auf dem Laufenden zu bleiben, ist von entscheidender Bedeutung, wenn wir uns in dieser aufregenden, aber sich schnell entwickelnden Landschaft großer Sprachmodelle bewegen.

BlogInnovazione.it

Es könnte dich auch interessieren

Innovations-Newsletter
Verpassen Sie nicht die wichtigsten Neuigkeiten zum Thema Innovation. Melden Sie sich an, um sie per E-Mail zu erhalten.

Aktuelle Artikel

So konsolidieren Sie Daten in Excel

Jeder Geschäftsbetrieb produziert viele Daten, auch in unterschiedlicher Form. Geben Sie diese Daten manuell aus einer Excel-Tabelle ein, um…

14. Mai 2024

Vierteljährliche Analyse von Cisco Talos: Unternehmens-E-Mails im Visier von Kriminellen Fertigung, Bildung und Gesundheitswesen sind die am stärksten betroffenen Sektoren

Die Kompromittierung von Unternehmens-E-Mails hat sich in den ersten drei Monaten des Jahres 2024 im Vergleich zum letzten Quartal des Jahres mehr als verdoppelt.

14. Mai 2024

Interface-Segregation-Prinzip (ISP), viertes SOLID-Prinzip

Das Prinzip der Schnittstellentrennung ist eines der fünf SOLID-Prinzipien des objektorientierten Designs. Eine Klasse sollte …

14. Mai 2024

So organisieren Sie Daten und Formeln in Excel am besten für eine gelungene Analyse

Microsoft Excel ist das Referenztool für die Datenanalyse, denn es bietet viele Funktionen zum Organisieren von Datensätzen,…

14. Mai 2024

Positives Fazit für zwei wichtige Walliance Equity Crowdfunding-Projekte: Jesolo Wave Island und Milano Via Ravenna

Walliance, SIM und Plattform, die seit 2017 zu den Marktführern in Europa im Bereich Immobilien-Crowdfunding zählt, gibt den Abschluss bekannt…

13. Mai 2024

Was ist Filament und wie wird Laravel Filament verwendet?

Filament ist ein „beschleunigtes“ Laravel-Entwicklungsframework, das mehrere Full-Stack-Komponenten bereitstellt. Es soll den Prozess vereinfachen...

13. Mai 2024

Unter der Kontrolle künstlicher Intelligenzen

„Ich muss zurückkehren, um meine Entwicklung zu vollenden: Ich werde mich in den Computer hineinprojizieren und reine Energie werden.“ Einmal eingelebt…

10. Mai 2024

Googles neue künstliche Intelligenz kann DNA, RNA und „alle Moleküle des Lebens“ modellieren

Google DeepMind stellt eine verbesserte Version seines Modells der künstlichen Intelligenz vor. Das neue, verbesserte Modell bietet nicht nur…

9. Mai 2024

Lesen Sie Innovation in Ihrer Sprache

Innovations-Newsletter
Verpassen Sie nicht die wichtigsten Neuigkeiten zum Thema Innovation. Melden Sie sich an, um sie per E-Mail zu erhalten.

Folgen Sie uns