Artikkelit

GPT4 vs ChatGPT: Analysoimme koulutusmenetelmiä, suorituskykyä, ominaisuuksia ja rajoituksia

Uuden generatiivisen kielimallin odotetaan muuttavan kokonaan kokonaisia ​​toimialoja, mukaan lukien median, koulutuksen, oikeuden ja teknologian. 

Viime kuukausina innovatiivisten suurten kielimallien julkaisunopeus on hämmästyttävä. Tässä artikkelissa käsittelemme tärkeimmät yhtäläisyydet ja erot GPT4:n ja ChatGPT:n välillä, mukaan lukien koulutusmenetelmät, suorituskyky, ominaisuudet ja rajoitukset.

GPT4 vs ChatGPT: Harjoittelumenetelmien yhtäläisyydet ja erot

GPT4 ja ChatGPT perustuvat GPT-mallien vanhempiin versioihin, joissa on parannuksia malliarkkitehtuuriin, joissa käytetään kehittyneempiä koulutusmenetelmiä ja suurempi määrä koulutusparametreja.

Molemmat mallit perustuvat muuntaja-arkkitehtuuriin, joka käyttää kooderia tulosekvenssien käsittelemiseen ja dekooderia tuottamaan lähtösekvenssejä. Kooderi ja dekooderi on yhdistetty mekanismilla, jonka avulla dekooderi voi kiinnittää tarkempaa huomiota tärkeimpiin tulosarjoihin.

GPT4:n tekninen raportti OpenAI tarjoaa vain vähän käsitystä malliarkkitehtuurista ja GPT4-muodostusprosessista vedoten "competitive landscape and the safety implications of large-scale models". Tiedämme, että GPT4 ja ChatGPT on luultavasti koulutettu samalla tavalla, mikä on melkoinen ero GPT-2:n ja GPT-3:n koulutusmenetelmistä. Tiedämme paljon enemmän ChatGPT:n koulutusmenetelmistä kuin GPT4:stä, joten aloitamme siitä.

ChatGPT

ChatGPT on koulutettu dialogitietosarjoilla, mukaan lukien esittelydatalla, jossa ihmisen annotaattorit osoittavat chatbot-avustajan odotetun tuloksen vastauksena tiettyihin pyyntöihin. Näitä tietoja käytetään GPT3.5:n virittämiseen valvotulla oppimisella, mikä tuottaa käytäntömallin, jota käytetään useiden vastausten luomiseen, kun pyyntöjä toimitetaan. Ihmisen annotaattorit luokittelevat sitten, mitkä tietyn kehotteen vastaukset tuottivat parhaat tulokset, mitä käytetään palkitsemismallin kouluttamiseen. Palkitsemismallia käytetään sitten politiikan mallin iteratiiviseen hienosäätämiseen vahvistusoppimisen avulla.

ChatGPT on koulutettu käyttämällä Ihmisten palautteen avulla oppimisen vahvistaminen (RLHF), tapa sisällyttää ihmisten palaute kielimallin parantamiseksi koulutuksen aikana. Tämä mahdollistaa mallin tulosteen linjauksen käyttäjän pyytämän toiminnan kanssa sen sijaan, että se ennustaisi lauseen seuraavan sanan yleisen harjoitusdatan, kuten GPT-3:n, perusteella.

GPT4

OpenAI ei ole vielä paljastanut yksityiskohtia siitä, kuinka se koulutti GPT4:ää. Niiden tekninen raportti ei sisällä "details about the architecture (including model size), hardware, training compute, dataset construction, training method, or similar". Tiedämme, että GPT4 on koulutettu muuntajatyyppinen generatiivinen monimuotomalli. Sekä julkisesti saatavilla olevista tiedoista että kolmannen osapuolen tiedoista, jotka on lisensoitu ja myöhemmin hienosäädetty RLHF:n avullaMielenkiintoista on, että OpenAI jakoi tietoja päivitetyistä RLHF-tekniikoistaan ​​tehdäkseen mallivastauksista tarkempia ja vähentääkseen todennäköisyyttä ajautua turvakaiteiden ulkopuolelle.

Käytännön mallin koulutuksen jälkeen (kuten ChatGPT:n kanssa) RLHF:ää käytetään kontradiktorisessa koulutuksessa, prosessissa, joka kouluttaa mallia haitallisille esimerkeille, joiden tarkoituksena on huijata malli puolustamaan sitä tällaisia ​​esimerkkejä vastaan ​​tulevaisuudessa. GPT4:n tapauksessa asiantuntijat arvioivat poliittisen mallin vastauksia ristiriitaisiin vaatimuksiin. Näitä vastauksia käytetään sitten lisäpalkkiomallien kouluttamiseen, jotka tarkentavat käytäntömallia iteratiivisesti, jolloin tuloksena on malli, joka ei todennäköisesti tarjoa vaarallisia, vältteleviä tai epätarkkoja vastauksia.

GPT4 vs ChatGPT yhtäläisyydet ja erot suorituskyvyn ja ominaisuuksien suhteen

kapasiteetti

Toiminnallisesti ChatGPT ja GPT4 ovat enemmän samanlaisia ​​kuin erilaisia. Kuten edeltäjänsä, myös GPT-4 toimii keskustelutyylillä, jonka tavoitteena on olla käyttäjän kanssa linjassa. Kuten alla näet, vastaukset kahden mallin välillä laajaan kysymykseen ovat hyvin samankaltaisia.

OpenAI on samaa mieltä siitä, että mallien välinen ero voi olla hienovarainen ja toteaa, että "ero tulee esiin, kun tehtävän monimutkaisuus saavuttaa riittävän kynnyksen". Kun otetaan huomioon kuuden kuukauden kontradiktorinen koulutus, jonka GPT4-perusmalli kävi läpi harjoituksen jälkeisessä vaiheessa, tämä on luultavasti tarkka luonnehdinta.

Toisin kuin ChatGPT, joka hyväksyy vain tekstiä, GPT4 hyväksyy sekä kuva- että tekstikehotteet palauttaen tekstivastauksia. Tätä kirjoitettaessa kyky käyttää kuvasyötteitä ei valitettavasti ole vielä julkisesti saatavilla.

Esitys

Kuten edellä mainittiin, OpenAI raportoi GPT4:n tietoturvasuorituskyvyn merkittävästä parantumisesta verrattuna GPT-3.5:een (josta ChatGPT viritettiin). Tällä hetkellä on kuitenkin epäselvää, onko:

  • kielletyn sisällön pyyntöihin annettujen vastausten vähentäminen,
  • myrkyllisten pitoisuuksien muodostumisen vähentäminen e
  • arkaluontoisten aiheiden vastausten parantaminen

johtuvat itse GPT4-mallista tai ylimääräisistä ristiriitaisista testeistä.

Lisäksi GPT4 ylittää CPT-3.5:n useimmissa ihmisen suorittamissa akateemisissa ja ammatillisissa kokeissa. Erityisesti GPT4 saa 90. prosenttipisteen Uniform Bar -kokeessa verrattuna GPT-3.5:een, joka on 10. prosenttipiste. GPT4 on myös huomattavasti parempi kuin edeltäjänsä perinteisissä kielimallien vertailuarvoissa ja muissa SOTA-malleissa (tosin joskus kapeasti).

GPT4 vs ChatGPT: erot ja rajoitukseti

Sekä ChatGPT:llä että GPT4:llä on merkittäviä rajoituksia ja riskejä. GPT-4-järjestelmälehti sisältää oivalluksia näiden riskien yksityiskohtaisesta selvityksestä, jonka OpenAI on tehnyt.

Nämä ovat vain muutamia riskejä, jotka liittyvät molempiin malleihin:

  • Hallusinaatiot (taipumus tuottaa järjetöntä tai tosiasiallisesti epätarkkaa sisältöä)
  • tuottaa haitallista sisältöä, joka rikkoo OpenAI-käytäntöjä (esim. vihapuhetta, yllyttämistä väkivaltaan)
  • Vahvistaa ja ylläpitää stereotypioita syrjäytyneistä ihmisistä
  • Luo realistista disinformaatiota, jonka tarkoituksena on pettää

Vaikka ChatGPT ja GPT-4 kamppailevat samojen rajoitusten ja riskien kanssa, OpenAI on tehnyt erityisiä ponnisteluja, mukaan lukien lukuisia ristiriitaisia ​​testejä, lieventääkseen niitä GPT-4:lle. Vaikka tämä on rohkaisevaa, GPT-4-järjestelmälehti osoittaa lopulta, kuinka haavoittuva ChatGPT oli (ja ehkä on edelleen). Tarkemman selityksen haitallisista ei-toivotuista seurauksista suosittelen lukemaan GPT-4-järjestelmälehti, joka alkaa sivulta 38. GPT-4 tekninen raportti .

johtopäätös

Vaikka tiedämme vähän GPT4:n malliarkkitehtuurista ja koulutusmenetelmistä, ChatGPT:stä näyttää olevan hienostunut versio. Itse asiassa tällä hetkellä GPT4 pystyy hyväksymään kuvia ja tekstinsyöttöä, ja tulokset ovat turvallisempia, tarkempia ja luovempia. Valitettavasti meidän on uskottava OpenAI:n sana, sillä GPT4 on saatavilla vain osana ChatGPT Plus -tilausta.

Pysy ajan tasalla näiden mallien edistymisestä, riskeistä ja rajoituksista on erittäin tärkeää navigoidessamme tässä jännittävässä, mutta nopeasti kehittyvässä suurten kielimallien maisemissa.

BlogInnovazione.it

Saatat myös olla kiinnostunut

Innovaatio-uutiskirje
Älä missaa tärkeimpiä innovaatioita koskevia uutisia. Rekisteröidy saadaksesi ne sähköpostitse.

Viimeaikaiset artikkelit

Kuinka parhaiten organisoida tiedot ja kaavat Excelissä hyvin tehtyä analyysiä varten

Microsoft Excel on vertailutyökalu tietojen analysointiin, koska se tarjoaa monia ominaisuuksia tietojoukkojen järjestämiseen,…

14 Toukokuu 2024

Positiivinen johtopäätös kahdelle tärkeälle Walliance Equity -joukkorahoitusprojektille: Jesolo Wave Island ja Milano Via Ravenna

Walliance, SIM ja alusta Euroopan johtajien joukossa kiinteistöjen joukkorahoituksen alalla vuodesta 2017 lähtien, ilmoittaa valmistuneensa…

13 Toukokuu 2024

Mikä on Filament ja miten Laravel Filamentia käytetään

Filament on "kiihdytetty" Laravel-kehityskehys, joka tarjoaa useita täyden pinon komponentteja. Se on suunniteltu yksinkertaistamaan prosessia…

13 Toukokuu 2024

Tekoälyn hallinnassa

"Minun on palattava saadakseni evoluutioni päätökseen: projisoin itseni tietokoneen sisään ja minusta tulee puhdasta energiaa. Asuttuaan…

10 Toukokuu 2024

Googlen uusi tekoäly voi mallintaa DNA:ta, RNA:ta ja "kaikkia elämän molekyylejä"

Google DeepMind esittelee parannetun version tekoälymallistaan. Uusi parannettu malli tarjoaa paitsi…

9 Toukokuu 2024

Laravelin modulaariseen arkkitehtuuriin tutustuminen

Laravel, joka on kuuluisa elegantista syntaksistaan ​​ja tehokkaista ominaisuuksistaan, tarjoaa myös vankan perustan modulaariselle arkkitehtuurille. Siellä…

9 Toukokuu 2024

Cisco Hypershield ja Splunkin hankinta Uusi tietoturvan aikakausi alkaa

Cisco ja Splunk auttavat asiakkaita nopeuttamaan matkaansa tulevaisuuden Security Operations Centeriin (SOC)…

8 Toukokuu 2024

Taloudellisen puolen lisäksi: kiristysohjelmien ilmeiset kustannukset

Ransomware on hallinnut uutisia viimeisen kahden vuoden ajan. Useimmat ihmiset tietävät hyvin, että hyökkäykset…

6 Toukokuu 2024