Viime kuukausina innovatiivisten suurten kielimallien julkaisunopeus on hämmästyttävä. Tässä artikkelissa käsittelemme tärkeimmät yhtäläisyydet ja erot GPT4:n ja ChatGPT:n välillä, mukaan lukien koulutusmenetelmät, suorituskyky, ominaisuudet ja rajoitukset.
GPT4 ja ChatGPT perustuvat GPT-mallien vanhempiin versioihin, joissa on parannuksia malliarkkitehtuuriin, joissa käytetään kehittyneempiä koulutusmenetelmiä ja suurempi määrä koulutusparametreja.
Molemmat mallit perustuvat muuntaja-arkkitehtuuriin, joka käyttää kooderia tulosekvenssien käsittelemiseen ja dekooderia tuottamaan lähtösekvenssejä. Kooderi ja dekooderi on yhdistetty mekanismilla, jonka avulla dekooderi voi kiinnittää tarkempaa huomiota tärkeimpiin tulosarjoihin.
GPT4:n tekninen raportti OpenAI tarjoaa vain vähän käsitystä malliarkkitehtuurista ja GPT4-muodostusprosessista vedoten "competitive landscape and the safety implications of large-scale models
". Tiedämme, että GPT4 ja ChatGPT on luultavasti koulutettu samalla tavalla, mikä on melkoinen ero GPT-2:n ja GPT-3:n koulutusmenetelmistä. Tiedämme paljon enemmän ChatGPT:n koulutusmenetelmistä kuin GPT4:stä, joten aloitamme siitä.
ChatGPT on koulutettu dialogitietosarjoilla, mukaan lukien esittelydatalla, jossa ihmisen annotaattorit osoittavat chatbot-avustajan odotetun tuloksen vastauksena tiettyihin pyyntöihin. Näitä tietoja käytetään GPT3.5:n virittämiseen valvotulla oppimisella, mikä tuottaa käytäntömallin, jota käytetään useiden vastausten luomiseen, kun pyyntöjä toimitetaan. Ihmisen annotaattorit luokittelevat sitten, mitkä tietyn kehotteen vastaukset tuottivat parhaat tulokset, mitä käytetään palkitsemismallin kouluttamiseen. Palkitsemismallia käytetään sitten politiikan mallin iteratiiviseen hienosäätämiseen vahvistusoppimisen avulla.
ChatGPT on koulutettu käyttämällä Ihmisten palautteen avulla oppimisen vahvistaminen (RLHF), tapa sisällyttää ihmisten palaute kielimallin parantamiseksi koulutuksen aikana. Tämä mahdollistaa mallin tulosteen linjauksen käyttäjän pyytämän toiminnan kanssa sen sijaan, että se ennustaisi lauseen seuraavan sanan yleisen harjoitusdatan, kuten GPT-3:n, perusteella.
OpenAI ei ole vielä paljastanut yksityiskohtia siitä, kuinka se koulutti GPT4:ää. Niiden tekninen raportti ei sisällä "details about the architecture (including model size), hardware, training compute, dataset construction, training method, or similar
". Tiedämme, että GPT4 on koulutettu muuntajatyyppinen generatiivinen monimuotomalli. Sekä julkisesti saatavilla olevista tiedoista että kolmannen osapuolen tiedoista, jotka on lisensoitu ja myöhemmin hienosäädetty RLHF:n avulla. Mielenkiintoista on, että OpenAI jakoi tietoja päivitetyistä RLHF-tekniikoistaan tehdäkseen mallivastauksista tarkempia ja vähentääkseen todennäköisyyttä ajautua turvakaiteiden ulkopuolelle.
Käytännön mallin koulutuksen jälkeen (kuten ChatGPT:n kanssa) RLHF:ää käytetään kontradiktorisessa koulutuksessa, prosessissa, joka kouluttaa mallia haitallisille esimerkeille, joiden tarkoituksena on huijata malli puolustamaan sitä tällaisia esimerkkejä vastaan tulevaisuudessa. GPT4:n tapauksessa asiantuntijat arvioivat poliittisen mallin vastauksia ristiriitaisiin vaatimuksiin. Näitä vastauksia käytetään sitten lisäpalkkiomallien kouluttamiseen, jotka tarkentavat käytäntömallia iteratiivisesti, jolloin tuloksena on malli, joka ei todennäköisesti tarjoa vaarallisia, vältteleviä tai epätarkkoja vastauksia.
Toiminnallisesti ChatGPT ja GPT4 ovat enemmän samanlaisia kuin erilaisia. Kuten edeltäjänsä, myös GPT-4 toimii keskustelutyylillä, jonka tavoitteena on olla käyttäjän kanssa linjassa. Kuten alla näet, vastaukset kahden mallin välillä laajaan kysymykseen ovat hyvin samankaltaisia.
OpenAI on samaa mieltä siitä, että mallien välinen ero voi olla hienovarainen ja toteaa, että "ero tulee esiin, kun tehtävän monimutkaisuus saavuttaa riittävän kynnyksen". Kun otetaan huomioon kuuden kuukauden kontradiktorinen koulutus, jonka GPT4-perusmalli kävi läpi harjoituksen jälkeisessä vaiheessa, tämä on luultavasti tarkka luonnehdinta.
Toisin kuin ChatGPT, joka hyväksyy vain tekstiä, GPT4 hyväksyy sekä kuva- että tekstikehotteet palauttaen tekstivastauksia. Tätä kirjoitettaessa kyky käyttää kuvasyötteitä ei valitettavasti ole vielä julkisesti saatavilla.
Kuten edellä mainittiin, OpenAI raportoi GPT4:n tietoturvasuorituskyvyn merkittävästä parantumisesta verrattuna GPT-3.5:een (josta ChatGPT viritettiin). Tällä hetkellä on kuitenkin epäselvää, onko:
johtuvat itse GPT4-mallista tai ylimääräisistä ristiriitaisista testeistä.
Lisäksi GPT4 ylittää CPT-3.5:n useimmissa ihmisen suorittamissa akateemisissa ja ammatillisissa kokeissa. Erityisesti GPT4 saa 90. prosenttipisteen Uniform Bar -kokeessa verrattuna GPT-3.5:een, joka on 10. prosenttipiste. GPT4 on myös huomattavasti parempi kuin edeltäjänsä perinteisissä kielimallien vertailuarvoissa ja muissa SOTA-malleissa (tosin joskus kapeasti).
Sekä ChatGPT:llä että GPT4:llä on merkittäviä rajoituksia ja riskejä. GPT-4-järjestelmälehti sisältää oivalluksia näiden riskien yksityiskohtaisesta selvityksestä, jonka OpenAI on tehnyt.
Nämä ovat vain muutamia riskejä, jotka liittyvät molempiin malleihin:
Vaikka ChatGPT ja GPT-4 kamppailevat samojen rajoitusten ja riskien kanssa, OpenAI on tehnyt erityisiä ponnisteluja, mukaan lukien lukuisia ristiriitaisia testejä, lieventääkseen niitä GPT-4:lle. Vaikka tämä on rohkaisevaa, GPT-4-järjestelmälehti osoittaa lopulta, kuinka haavoittuva ChatGPT oli (ja ehkä on edelleen). Tarkemman selityksen haitallisista ei-toivotuista seurauksista suosittelen lukemaan GPT-4-järjestelmälehti, joka alkaa sivulta 38. GPT-4 tekninen raportti .
Vaikka tiedämme vähän GPT4:n malliarkkitehtuurista ja koulutusmenetelmistä, ChatGPT:stä näyttää olevan hienostunut versio. Itse asiassa tällä hetkellä GPT4 pystyy hyväksymään kuvia ja tekstinsyöttöä, ja tulokset ovat turvallisempia, tarkempia ja luovempia. Valitettavasti meidän on uskottava OpenAI:n sana, sillä GPT4 on saatavilla vain osana ChatGPT Plus -tilausta.
Pysy ajan tasalla näiden mallien edistymisestä, riskeistä ja rajoituksista on erittäin tärkeää navigoidessamme tässä jännittävässä, mutta nopeasti kehittyvässä suurten kielimallien maisemissa.
BlogInnovazione.it
Microsoft Excel on vertailutyökalu tietojen analysointiin, koska se tarjoaa monia ominaisuuksia tietojoukkojen järjestämiseen,…
Walliance, SIM ja alusta Euroopan johtajien joukossa kiinteistöjen joukkorahoituksen alalla vuodesta 2017 lähtien, ilmoittaa valmistuneensa…
Filament on "kiihdytetty" Laravel-kehityskehys, joka tarjoaa useita täyden pinon komponentteja. Se on suunniteltu yksinkertaistamaan prosessia…
"Minun on palattava saadakseni evoluutioni päätökseen: projisoin itseni tietokoneen sisään ja minusta tulee puhdasta energiaa. Asuttuaan…
Google DeepMind esittelee parannetun version tekoälymallistaan. Uusi parannettu malli tarjoaa paitsi…
Laravel, joka on kuuluisa elegantista syntaksistaan ja tehokkaista ominaisuuksistaan, tarjoaa myös vankan perustan modulaariselle arkkitehtuurille. Siellä…
Cisco ja Splunk auttavat asiakkaita nopeuttamaan matkaansa tulevaisuuden Security Operations Centeriin (SOC)…
Ransomware on hallinnut uutisia viimeisen kahden vuoden ajan. Useimmat ihmiset tietävät hyvin, että hyökkäykset…