членовите

GPT4 vs ChatGPT: Ги анализираме методите за обука, перформансите, можностите и ограничувањата

Новиот генеративен јазичен модел се очекува целосно да трансформира цели индустрии, вклучувајќи ги медиумите, образованието, правото и технологијата. 

Во последниве месеци, брзината со која се пуштаат иновативни големи јазични модели е неверојатна. Во оваа статија, ќе ги покриеме главните сличности и разлики помеѓу GPT4 и ChatGPT, вклучувајќи ги и методите за обука, перформансите, можностите и ограничувањата.

GPT4 наспроти Разговор GPT: Сличности и разлики во методите на обука

GPT4 и ChatGPT се надоврзуваат на постари верзии на GPT модели со подобрувања на архитектурата на моделот, користејќи пософистицирани методи за обука и со поголем број параметри за обука.

Двата дизајни се засноваат на архитектурата на трансформаторот, која користи енкодер за обработка на влезните секвенци и декодер за генерирање излезни секвенци. Кодерот и декодерот се поврзани со механизам, кој му овозможува на декодерот да посвети поголемо внимание на најзначајните влезни секвенци.

Техничкиот извештај GPT4 на OpenAI нуди мал увид во архитектурата на моделот и процесот на формирање GPT4, повикувајќи се на „competitive landscape and the safety implications of large-scale models“. Она што го знаеме е дека GPT4 и ChatGPT веројатно се обучуваат слично, што е прилично разлика од методите за обука што се користат за GPT-2 и GPT-3. Знаеме многу повеќе за методите за обука за ChatGPT отколку GPT4, па ќе започнеме од таму.

Разговор GPT

ChatGPT е обучен со збирки на податоци за дијалози, вклучително и демо-податоци, каде што човечките прибележувачи го демонстрираат очекуваниот излез од помошникот за чет-бот како одговор на конкретни барања. Овие податоци се користат за прилагодување на GPT3.5 со надгледувано учење, создавајќи модел на политика, кој се користи за генерирање на повеќе одговори кога се обезбедуваат барања. Човечките прибележувачи потоа класифицираат кој од одговорите за дадено известување дал најдобри резултати, што се користи за обука на модел на награда. Моделот на награда потоа се користи за повторливо дотерување на моделот на политиката користејќи засилено учење.

ChatGPT се тренира со користење Зајакнување на учење од човечки повратни информации (RLHF), начин да се вклучат човечки повратни информации за да се подобри јазичниот модел за време на обуката. Ова му овозможува на излезот од моделот да се усогласи со активноста што ја бара корисникот, наместо само да го предвидува следниот збор во реченицата врз основа на генерички податоци за обука, како што е GPT-3.

GPT4

OpenAI допрва треба да открие детали за тоа како го обучувал GPT4. Нивниот технички извештај не вклучува „details about the architecture (including model size), hardware, training compute, dataset construction, training method, or similar“. Она што го знаеме е дека GPT4 е обучен генеративен мултимоден модел во стил на трансформатор. И за јавно достапни податоци и за податоци од трета страна лиценцирани и последователно фино подесени со користење на RLHFИнтересно, OpenAI сподели детали во врска со нивните ажурирани RLHF техники за да ги направи одговорите на моделот попрецизни и со помала веројатност да се движат надвор од заштитните огради.

По обуката на моделот на политика (како кај ChatGPT), RLHF се користи во обука за противници, процес кој го обучува моделот на злонамерни примери наменети да го измамат моделот да го одбрани од такви примери во иднина. Во случајот со GPT4, експертите ги оценуваат одговорите на политичкиот модел на контрадикторните барања. Овие одговори потоа се користат за обука на дополнителни модели за наградување кои повторливо го усовршуваат моделот на политиката, што резултира со модел кој е со помала веројатност да обезбеди опасни, заобиколни или неточни одговори.

GPT4 vs ChatGPT сличности и разлики во однос на перформансите и можностите

Капацитет

Во однос на функционалноста, ChatGPT и GPT4 се повеќе слични отколку различни. Како и неговиот претходник, GPT-4 исто така комуницира во стил на разговор кој има за цел да се усогласи со корисникот. Како што можете да видите подолу, одговорите помеѓу двата модели за широко прашање се многу слични.

OpenAI се согласува дека разликата помеѓу моделите може да биде суптилна и вели дека „разликата се појавува кога сложеноста на задачата ќе достигне доволен праг“. Со оглед на шестмесечната обука за спротивставување што ги помина основниот модел GPT4 во фазата по обуката, ова е веројатно точна карактеризација.

За разлика од ChatGPT, кој прифаќа само текст, GPT4 прифаќа и слика и текст, враќајќи ги текстуалните одговори. До моментот на пишување, за жал, можноста за користење на влезови на слики сè уште не е јавно достапна.

Престазион

Како што споменавме погоре, OpenAI известува за значително подобрување во безбедносните перформанси за GPT4, во споредба со GPT-3.5 (од каде што беше подесен ChatGPT). Сепак, засега не е јасно дали:

  • намалување на одговорите на барањата за забранета содржина,
  • намалување на создавањето на токсични содржини д
  • подобрување на одговорите на чувствителни теми

се должат на самиот модел GPT4 или на дополнителните контрадикторни тестови.

Дополнително, GPT4 го надминува CPT-3.5 во повеќето академски и стручни испити положени од луѓе. Забележително, GPT4 постигнува резултати во 90-тиот перцентил на Uniform Bar-испитот во споредба со GPT-3.5, кој постигнува резултати во 10-тиот перцентил. GPT4, исто така, значително го надминува својот претходник во однос на реперите за традиционални јазични модели и други модели SOTA (иако понекогаш со тесно).

GPT4 наспроти ChatGPT: разлики и ограничувањаi

И ChatGPT и GPT4 имаат значителни ограничувања и ризици. Системскиот лист GPT-4 вклучува увид од деталното истражување на тие ризици спроведено од OpenAI.

Ова се само некои од ризиците поврзани со двата модели:

  • Халуцинации (тенденција за производство на бесмислена или фактички неточна содржина)
  • Произведувајте штетна содржина што ги прекршува политиките на OpenAI (на пр. говор на омраза, поттикнување насилство)
  • Засилување и овековечување на стереотипите на маргинализираните луѓе
  • Генерирајте реални дезинформации наменети да измамат

Додека ChatGPT и GPT-4 се борат со истите ограничувања и ризици, OpenAI направи посебни напори, вклучувајќи бројни контрадикторни тестови, за да ги ублажи за GPT-4. Иако ова е охрабрувачки, системскиот лист GPT-4 на крајот демонстрира колку ChatGPT бил ранлив (и можеби сè уште е). За подетално објаснување на штетните несакани последици, препорачувам да го прочитате системскиот лист GPT-4, кој започнува на страница 38 од Технички извештај GPT-4 .

заклучок

Иако знаеме малку за архитектурата на моделот и методите за обука зад GPT4, се чини дека постои рафинирана верзија на ChatGPT. Всушност, моментално GPT4 може да прифаќа слики и внесување текст, а резултатите се побезбедни, попрецизни и покреативни. За жал, ќе мора да го прифатиме зборот на OpenAI, бидејќи GPT4 е достапен само како дел од претплатата за ChatGPT Plus.

Да се ​​остане информиран за напредокот, ризиците и ограничувањата на овие модели е од суштинско значење додека се движиме низ овој возбудлив, но брзо се развива пејзаж на големи јазични модели.

BlogInnovazione.it

Вие исто така може да бидат заинтересирани

Билтен за иновации
Не пропуштајте ги најважните вести за иновациите. Пријавете се за да ги добивате по е-пошта.

Последни написи

Како најдобро да се организираат податоци и формули во Excel, за добро направена анализа

Microsoft Excel е референтна алатка за анализа на податоци, бидејќи нуди многу функции за организирање на збирки на податоци,…

14 мај 2024

Позитивен заклучок за два важни проекти на Walliance Equity Crowdfunding: Jesolo Wave Island и Milano Via Ravenna

Walliance, SIM и платформата меѓу лидерите во Европа во областа на Crowdfunding за недвижности од 2017 година, го најавува завршувањето…

13 мај 2024

Што е Филамент и како да се користи Ларавел Филамент

Филаментот е „забрзана“ развојна рамка на Ларавел, која обезбедува неколку компоненти со целосен оџак. Тој е дизајниран да го поедностави процесот на…

13 мај 2024

Под контрола на вештачката интелигенција

„Морам да се вратам за да ја завршам мојата еволуција: ќе се проектирам себеси во компјутерот и ќе станам чиста енергија. Откако се населиле во…

10 мај 2024

Новата вештачка интелигенција на Google може да моделира ДНК, РНК и „сите молекули на животот“

Google DeepMind воведува подобрена верзија на својот модел за вештачка интелигенција. Новиот подобрен модел обезбедува не само…

9 мај 2024

Истражување на модуларната архитектура на Ларавел

Ларавел, познат по својата елегантна синтакса и моќните карактеристики, исто така обезбедува цврста основа за модуларна архитектура. Таму…

9 мај 2024

Cisco Hypershield и стекнување на Splunk Започнува новата ера на безбедност

Cisco и Splunk им помагаат на клиентите да го забрзаат своето патување до Центарот за безбедносни операции (SOC) на иднината со…

8 мај 2024

Надвор од економската страна: неочигледната цена на откупниот софтвер

Ransomware доминира во вестите во последните две години. Повеќето луѓе се свесни дека нападите…

6 мај 2024

Читајте иновации на вашиот јазик

Билтен за иновации
Не пропуштајте ги најважните вести за иновациите. Пријавете се за да ги добивате по е-пошта.

Следете нас