Во последниве месеци, брзината со која се пуштаат иновативни големи јазични модели е неверојатна. Во оваа статија, ќе ги покриеме главните сличности и разлики помеѓу GPT4 и ChatGPT, вклучувајќи ги и методите за обука, перформансите, можностите и ограничувањата.
GPT4 и ChatGPT се надоврзуваат на постари верзии на GPT модели со подобрувања на архитектурата на моделот, користејќи пософистицирани методи за обука и со поголем број параметри за обука.
Двата дизајни се засноваат на архитектурата на трансформаторот, која користи енкодер за обработка на влезните секвенци и декодер за генерирање излезни секвенци. Кодерот и декодерот се поврзани со механизам, кој му овозможува на декодерот да посвети поголемо внимание на најзначајните влезни секвенци.
Техничкиот извештај GPT4 на OpenAI нуди мал увид во архитектурата на моделот и процесот на формирање GPT4, повикувајќи се на „competitive landscape and the safety implications of large-scale models
“. Она што го знаеме е дека GPT4 и ChatGPT веројатно се обучуваат слично, што е прилично разлика од методите за обука што се користат за GPT-2 и GPT-3. Знаеме многу повеќе за методите за обука за ChatGPT отколку GPT4, па ќе започнеме од таму.
ChatGPT е обучен со збирки на податоци за дијалози, вклучително и демо-податоци, каде што човечките прибележувачи го демонстрираат очекуваниот излез од помошникот за чет-бот како одговор на конкретни барања. Овие податоци се користат за прилагодување на GPT3.5 со надгледувано учење, создавајќи модел на политика, кој се користи за генерирање на повеќе одговори кога се обезбедуваат барања. Човечките прибележувачи потоа класифицираат кој од одговорите за дадено известување дал најдобри резултати, што се користи за обука на модел на награда. Моделот на награда потоа се користи за повторливо дотерување на моделот на политиката користејќи засилено учење.
ChatGPT се тренира со користење Зајакнување на учење од човечки повратни информации (RLHF), начин да се вклучат човечки повратни информации за да се подобри јазичниот модел за време на обуката. Ова му овозможува на излезот од моделот да се усогласи со активноста што ја бара корисникот, наместо само да го предвидува следниот збор во реченицата врз основа на генерички податоци за обука, како што е GPT-3.
OpenAI допрва треба да открие детали за тоа како го обучувал GPT4. Нивниот технички извештај не вклучува „details about the architecture (including model size), hardware, training compute, dataset construction, training method, or similar
“. Она што го знаеме е дека GPT4 е обучен генеративен мултимоден модел во стил на трансформатор. И за јавно достапни податоци и за податоци од трета страна лиценцирани и последователно фино подесени со користење на RLHF. Интересно, OpenAI сподели детали во врска со нивните ажурирани RLHF техники за да ги направи одговорите на моделот попрецизни и со помала веројатност да се движат надвор од заштитните огради.
По обуката на моделот на политика (како кај ChatGPT), RLHF се користи во обука за противници, процес кој го обучува моделот на злонамерни примери наменети да го измамат моделот да го одбрани од такви примери во иднина. Во случајот со GPT4, експертите ги оценуваат одговорите на политичкиот модел на контрадикторните барања. Овие одговори потоа се користат за обука на дополнителни модели за наградување кои повторливо го усовршуваат моделот на политиката, што резултира со модел кој е со помала веројатност да обезбеди опасни, заобиколни или неточни одговори.
Во однос на функционалноста, ChatGPT и GPT4 се повеќе слични отколку различни. Како и неговиот претходник, GPT-4 исто така комуницира во стил на разговор кој има за цел да се усогласи со корисникот. Како што можете да видите подолу, одговорите помеѓу двата модели за широко прашање се многу слични.
OpenAI се согласува дека разликата помеѓу моделите може да биде суптилна и вели дека „разликата се појавува кога сложеноста на задачата ќе достигне доволен праг“. Со оглед на шестмесечната обука за спротивставување што ги помина основниот модел GPT4 во фазата по обуката, ова е веројатно точна карактеризација.
За разлика од ChatGPT, кој прифаќа само текст, GPT4 прифаќа и слика и текст, враќајќи ги текстуалните одговори. До моментот на пишување, за жал, можноста за користење на влезови на слики сè уште не е јавно достапна.
Како што споменавме погоре, OpenAI известува за значително подобрување во безбедносните перформанси за GPT4, во споредба со GPT-3.5 (од каде што беше подесен ChatGPT). Сепак, засега не е јасно дали:
се должат на самиот модел GPT4 или на дополнителните контрадикторни тестови.
Дополнително, GPT4 го надминува CPT-3.5 во повеќето академски и стручни испити положени од луѓе. Забележително, GPT4 постигнува резултати во 90-тиот перцентил на Uniform Bar-испитот во споредба со GPT-3.5, кој постигнува резултати во 10-тиот перцентил. GPT4, исто така, значително го надминува својот претходник во однос на реперите за традиционални јазични модели и други модели SOTA (иако понекогаш со тесно).
И ChatGPT и GPT4 имаат значителни ограничувања и ризици. Системскиот лист GPT-4 вклучува увид од деталното истражување на тие ризици спроведено од OpenAI.
Ова се само некои од ризиците поврзани со двата модели:
Додека ChatGPT и GPT-4 се борат со истите ограничувања и ризици, OpenAI направи посебни напори, вклучувајќи бројни контрадикторни тестови, за да ги ублажи за GPT-4. Иако ова е охрабрувачки, системскиот лист GPT-4 на крајот демонстрира колку ChatGPT бил ранлив (и можеби сè уште е). За подетално објаснување на штетните несакани последици, препорачувам да го прочитате системскиот лист GPT-4, кој започнува на страница 38 од Технички извештај GPT-4 .
Иако знаеме малку за архитектурата на моделот и методите за обука зад GPT4, се чини дека постои рафинирана верзија на ChatGPT. Всушност, моментално GPT4 може да прифаќа слики и внесување текст, а резултатите се побезбедни, попрецизни и покреативни. За жал, ќе мора да го прифатиме зборот на OpenAI, бидејќи GPT4 е достапен само како дел од претплатата за ChatGPT Plus.
Да се остане информиран за напредокот, ризиците и ограничувањата на овие модели е од суштинско значење додека се движиме низ овој возбудлив, но брзо се развива пејзаж на големи јазични модели.
BlogInnovazione.it
Microsoft Excel е референтна алатка за анализа на податоци, бидејќи нуди многу функции за организирање на збирки на податоци,…
Walliance, SIM и платформата меѓу лидерите во Европа во областа на Crowdfunding за недвижности од 2017 година, го најавува завршувањето…
Филаментот е „забрзана“ развојна рамка на Ларавел, која обезбедува неколку компоненти со целосен оџак. Тој е дизајниран да го поедностави процесот на…
„Морам да се вратам за да ја завршам мојата еволуција: ќе се проектирам себеси во компјутерот и ќе станам чиста енергија. Откако се населиле во…
Google DeepMind воведува подобрена верзија на својот модел за вештачка интелигенција. Новиот подобрен модел обезбедува не само…
Ларавел, познат по својата елегантна синтакса и моќните карактеристики, исто така обезбедува цврста основа за модуларна архитектура. Таму…
Cisco и Splunk им помагаат на клиентите да го забрзаат своето патување до Центарот за безбедносни операции (SOC) на иднината со…
Ransomware доминира во вестите во последните две години. Повеќето луѓе се свесни дека нападите…