Artikoli

Parsing tat-test bl-użu ta' chatGPT

L-analiżi tat-test, jew it-tħaffir tat-test, hija teknika vitali għall-estrazzjoni ta’ għarfien siewi minn ammonti kbar ta’ dejta tat-test mhux strutturata. 

Tinvolvi l-ipproċessar u l-analiżi tat-test biex jiskopru mudelli, xejriet u relazzjonijiet.

Jippermetti kumpaniji, riċerkaturi u organizzazzjonijiet biex jieħdu deċiżjonijiet ibbażati fuq informazzjoni miġbura mit-testi. 

Hekk kif il-volum ta' dejta mhux strutturata qed ikompli jikber b'mod esponenzjali, il-ħtieġa għal għodod analitiċi tat-test preċiżi u effiċjenti saret dejjem aktar kritika f'industriji differenti bħall-marketing, il-finanzi, il-kura tas-saħħa u x-xjenzi soċjali.

Tradizzjonalment, l-analiżi tat-test saret bl-użu ta’ metodi bbażati fuq ir-regoli u tekniki ta’ tagħlim bil-magni bħal SpaCY u t-teknika tat-transformer. Filwaqt li dawn il-metodi wrew li huma effettivi, huma jeħtieġu sforz konsiderevoli u kompetenza biex jiġu perfezzjonati.

Bil-miġja ta 'mudelli lingwistiċi kbar (LLM) bħal Chat GPT di OpenAI. Wera kapaċitajiet notevoli fil-ġenerazzjoni ta’ test li jixbaħ lill-bniedem u kuntest ta’ fehim, li jagħmilha għodda promettenti għall-kompiti ta’ analiżi tat-test bħal entity recognition, sentiment analysisU topic modeling.

Ejja naraw issa kif nistgħu nagħmlu parsing tat-test billi tuża ChatGPT.

Metodu tradizzjonali (mudelli singoli) vs. LLM

Fil-passat, dejjem użajna mudelli differenti għal kompiti differenti fit-tagħlim tal-magni. Pereżempju, jekk irrid niġbed l-għarfien minn test, ikolli bżonn nuża mudell ta’ rikonoxximent tal-entità msemmija (NER – Named Entity Recognition), jekk għandi bżonn nikklassifika t-test tiegħi fi klassijiet separati, ikolli bżonn mudell ta' klassifikazzjoni. Kull attività differenti kienet teħtieġ li l-mudelli jiġu mħarrġa b’mod differenti għal kull attività, jew permezz ta’ tagħlim ta’ trasferiment jew permezz ta’ taħriġ.

Bl-introduzzjoni ta Large Language Models (LLM), mudell LLM se jkun kapaċi jwettaq kompiti multipli NLP bi jew mingħajr taħriġ. Kwalunkwe attività tista 'tkun defilest sempliċiment billi tbiddel l-istruzzjonijiet fil-promps.

Issa ejja naraw kif tagħmel il-kompitu tradizzjonali tal-NLP fi Chat GPT u qabbilha mal-mod tradizzjonali. Il-kompiti NLP li se jitwettqu minn Chat GPT f'dan l-artikolu huma:

  • Estrazzjoni tal-Għarfien (NER)
  • Klassifikazzjoni tat-test
  • Sentiment analysis
  • Sommarju

Estrazzjoni tal-Għarfien (NER)

Ir-Rikonoxximent tal-Entitajiet bl-Ismijiet (NER) jirreferi għall-kompitu li tidentifika awtomatikament termini fi blokki differenti ta’ data testwali. Huwa prinċipalment użat biex jiġu estratti kategoriji ta 'entitajiet importanti bħal ismijiet ta' drogi minn noti kliniċi, termini relatati ma 'inċidenti minn pretensjonijiet ta' assigurazzjoni, u termini oħra speċifiċi għal dominju mir-rekords.

Innota li din l-attività hija speċifika għad-dominju mediku. Kien jirrikjedi li nanotaw u nħarrġu aktar minn 10.000 ringiela ta 'dejta għal mudell wieħed biex ikun jaf il-klassi u t-terminu speċifiċi fit-test. ChatGPT jista 'jidentifika b'mod korrett it-terminu mingħajr ebda test imħarreġ minn qabel jew irfinar, li huwa riżultat relattivament tajjeb!

Klassifikazzjoni tat-test

Il-klassifikazzjonijiet tat-test jirreferu għall-proċess awtomatiku tas-sejba u l-klassifikazzjoni tat-test f'kategoriji minn data enormi, għandu rwol essenzjali fl-irkupru u l-estrazzjoni tad-data tat-test. Eżempji ta' applikazzjonijiet ta' klassifikazzjoni ta' test jinkludu twissijiet kliniċi jew kategorizzazzjoni tal-fatturi ta' riskju, klassifikazzjoni dijanjostika awtomatika, u skoperta ta' spam.

Sentiment analysis

Sentiment analysis jinvolvi d-determinazzjoni tas-sentiment jew l-emozzjoni espressa f'biċċa test. Għandu l-għan li jikklassifika t-test f'kategoriji minn qabeldefinite, bħala pożittiv, negattiv jew newtrali, ibbażat fuq is-sentiment sottostanti mwassal mill-awtur. 

L-applikazzjonijiet tal-analiżi tas-sentimenti jinkludu:

  • analiżi tar-reviżjonijiet tal-klijenti u l-feedback,
  • traċċar tas-sentiment tal-midja soċjali,
  • monitoraġġ tat-tendenzi tas-suq e
  • il-kejl tas-sentiment politiku waqt kampanji elettorali.

Sommarju

Is-sommarji awtomatiċi jirreferu għall-proċess li bih is-suġġetti ewlenin ta’ dokument wieħed jew aktar jiġu identifikati u ppreżentati b’mod konċiż u preċiż. Dan jippermetti lill-utent biex jagħti ħarsa lejn biċċiet kbar ta 'data fi żmien qasir. Eżempji ta' applikazzjonijiet jinkludu sistema ta' sommarju li tippermetti l-ġenerazzjoni awtomatika ta' astratti minn artikli tal-aħbarijiet u s-sommar ta' informazzjoni billi jiġu estratti sentenzi minn estratti ta' karti ta' riċerka.

ChatGPT hija għodda eċċellenti fil-qosor, speċjalment għal artikoli twal u reviżjonijiet ikkumplikati. Billi nwaħħal ir-reviżjonijiet f'ChatGPT, nistgħu faċilment inkunu nafu s-sommarju tar-reviżjoni tal-prodott f'daqqa t'għajn.

Limitu tal-LLMs

Peress li l-għan ta 'dan l-artikolu huwa li jesplora l-kapaċità tal-LLMs biex iwettqu kompiti ta' analiżi tat-test, huwa essenzjali li jiġu rikonoxxuti wkoll il-limitazzjonijiet tagħhom. Uħud mil-limitazzjonijiet ewlenin tal-LLMs jinkludu:

  1. L-użu tar-riżorsi : L-użu tal-LLMs jeħtieġ riżorsi komputazzjonali u finanzjarji sinifikanti, li jistgħu jkunu sfida għal organizzazzjonijiet iżgħar jew riċerkaturi individwali b'riżorsi limitati. Mil-lum, ChatGPT jaċċetta biss madwar 8.000 token għall-input u l-output, biex janalizza ammont kbir ta 'dejta, jeħtieġ li l-utent ikisser it-test f'biċċiet multipli ta' dejta, u jista 'jeħtieġ sejħiet API multipli għal kompiti.
  2. Sensittività għall-frażi fil-pront : Il-prestazzjoni tal-LLMs tista' tiġi affettwata mill-mod kif jiġu fformulati l-prompts. Bidla żgħira fil-kliem fil-pront tista' tipproduċi riżultati differenti, li jistgħu jkunu kawża ta' tħassib meta wieħed ifittex output konsistenti u affidabbli.
  3. Nuqqas ta' kompetenza speċifika tad-dominju : Filwaqt li l-LLMs għandhom fehim ġenerali ta’ diversi oqsma, jista’ ma jkollhomx l-istess livell ta’ għarfien espert bħal mudelli speċjalizzati mħarrġa fuq data speċifika għal dominju. B'riżultat ta' dan, il-prestazzjoni tagħhom tista' ma tkunx l-aħjar f'xi każijiet u tista' teħtieġ irfinar jew għarfien estern, partikolarment meta jittrattaw informazzjoni speċjalizzata jew teknika ħafna.

Ercole Palmeri

Newsletter dwar l-innovazzjoni
Titlifx l-aktar aħbarijiet importanti dwar l-innovazzjoni. Irreġistra biex tirċevihom bl-email.

Artikoli riċenti

Il-pubblikaturi u l-OpenAI jiffirmaw ftehimiet biex jirregolaw il-fluss tal-informazzjoni pproċessata mill-Intelliġenza Artifiċjali

It-Tnejn li għadda, il-Financial Times ħabbret ftehim mal-OpenAI. FT tagħti liċenzja għall-ġurnaliżmu ta’ klassi dinjija tagħha...

April 30 2024

Ħlasijiet Online: Hawn Kif Is-Servizzi ta' Streaming Jagħmel Inti Tħallas Għal Dejjem

Miljuni ta 'nies iħallsu għal servizzi ta' streaming, iħallsu miżati ta 'abbonament ta' kull xahar. Hija opinjoni komuni li inti...

April 29 2024

Veeam għandu l-aktar appoġġ komprensiv għar-ransomware, mill-protezzjoni għar-rispons u l-irkupru

Coveware minn Veeam se jkompli jipprovdi servizzi ta' rispons għal inċidenti ta' estorsjoni ċibernetika. Coveware se joffri forensiċi u kapaċitajiet ta' rimedju...

April 23 2024

Rivoluzzjoni Ekoloġika u Diġitali: Kif il-Manutenzjoni Predittiva qed tittrasforma l-Industrija taż-Żejt u l-Gass

Il-manutenzjoni ta’ tbassir qed tirrivoluzzjona s-settur taż-żejt u l-gass, b’approċċ innovattiv u proattiv għall-ġestjoni tal-impjant...

April 22 2024