articuli

Analisi di testu utilizendu chatGPT

L'analitica di testu, o minatura di testu, hè una tecnica vitale per l'estrazione di insights preziosi da una grande quantità di dati di testu senza struttura. 

Implica l'elaborazione è l'analisi di testu per scopre mudelli, tendenzi è relazioni.

Permette à l'imprese, i circadori è l'urganisazioni di piglià decisioni basate nantu à l'infurmazioni raccolte da i testi. 

Siccomu u voluminu di dati non strutturati cuntinueghja à cresce in modu esponenziale, a necessità di strumenti di analisi di testu precisi è efficaci hè diventata sempre più critica in settori diversi cum'è marketing, finanza, sanità è scienze suciale.

Tradizionalmente, l'analisi di u testu hè stata realizata cù metudi basati in regule è tecniche d'apprendimentu di machine cum'è SpaCY è a tecnica di trasformatore. Mentre chì sti metudi anu dimustratu efficaci, necessitanu un sforzu considerableu è sapè fà per perfezzione.

Cù l'avventu di mudelli di lingua maiò (LLM) cum'è Chat GPT di OpenAI. Hà dimustratu capacità rimarchevuli in a generazione di testu simili à l'omu è di capiscenu u cuntestu, facendu un strumentu promettente per i travaglii di analisi di testu cum'è entity recognition, sentiment analysis, e topic modeling.

Videmu avà cumu pudemu fà l'analisi di testu cù ChatGPT.

Metudu tradiziunale (modelli unichi) vs. LLM

In u passatu, avemu sempre utilizatu mudelli diffirenti per e diverse attività in l'apprendimentu machine. Per esempiu, se vogliu caccià a cunniscenza da un testu, aghju bisognu di utilizà un mudellu di ricunniscenza di l'entità chjamata (NER - Named Entity Recognition), se aghju bisognu di classificà u mo testu in classi separati, aghju bisognu di un mudellu di classificazione. Ogni attività diversa esigeva chì i mudelli sò furmatu in modu diversu per ogni attività, sia per l'apprendimentu di trasferimentu sia per a furmazione.

Cù l'intruduzioni di Large Language Models (LLM), un mudellu LLM serà capaci di realizà parechje attività NLP cù o senza furmazione. Ogni attività pò esse defifinitu solu cambiendu l'istruzzioni in i prompts.

Avà vedemu cumu fà u travagliu tradiziunale di NLP in Chat GPT è paragunà cù u modu tradiziunale. I travaglii NLP chì seranu realizati da Chat GPT in questu articulu sò:

  • Estrazione di cunniscenza (NER)
  • Classificazione di u testu
  • Sentiment analysis
  • Riassuntu

Estrazione di cunniscenza (NER)

A Ricunniscenza di l'Entità Named (NER) si riferisce à u compitu di identificà automaticamente i termini in diversi blocchi di dati testuali. Hè principarmenti utilizatu per caccià e categurie di entità impurtanti cum'è i nomi di droghe da note cliniche, termini ligati à l'accidenti da e richieste d'assicuranza, è altri termini specifichi di u duminiu da i registri.

Nota chì sta attività hè specifica per u duminiu medico. Adupratu per esse bisognu di annotà è furmà più di 10.000 XNUMX fila di dati per un mudellu unicu per sapè a classa specifica è u termu in u testu. ChatGPT pò identificà currettamente u terminu senza alcun testu pre-addestratu o fine-tuning, chì hè un risultatu relativamente bonu!

Classificazione di u testu

Classificazioni di testu si riferisce à u prucessu automaticu di truvà è classificà u testu in categurie da dati enormi, ghjucanu un rolu essenziale in a ricuperazione è l'estrazione di dati di testu. Esempii di l'applicazioni di classificazione di testu includenu alerti clinichi o categurizazione di fattori di risicu, classificazione di diagnostica automatica è rilevazione di spam.

Sentiment analysis

Sentiment analysis implica a determinazione di u sensu o l'emozione spressione in un pezzu di testu. U scopu di classificà u testu in pre categuriedefinite, cum'è pusitivu, negativu o neutru, basatu annantu à u sentimentu sottumessu trasmessu da l'autore. 

L'applicazioni di l'analisi di sentimenti includenu:

  • analisi di recensioni di clienti è feedback,
  • traccia u sentimentu di e social media,
  • monitorà i tendenzi di u mercatu e
  • a misurazione di u sentimentu puliticu durante e campagne elettorali.

Riassuntu

I riassunti automatichi riferenu à u prucessu per quale i temi principali di unu o più documenti sò identificati è presentati in una manera concisa è precisa. Questu permette à l'utilizatore per piglià un ochju à grossi pezzi di dati in pocu tempu. L'applicazioni di esempiu includenu un sistema di riassuntu chì permette a generazione automatica di abstracts da articuli di notizie è a summarization di l'infurmazioni estrattendu frasi da abstract papers di ricerca.

ChatGPT hè un strumentu di riassuntu eccellente, in particulare per articuli longu è recensioni complicate. Incollandu e recensioni in ChatGPT, pudemu cunnosce facilmente u riassuntu di a revisione di u produttu in un sguardu.

Limite di i LLM

Siccomu u scopu di stu articulu hè di scopra a capacità di LLMs per eseguisce attività di analisi di testu, hè essenziale per ricunnosce ancu e so limitazioni. Alcune di e limitazioni chjave di LLM includenu:

  1. Utilizazione di risorse : L'usu di LLM richiede risorse computazionali è finanziarie significative, chì ponu esse una sfida per l'urganisazioni più chjuche o i ricercatori individuali cù risorse limitate. A data d'oghje, ChatGPT accetta solu circa 8.000 tokens per input è output, per analizà una grande quantità di dati, esige chì l'utilizatore rompe u testu in parechji pezzi di dati, è pò esse bisognu di parechje API chjamate per i travaglii.
  2. Sensibilità à a frase immediata : U rendimentu di i LLM pò esse influenzatu da a manera chì i prompts sò formulati. Un ligeru cambiamentu in a formulazione pronta pò pruduce risultati diffirenti, chì puderia esse una causa di preoccupazione quandu cercate un output coherente è affidabile.
  3. Mancanza di cumpetenza specifica di u duminiu : Mentre chì i LLM anu una cunniscenza generale di diversi duminii, ùn anu micca u listessu livellu di sapè cum'è mudelli specializati furmati nantu à dati specifichi di u duminiu. In u risultatu, u so rendimentu pò esse micca ottimali in certi casi è ponu esse bisognu di fine-tuning o cunniscenze esterne, particularmente quandu si tratta di infurmazioni altamente specializate o tecniche.

Ercole Palmeri

Newsletter di l'innovazione
Ùn mancate micca e nutizie più impurtanti nantu à l'innuvazione. Iscriviti per riceveli per email.

Articuli recenti

I benefici di e pagine di culore per i zitelli - un mondu di magia per tutte l'età

Sviluppà e cumpetenze di u mutore fine attraversu u culore prepara i zitelli per e cumpetenze più cumplesse cum'è a scrittura. Per culori…

2 May 2024

U futuru hè quì: cumu l'industria di a spedizione rivoluziona l'economia glubale

U settore navale hè un veru putere ecunomicu glubale, chì hà navigatu versu un mercatu di 150 miliardi ...

1 May 2024

L'editori è l'OpenAI firmanu accordi per regulà u flussu di l'infurmazioni trattati da l'Intelligenza Artificiale

Lunedì, u Financial Times hà annunziatu un accordu cù OpenAI. FT licenze u so ghjurnalismu mundiale ...

30 April 2024

Pagamenti in linea: Eccu cumu i servizii di streaming vi facenu pagà per sempre

Milioni di persone paganu per i servizii di streaming, paghendu tariffi di abbonamentu mensili. Hè una opinione cumuna chì voi ...

29 April 2024