Мақолаҳо

Таҳлили матн бо истифода аз chatGPT

Таҳлили матн ё истихроҷи матн як усули муҳим барои ба даст овардани фаҳмиши арзишманд аз миқдори зиёди маълумоти матнии сохторнашуда мебошад. 

Он коркард ва таҳлили матнро барои кашф кардани намунаҳо, тамоюлҳо ва муносибатҳо дар бар мегирад.

Он ба ширкатҳо, муҳаққиқон ва созмонҳо имкон медиҳад, ки дар асоси маълумоти аз матнҳо гирифташуда қарор қабул кунанд. 

Ҳангоме ки ҳаҷми маълумоти сохторнашуда ба таври экспоненсиалӣ афзоиш меёбад, ниёз ба абзорҳои дақиқ ва самараноки таҳлили матн дар саросари соҳаҳо, аз қабили маркетинг, молия, тандурустӣ ва илмҳои иҷтимоӣ хеле муҳимтар мегардад.

Одатан, таҳлили матн бо истифода аз усулҳои ба қоида асосёфта ва усулҳои омӯзиши мошинсозӣ ба монанди SpaCY ва техникаи трансформатор анҷом дода мешавад. Гарчанде ки ин усулҳо самараноканд, онҳо барои такмил додани онҳо кӯшиш ва таҷрибаи зиёдро талаб мекунанд.

Бо пайдоиши моделҳои забони калон (LLM) ба монанди Чат GPT di OpenAI. Он қобилиятҳои назаррасро дар тавлиди матни ба инсон монанд ва фаҳмиши контекст нишон дода, онро як воситаи ояндадор барои вазифаҳои таҳлили матн ба мисли entity recognition, sentiment analysis, e topic modeling.

Биёед ҳоло бубинем, ки чӣ тавр мо метавонем таҳлили матнро бо истифода аз ChatGPT иҷро кунем.

Усули анъанавӣ (моделҳои ягона) vs. LLM

Дар гузашта, мо ҳамеша моделҳои гуногунро барои вазифаҳои гуногун дар омӯзиши мошин истифода мебурдем. Масалан, агар ман хоҳам, ки аз матн дониш гирам, ба ман лозим меояд, ки модели шинохти объекти номбаршударо истифода барам (NER - Named Entity Recognition), агар ба ман лозим ояд, ки матни худро ба синфҳои алоҳида тасниф кунам, ба ман модели таснифот лозим аст. Ҳар як фаъолияти гуногун талаб мекард, ки моделҳо барои ҳар як фаъолият ба таври гуногун омӯзонида шаванд, ё тавассути омӯзиши интиқол ё омӯзиш.

Бо муаррифии Large Language Models (LLM), модели LLM метавонад якчанд вазифаҳои NLP-ро бо омӯзиш ё бидуни омӯзиш иҷро кунад. Ҳар гуна фаъолият метавонад бошад defiтанҳо бо тағир додани дастурҳо дар дастурҳо анҷом дода мешавад.

Акнун биёед бубинем, ки чӣ гуна вазифаи анъанавии NLP-ро иҷро кунем Чат GPT ва онро бо усули анъанавӣ муқоиса кунед. Вазифаҳои NLP, ки аз ҷониби онҳо иҷро карда мешаванд Чат GPT дар ин мақола инҳоянд:

  • Истихроҷи дониш (NER)
  • Таснифи матн
  • Sentiment analysis
  • Хулоса

Истихроҷи дониш (NER)

Шиносоии номбаршуда (NER) ба вазифаи худкор муайян кардани истилоҳот дар блокҳои гуногуни додаҳои матнӣ ишора мекунад. Он асосан барои гирифтани категорияҳои муҳими субъектҳо, ба монанди номҳои доруворӣ аз қайдҳои клиникӣ, истилоҳҳои марбут ба садама аз даъвоҳои суғурта ва дигар истилоҳҳои мушаххаси домен аз сабтҳо истифода мешавад.

Дар хотир доред, ки ин фаъолият ба соҳаи тиб хос аст. Он аз мо талаб мекард, ки барои як модел зиёда аз 10.000 XNUMX сатри маълумотро шарҳ диҳем ва омӯзем, то синф ва истилоҳи мушаххасро дар матн бидонем. ChatGPT метавонад истилоҳро бидуни ягон матни қаблан омодашуда ё танзими дақиқ муайян кунад, ки ин натиҷаи нисбатан хуб аст!

Таснифи матн

Таснифоти матн ба раванди автоматии дарёфт ва тасниф кардани матн ба категорияҳо аз маълумоти бузург дахл дорад, он дар ҷустуҷӯ ва истихроҷи додаҳои матн нақши муҳим мебозад. Намунаҳои барномаҳои таснифоти матнӣ огоҳиҳои клиникӣ ё гурӯҳбандии омилҳои хавф, таснифоти автоматии ташхис ва ошкоркунии спамро дар бар мегиранд.

Sentiment analysis

Sentiment analysis муайян кардани ҳиссиёт ё эҳсосоте, ки дар порчаи матн ифода ёфтааст, дар бар мегирад. Ҳадафи он тасниф кардани матн ба категорияҳои пешакӣ мебошадdefinite, ҳамчун мусбат, манфӣ ё бетараф, дар асоси эҳсосоти аслии интишори муаллиф. 

Барномаҳои таҳлили эҳсосот инҳоро дар бар мегиранд:

  • таҳлили баррасиҳо ва фикру мулоҳизаҳои муштариён,
  • пайгирии эҳсосоти васоити ахбори иҷтимоӣ,
  • мониторинги тамоюлҳои бозор д
  • андозагирии ҳисси сиёсӣ дар маъракаҳои интихоботӣ.

Хулоса

Ҷамъбасти худкор ба раванде дахл дорад, ки тавассути он мавзӯъҳои асосии як ё якчанд ҳуҷҷат муайян ва ба таври мухтасар ва дақиқ пешниҳод карда мешаванд. Ин ба корбар имкон медиҳад, ки дар як муддати кӯтоҳ ба қисмҳои калони маълумот нигоҳ кунад. Барномаҳои намунавӣ системаи ҷамъбастиро дар бар мегиранд, ки имкон медиҳад ба таври худкор тавлиди рефератҳо аз мақолаҳои хабарӣ ва ҷамъбасти иттилоот тавассути истихроҷи ҷумлаҳо аз рефератҳои тадқиқотӣ.

ChatGPT як воситаи аълои ҷамъбастӣ мебошад, махсусан барои мақолаҳои дароз ва баррасиҳои мураккаб. Бо гузоштани баррасиҳо дар ChatGPT, мо метавонем ба осонӣ хулосаи баррасии маҳсулотро дар як нигоҳ бидонем.

Маҳдудияти LLM

Азбаски ҳадафи ин мақола омӯхтани қобилияти LLM-ҳо барои иҷрои вазифаҳои таҳлили матн аст, инчунин эътироф кардани маҳдудиятҳои онҳо муҳим аст. Баъзе аз маҳдудиятҳои асосии LLM иборатанд аз:

  1. Истифодаи захираҳо : Истифодаи LLM захираҳои назарраси ҳисоббарорӣ ва молиявиро талаб мекунад, ки барои созмонҳои хурдтар ё тадқиқотчиёни алоҳидаи дорои захираҳои маҳдуд душвор буда метавонад. То имрӯз, ChatGPT танҳо тақрибан 8.000 токенҳоро барои ворид ва баромад, барои таҳлили миқдори зиёди маълумот қабул мекунад, аз корбар талаб мекунад, ки матнро ба қисмҳои сершумори маълумот тақсим кунад ва метавонад зангҳои API-ро барои вазифаҳо талаб кунад.
  2. Ҳассосият ба ибораҳои фаврӣ : Ба иҷрои LLM-ҳо аз тарзи навиштани дастурҳо таъсир расонида метавонанд. Тағйироти ночиз дар матни фаврӣ метавонад натиҷаҳои гуногун ба бор орад, ки ҳангоми ҷустуҷӯи баромади пайваста ва боэътимод боиси нигаронӣ мегардад.
  3. Набудани таҷрибаи мушаххаси домен : Дар ҳоле ки LLMҳо фаҳмиши умумии доменҳои гуногун доранд, онҳо метавонанд сатҳи таҷрибаро мисли моделҳои махсусгардонидашуда дар бораи маълумоти домени мушаххас омӯзонида нашаванд. Дар натиҷа, иҷрои онҳо метавонад дар баъзе мавридҳо оптималӣ набошад ва метавонад танзими дақиқ ё дониши беруниро талаб кунад, махсусан ҳангоми кор бо иттилооти хеле махсус ё техникӣ.

Ercole Palmeri

Бюллетени инноватсионӣ
Муҳимтарин хабарҳоро дар бораи навоварӣ аз даст надиҳед. Барои гирифтани онҳо тавассути почтаи электронӣ обуна шавед.

Мақолаҳои охирин

Дахолати инноватсионӣ дар воқеияти васеъшуда бо тамошобини Apple дар поликлиникаи Катания

Дар поликлиникаи Катания амалиёти офтальмопластика бо истифода аз намоишгари тиҷоратии Apple Vision Pro анҷом дода шуд…

3 Май 2024

Манфиатҳои ранг кардани саҳифаҳо барои кӯдакон - ҷаҳони ҷодугарӣ барои ҳама синну сол

Рушди малакаҳои хуби моторӣ тавассути рангкунӣ кӯдаконро ба малакаҳои мураккабтаре, ба мисли навиштан омода мекунад. Барои ранг кардан…

2 Май 2024

Оянда ин аст: Чӣ гуна саноати боркашонӣ иқтисоди ҷаҳонро инқилоб мекунад

Бахши баҳрӣ як қудрати воқеии иқтисодии ҷаҳонӣ аст, ки ба бозори 150 миллиард доллар ҳаракат кардааст ...

1 Май 2024

Ноширон ва OpenAI барои танзими ҷараёни иттилооте, ки тавассути зеҳни сунъӣ коркард мешаванд, созишнома имзо мекунанд

Рӯзи душанбеи гузашта рӯзномаи Financial Times бо OpenAI созишнома эълон кард. FT журналистикаи сатҳи ҷаҳонии худро иҷозатнома медиҳад…

30 апрел 2024

Инноватсияро ба забони худ хонед

Бюллетени инноватсионӣ
Муҳимтарин хабарҳоро дар бораи навоварӣ аз даст надиҳед. Барои гирифтани онҳо тавассути почтаи электронӣ обуна шавед.

Моро дунбол кунед