Ҳангоме ки ҳаҷми маълумоти сохторнашуда ба таври экспоненсиалӣ афзоиш меёбад, ниёз ба абзорҳои дақиқ ва самараноки таҳлили матн дар саросари соҳаҳо, аз қабили маркетинг, молия, тандурустӣ ва илмҳои иҷтимоӣ хеле муҳимтар мегардад.
Одатан, таҳлили матн бо истифода аз усулҳои ба қоида асосёфта ва усулҳои омӯзиши мошинсозӣ ба монанди SpaCY ва техникаи трансформатор анҷом дода мешавад. Гарчанде ки ин усулҳо самараноканд, онҳо барои такмил додани онҳо кӯшиш ва таҷрибаи зиёдро талаб мекунанд.
Бо пайдоиши моделҳои забони калон (LLM) ба монанди Чат GPT di OpenAI. Он қобилиятҳои назаррасро дар тавлиди матни ба инсон монанд ва фаҳмиши контекст нишон дода, онро як воситаи ояндадор барои вазифаҳои таҳлили матн ба мисли entity recognition
, sentiment analysis
, e topic modeling
.
Биёед ҳоло бубинем, ки чӣ тавр мо метавонем таҳлили матнро бо истифода аз ChatGPT иҷро кунем.
Дар гузашта, мо ҳамеша моделҳои гуногунро барои вазифаҳои гуногун дар омӯзиши мошин истифода мебурдем. Масалан, агар ман хоҳам, ки аз матн дониш гирам, ба ман лозим меояд, ки модели шинохти объекти номбаршударо истифода барам (NER - Named Entity Recognition
), агар ба ман лозим ояд, ки матни худро ба синфҳои алоҳида тасниф кунам, ба ман модели таснифот лозим аст. Ҳар як фаъолияти гуногун талаб мекард, ки моделҳо барои ҳар як фаъолият ба таври гуногун омӯзонида шаванд, ё тавассути омӯзиши интиқол ё омӯзиш.
Бо муаррифии Large Language Models (LLM), модели LLM метавонад якчанд вазифаҳои NLP-ро бо омӯзиш ё бидуни омӯзиш иҷро кунад. Ҳар гуна фаъолият метавонад бошад defiтанҳо бо тағир додани дастурҳо дар дастурҳо анҷом дода мешавад.
Акнун биёед бубинем, ки чӣ гуна вазифаи анъанавии NLP-ро иҷро кунем Чат GPT ва онро бо усули анъанавӣ муқоиса кунед. Вазифаҳои NLP, ки аз ҷониби онҳо иҷро карда мешаванд Чат GPT дар ин мақола инҳоянд:
Sentiment analysis
Шиносоии номбаршуда (NER) ба вазифаи худкор муайян кардани истилоҳот дар блокҳои гуногуни додаҳои матнӣ ишора мекунад. Он асосан барои гирифтани категорияҳои муҳими субъектҳо, ба монанди номҳои доруворӣ аз қайдҳои клиникӣ, истилоҳҳои марбут ба садама аз даъвоҳои суғурта ва дигар истилоҳҳои мушаххаси домен аз сабтҳо истифода мешавад.
Дар хотир доред, ки ин фаъолият ба соҳаи тиб хос аст. Он аз мо талаб мекард, ки барои як модел зиёда аз 10.000 XNUMX сатри маълумотро шарҳ диҳем ва омӯзем, то синф ва истилоҳи мушаххасро дар матн бидонем. ChatGPT метавонад истилоҳро бидуни ягон матни қаблан омодашуда ё танзими дақиқ муайян кунад, ки ин натиҷаи нисбатан хуб аст!
Таснифоти матн ба раванди автоматии дарёфт ва тасниф кардани матн ба категорияҳо аз маълумоти бузург дахл дорад, он дар ҷустуҷӯ ва истихроҷи додаҳои матн нақши муҳим мебозад. Намунаҳои барномаҳои таснифоти матнӣ огоҳиҳои клиникӣ ё гурӯҳбандии омилҳои хавф, таснифоти автоматии ташхис ва ошкоркунии спамро дар бар мегиранд.
Sentiment analysis
Sentiment analysis
муайян кардани ҳиссиёт ё эҳсосоте, ки дар порчаи матн ифода ёфтааст, дар бар мегирад. Ҳадафи он тасниф кардани матн ба категорияҳои пешакӣ мебошадdefinite, ҳамчун мусбат, манфӣ ё бетараф, дар асоси эҳсосоти аслии интишори муаллиф.
Барномаҳои таҳлили эҳсосот инҳоро дар бар мегиранд:
Ҷамъбасти худкор ба раванде дахл дорад, ки тавассути он мавзӯъҳои асосии як ё якчанд ҳуҷҷат муайян ва ба таври мухтасар ва дақиқ пешниҳод карда мешаванд. Ин ба корбар имкон медиҳад, ки дар як муддати кӯтоҳ ба қисмҳои калони маълумот нигоҳ кунад. Барномаҳои намунавӣ системаи ҷамъбастиро дар бар мегиранд, ки имкон медиҳад ба таври худкор тавлиди рефератҳо аз мақолаҳои хабарӣ ва ҷамъбасти иттилоот тавассути истихроҷи ҷумлаҳо аз рефератҳои тадқиқотӣ.
ChatGPT як воситаи аълои ҷамъбастӣ мебошад, махсусан барои мақолаҳои дароз ва баррасиҳои мураккаб. Бо гузоштани баррасиҳо дар ChatGPT, мо метавонем ба осонӣ хулосаи баррасии маҳсулотро дар як нигоҳ бидонем.
Азбаски ҳадафи ин мақола омӯхтани қобилияти LLM-ҳо барои иҷрои вазифаҳои таҳлили матн аст, инчунин эътироф кардани маҳдудиятҳои онҳо муҳим аст. Баъзе аз маҳдудиятҳои асосии LLM иборатанд аз:
Ercole Palmeri
Дар поликлиникаи Катания амалиёти офтальмопластика бо истифода аз намоишгари тиҷоратии Apple Vision Pro анҷом дода шуд…
Рушди малакаҳои хуби моторӣ тавассути рангкунӣ кӯдаконро ба малакаҳои мураккабтаре, ба мисли навиштан омода мекунад. Барои ранг кардан…
Бахши баҳрӣ як қудрати воқеии иқтисодии ҷаҳонӣ аст, ки ба бозори 150 миллиард доллар ҳаракат кардааст ...
Рӯзи душанбеи гузашта рӯзномаи Financial Times бо OpenAI созишнома эълон кард. FT журналистикаи сатҳи ҷаҳонии худро иҷозатнома медиҳад…