لکه څنګه چې د غیر منظم شوي معلوماتو حجم په پرله پسې ډول وده کوي، د کره او اغیزمن متن تحلیلي وسیلو اړتیا په صنعتونو کې د بازارموندنې، مالیې، روغتیا پاملرنې، او ټولنیزو علومو په څیر متنوع کې په زیاتیدونکي توګه مهم شوي.
په دودیز ډول، د متن تحلیل د قواعدو پر بنسټ میتودونو او د ماشین زده کړې تخنیکونو لکه SpaCY او د ټرانسفارمر تخنیک په کارولو سره ترسره شوی. پداسې حال کې چې دا میتودونه اغیزمن ثابت شوي، دوی د بشپړولو لپاره د پام وړ هڅې او تخصص ته اړتیا لري.
د لوی ژبې ماډلونو (LLM) په راتګ سره لکه د GPT چیٹ di OpenAI. دې د انسان په څیر متن رامینځته کولو او د شرایطو پوهیدو کې د پام وړ وړتیاوې ښودلې ، دا د متن تحلیلي دندو لپاره د امید وړ وسیله ګرځوي لکه entity recognition
, sentiment analysis
د topic modeling
.
راځئ چې اوس وګورو چې څنګه موږ کولی شو د ChatGPT په کارولو سره د متن تحلیل ترسره کړو.
په تیرو کې، موږ تل د ماشین زده کړې کې د مختلف کارونو لپاره مختلف ماډلونه کارولي دي. د مثال په توګه، که زه غواړم چې د متن څخه پوهه راوباسئ، زه به اړتیا ولرم چې د نوم د ادارې پیژندنې ماډل وکاروم (NER - Named Entity Recognition
)، که زه اړتیا لرم چې خپل متن په جلا ټولګیو کې طبقه بندي کړم، زه به د ډلبندۍ ماډل ته اړتیا ولرم. هر مختلف فعالیت ته اړتیا وه چې ماډلونه د هر فعالیت لپاره په مختلف ډول وروزل شي، یا د زده کړې لیږد یا روزنې له لارې.
د معرفي کولو سره Large Language Models (LLM)، د LLM ماډل به د دې وړتیا ولري چې د روزنې سره یا پرته د NLP ډیری دندې ترسره کړي. هر فعالیت کیدی شي defiپه ساده ډول په اشارو کې د لارښوونو په بدلولو سره پای ته ورسید.
اوس راځئ وګورو چې څنګه د دودیز NLP دنده ترسره کړو د GPT چیٹ او دا د دودیزې لارې سره پرتله کړئ. د NLP دندې چې به یې ترسره کوي د GPT چیٹ په دې مقاله کې دي:
Sentiment analysis
نومول شوی وجود پیژندنه (NER) د متن ډیټا مختلف بلاکونو کې د شرایطو په اتوماتيک ډول پیژندلو ته اشاره کوي. دا په عمده توګه د مهمو ادارو کټګوریو لکه د کلینیکي یادښتونو څخه د مخدره توکو نومونه، د بیمې ادعاګانو څخه د حادثې پورې اړوند شرایط، او د ریکارډونو څخه نور ډومین ځانګړي شرایط استخراج لپاره کارول کیږي.
په یاد ولرئ چې دا فعالیت د طبي ډومین لپاره ځانګړی دی. دا موږ ته اړتیا درلوده چې د یو واحد ماډل لپاره د 10.000 قطارونو ډیټا تشریح او روزنه وکړو ترڅو په متن کې ځانګړي ټولګي او اصطلاح وپیژنو. ChatGPT کولی شي په سمه توګه اصطلاح وپیژني پرته له دې چې مخکې روزل شوي متن یا ښه ټونینګ، کوم چې نسبتا ښه پایله ده!
د متن طبقه بندي د لوی ډیټا څخه په کټګوریو کې د متن موندلو او طبقه بندي کولو اتومات پروسې ته راجع کیږي ، دا د متن ډیټا ترلاسه کولو او استخراج کې مهم رول لوبوي. د متن ډلبندۍ غوښتنلیکونو مثالونو کې کلینیکي خبرتیاوې یا د خطر فکتور طبقه بندي، د اتوماتیک تشخیصي طبقه بندي، او د سپیم کشف شامل دي.
Sentiment analysis
Sentiment analysis
د متن په یوه ټوټه کې څرګند شوي احساس یا احساسات ټاکل شامل دي. دا موخه دا ده چې متن په مخکې کټګوریو کې طبقه بندي کړيdefiنایټ، لکه مثبت، منفي یا بې طرفه، د اصلي احساس پر بنسټ چې د لیکوال لخوا بیان شوی.
د احساساتو تحلیل غوښتنلیکونه پدې کې شامل دي:
اتوماتیک لنډیز هغه پروسې ته اشاره کوي چې له مخې یې د یو یا ډیرو اسنادو اصلي موضوعات پیژندل کیږي او په لنډ او دقیق ډول وړاندې کیږي. دا کارونکي ته اجازه ورکوي چې په لنډ وخت کې د ډیټا لویې برخې وګوري. د مثال په غوښتنلیکونو کې د لنډیز سیسټم شامل دی چې د خبرونو مقالو څخه د خلاصونو اتوماتیک تولید او د څیړنې کاغذ خلاصونو څخه د جملو په استخراج سره د معلوماتو لنډیز کولو ته اجازه ورکوي.
ChatGPT یو عالي لنډیز وسیله ده ، په ځانګړي توګه د اوږدو مقالو او پیچلو بیاکتنو لپاره. په ChatGPT کې د بیاکتنو تیرولو سره، موږ کولی شو په اسانۍ سره د محصول بیاکتنې لنډیز په یو نظر پوه شو.
څنګه چې د دې مقالې هدف د متن تحلیلي دندو ترسره کولو لپاره د LLMs وړتیا سپړل دي ، نو اړینه ده چې د دوی محدودیتونه هم وپیژني. د LLMs ځینې کلیدي محدودیتونه پدې کې شامل دي:
Ercole Palmeri
تیره دوشنبه، فایننشل ټایمز د OpenAI سره یوه معامله اعلان کړه. FT د نړۍ په کچه ژورنالیزم جواز ورکوي ...
ملیونونه خلک د سټیمینګ خدماتو لپاره تادیه کوي ، د میاشتنۍ ګډون فیس ورکوي. دا عام نظر دی چې تاسو…
د Veeam لخوا Coveware به د سایبر غصب پیښو غبرګون خدماتو چمتو کولو ته دوام ورکړي. Coveware به د عدلي او درملنې وړتیاوې وړاندې کړي ...
د وړاندوینې ساتنه د تیلو او ګاز سکتور کې انقلاب رامینځته کوي ، د نبات مدیریت لپاره د نوښت او فعال چلند سره.