بیشتر

د chatGPT په کارولو سره متن پارس کول

د متن تحلیلونه، یا د متن کان کیندنه، د لوی مقدار غیر منظم متن ډیټا څخه د ارزښتناکو بصیرتونو استخراج لپاره یو حیاتي تخنیک دی. 

پدې کې د نمونو، رجحاناتو او اړیکو موندلو لپاره د متن پروسس او تحلیل شامل دي.

دا شرکتونو، څیړونکو او سازمانونو ته اجازه ورکوي چې د متنونو څخه راټول شوي معلوماتو پراساس پریکړې وکړي. 

لکه څنګه چې د غیر منظم شوي معلوماتو حجم په پرله پسې ډول وده کوي، د کره او اغیزمن متن تحلیلي وسیلو اړتیا په صنعتونو کې د بازارموندنې، مالیې، روغتیا پاملرنې، او ټولنیزو علومو په څیر متنوع کې په زیاتیدونکي توګه مهم شوي.

په دودیز ډول، د متن تحلیل د قواعدو پر بنسټ میتودونو او د ماشین زده کړې تخنیکونو لکه SpaCY او د ټرانسفارمر تخنیک په کارولو سره ترسره شوی. پداسې حال کې چې دا میتودونه اغیزمن ثابت شوي، دوی د بشپړولو لپاره د پام وړ هڅې او تخصص ته اړتیا لري.

د لوی ژبې ماډلونو (LLM) په راتګ سره لکه د GPT چیٹ di OpenAI. دې د انسان په څیر متن رامینځته کولو او د شرایطو پوهیدو کې د پام وړ وړتیاوې ښودلې ، دا د متن تحلیلي دندو لپاره د امید وړ وسیله ګرځوي لکه entity recognition, sentiment analysisد topic modeling.

راځئ چې اوس وګورو چې څنګه موږ کولی شو د ChatGPT په کارولو سره د متن تحلیل ترسره کړو.

دودیز میتود (واحد ماډلونه) په مقابل کې. ایل ایل ایم

په تیرو کې، موږ تل د ماشین زده کړې کې د مختلف کارونو لپاره مختلف ماډلونه کارولي دي. د مثال په توګه، که زه غواړم چې د متن څخه پوهه راوباسئ، زه به اړتیا ولرم چې د نوم د ادارې پیژندنې ماډل وکاروم (NER - Named Entity Recognition)، که زه اړتیا لرم چې خپل متن په جلا ټولګیو کې طبقه بندي کړم، زه به د ډلبندۍ ماډل ته اړتیا ولرم. هر مختلف فعالیت ته اړتیا وه چې ماډلونه د هر فعالیت لپاره په مختلف ډول وروزل شي، یا د زده کړې لیږد یا روزنې له لارې.

د معرفي کولو سره Large Language Models (LLM)، د LLM ماډل به د دې وړتیا ولري چې د روزنې سره یا پرته د NLP ډیری دندې ترسره کړي. هر فعالیت کیدی شي defiپه ساده ډول په اشارو کې د لارښوونو په بدلولو سره پای ته ورسید.

اوس راځئ وګورو چې څنګه د دودیز NLP دنده ترسره کړو د GPT چیٹ او دا د دودیزې لارې سره پرتله کړئ. د NLP دندې چې به یې ترسره کوي د GPT چیٹ په دې مقاله کې دي:

  • د پوهې استخراج (NER)
  • د متن طبقه بندي
  • Sentiment analysis
  • لنډیز

د پوهې استخراج (NER)

نومول شوی وجود پیژندنه (NER) د متن ډیټا مختلف بلاکونو کې د شرایطو په اتوماتيک ډول پیژندلو ته اشاره کوي. دا په عمده توګه د مهمو ادارو کټګوریو لکه د کلینیکي یادښتونو څخه د مخدره توکو نومونه، د بیمې ادعاګانو څخه د حادثې پورې اړوند شرایط، او د ریکارډونو څخه نور ډومین ځانګړي شرایط استخراج لپاره کارول کیږي.

په یاد ولرئ چې دا فعالیت د طبي ډومین لپاره ځانګړی دی. دا موږ ته اړتیا درلوده چې د یو واحد ماډل لپاره د 10.000 قطارونو ډیټا تشریح او روزنه وکړو ترڅو په متن کې ځانګړي ټولګي او اصطلاح وپیژنو. ChatGPT کولی شي په سمه توګه اصطلاح وپیژني پرته له دې چې مخکې روزل شوي متن یا ښه ټونینګ، کوم چې نسبتا ښه پایله ده!

د متن طبقه بندي

د متن طبقه بندي د لوی ډیټا څخه په کټګوریو کې د متن موندلو او طبقه بندي کولو اتومات پروسې ته راجع کیږي ، دا د متن ډیټا ترلاسه کولو او استخراج کې مهم رول لوبوي. د متن ډلبندۍ غوښتنلیکونو مثالونو کې کلینیکي خبرتیاوې یا د خطر فکتور طبقه بندي، د اتوماتیک تشخیصي طبقه بندي، او د سپیم کشف شامل دي.

Sentiment analysis

Sentiment analysis د متن په یوه ټوټه کې څرګند شوي احساس یا احساسات ټاکل شامل دي. دا موخه دا ده چې متن په مخکې کټګوریو کې طبقه بندي کړيdefiنایټ، لکه مثبت، منفي یا بې طرفه، د اصلي احساس پر بنسټ چې د لیکوال لخوا بیان شوی. 

د احساساتو تحلیل غوښتنلیکونه پدې کې شامل دي:

  • د پیرودونکو نظرونو او نظرونو تحلیل،
  • د ټولنیزو رسنیو احساسات تعقیب،
  • د بازار د رجحاناتو څارنه e
  • د ټاکنیزو کمپاینونو پر مهال د سیاسي احساساتو اندازه کول.

لنډیز

اتوماتیک لنډیز هغه پروسې ته اشاره کوي چې له مخې یې د یو یا ډیرو اسنادو اصلي موضوعات پیژندل کیږي او په لنډ او دقیق ډول وړاندې کیږي. دا کارونکي ته اجازه ورکوي چې په لنډ وخت کې د ډیټا لویې برخې وګوري. د مثال په غوښتنلیکونو کې د لنډیز سیسټم شامل دی چې د خبرونو مقالو څخه د خلاصونو اتوماتیک تولید او د څیړنې کاغذ خلاصونو څخه د جملو په استخراج سره د معلوماتو لنډیز کولو ته اجازه ورکوي.

ChatGPT یو عالي لنډیز وسیله ده ، په ځانګړي توګه د اوږدو مقالو او پیچلو بیاکتنو لپاره. په ChatGPT کې د بیاکتنو تیرولو سره، موږ کولی شو په اسانۍ سره د محصول بیاکتنې لنډیز په یو نظر پوه شو.

د LLMs حد

څنګه چې د دې مقالې هدف د متن تحلیلي دندو ترسره کولو لپاره د LLMs وړتیا سپړل دي ، نو اړینه ده چې د دوی محدودیتونه هم وپیژني. د LLMs ځینې کلیدي محدودیتونه پدې کې شامل دي:

  1. د سرچینو کارول : د LLMs کارول د پام وړ کمپیوټري او مالي سرچینو ته اړتیا لري، کوم چې د وړو سازمانونو یا انفرادي څیړونکو لپاره چې محدود سرچینې لري ننګونه کیدی شي. تر نن ورځې پورې، ChatGPT یوازې د ننوتلو او محصول لپاره شاوخوا 8.000 ټوکنونه مني، د لوی مقدار ډیټا پارس کولو لپاره، کاروونکي ته اړتیا لري چې متن په ډیری ډیټاونو کې مات کړي، او ممکن د دندو لپاره ډیری API کالونو ته اړتیا ولري.
  2. د سمدستي جملو لپاره حساسیت : د LLMs فعالیت د هغه طریقې لخوا اغیزمن کیدی شي چې د اشارو کلمه کیږي. په سمدستي کلمو کې یو څه بدلون کولی شي مختلف پایلې رامینځته کړي، کوم چې د دوامداره او باوري محصول په لټه کې د اندیښنې لامل کیدی شي.
  3. د ډومین ځانګړي تخصص نشتوالی : په داسې حال کې چې LLMs د مختلفو ډومینونو په اړه عمومي پوهه لري، دوی ممکن د تخصص کچه ورته نه وي لکه د ډومین ځانګړي ډیټا په اړه روزل شوي ځانګړي ماډلونه. د پایلې په توګه، د دوی فعالیت ممکن په ځینو حاالتو کې غوره نه وي او ممکن د ښه سمون یا بهرنۍ پوهې ته اړتیا ولري، په ځانګړې توګه کله چې د خورا متخصص یا تخنیکي معلوماتو سره معامله کوي.

Ercole Palmeri

د نوښت خبر پاڼه
د نوښت په اړه خورا مهم خبرونه له لاسه مه ورکوئ. د بریښنالیک له لارې دوی ترلاسه کولو لپاره لاسلیک وکړئ.

وروستي مقالې

خپرونکي او OpenAI تړونونه لاسلیک کوي ترڅو د مصنوعي استخباراتو لخوا پروسس شوي معلوماتو جریان تنظیم کړي

تیره دوشنبه، فایننشل ټایمز د OpenAI سره یوه معامله اعلان کړه. FT د نړۍ په کچه ژورنالیزم جواز ورکوي ...

30 اپریل 2024

آنلاین تادیات: دلته د سټیمینګ خدمات تاسو ته د تل لپاره تادیه کوي

ملیونونه خلک د سټیمینګ خدماتو لپاره تادیه کوي ، د میاشتنۍ ګډون فیس ورکوي. دا عام نظر دی چې تاسو…

29 اپریل 2024

Veeam د ransomware لپاره خورا پراخه ملاتړ وړاندې کوي ، له محافظت څخه تر غبرګون او رغیدو پورې

د Veeam لخوا Coveware به د سایبر غصب پیښو غبرګون خدماتو چمتو کولو ته دوام ورکړي. Coveware به د عدلي او درملنې وړتیاوې وړاندې کړي ...

23 اپریل 2024

شنه او ډیجیټل انقلاب: د وړاندوینې وړ ساتنه څنګه د تیلو او ګاز صنعت بدلوي

د وړاندوینې ساتنه د تیلو او ګاز سکتور کې انقلاب رامینځته کوي ، د نبات مدیریت لپاره د نوښت او فعال چلند سره.

22 اپریل 2024

نوښت په خپله ژبه ولولئ

د نوښت خبر پاڼه
د نوښت په اړه خورا مهم خبرونه له لاسه مه ورکوئ. د بریښنالیک له لارې دوی ترلاسه کولو لپاره لاسلیک وکړئ.

مونږ سره په