Артиколи

chatGPT көмегімен мәтінді талдау

Мәтіндік аналитика немесе мәтінді өңдеу – құрылымдалмаған мәтіндік деректердің үлкен көлемінен құнды түсініктерді алудың маңызды әдісі. 

Ол үлгілерді, үрдістерді және қарым-қатынастарды табу үшін мәтінді өңдеуді және талдауды қамтиды.

Ол компанияларға, зерттеушілер мен ұйымдарға мәтіндерден алынған ақпарат негізінде шешім қабылдауға мүмкіндік береді. 

Құрылымы жоқ деректер көлемі экспоненциалды түрде өсуде, дәл және тиімді мәтіндік талдау құралдарына қажеттілік маркетинг, қаржы, денсаулық сақтау және әлеуметтік ғылымдар сияқты әртүрлі салаларда маңызды бола бастады.

Дәстүрлі түрде мәтінді талдау SpaCY және трансформатор техникасы сияқты ережеге негізделген әдістер мен машиналық оқыту әдістері арқылы орындалды. Бұл әдістердің тиімділігі дәлелденгенімен, оларды жетілдіру үшін айтарлықтай күш пен тәжірибе қажет.

сияқты үлкен тілдік модельдердің (LLM) пайда болуымен GPT чат di OpenAI. Ол адамға ұқсас мәтін құруда және контекстті түсінуде керемет мүмкіндіктерді көрсетті, бұл оны мәтінді талдау тапсырмалары үшін перспективалы құрал етеді. entity recognition, sentiment analysis, e topic modeling.

Енді ChatGPT көмегімен мәтінді талдауды қалай орындауға болатынын көрейік.

Дәстүрлі әдіс (бір үлгілер) қарсы. LLM

Бұрын біз әрқашан машиналық оқытудағы әртүрлі тапсырмалар үшін әртүрлі үлгілерді қолдандық. Мысалы, егер мен мәтіннен білімді алғым келсе, аталған нысанды тану моделін (NER –) пайдалануым керек. Named Entity Recognition), мәтінімді бөлек сыныптарға жіктеу керек болса, маған жіктеу үлгісі қажет болады. Әр түрлі әрекет үлгілерді трансферттік оқыту немесе оқыту арқылы әр әрекет үшін әртүрлі оқытуды талап етті.

енгізуімен Large Language Models (LLM), LLM үлгісі бірнеше NLP тапсырмаларын оқытумен немесе онсыз орындай алады. Кез келген әрекет болуы мүмкін defiНұсқаулардағы нұсқауларды өзгерту арқылы ғана шешілді.

Енді дәстүрлі NLP тапсырмасын қалай орындау керектігін көрейік GPT чат және оны дәстүрлі әдіспен салыстырыңыз. Орындайтын NLP тапсырмалары GPT чат осы мақалада:

  • Білімді шығару (NER)
  • Мәтіннің классификациясы
  • Sentiment analysis
  • Риепилого

Білімді шығару (NER)

Атаулы нысанды тану (NER) мәтіндік деректердің әртүрлі блоктарындағы терминдерді автоматты түрде анықтау тапсырмасын білдіреді. Ол негізінен клиникалық жазбалардан дәрі атаулары, сақтандыру шағымдарынан жазатайым оқиғаларға қатысты терминдер және жазбалардан доменге қатысты басқа терминдер сияқты маңызды субъект санаттарын алу үшін пайдаланылады.

Бұл әрекет медициналық доменге тән екенін ескеріңіз. Ол бізге мәтіндегі белгілі бір класс пен терминді білу үшін бір модель үшін 10.000 XNUMX-нан астам деректер жолын аннотациялауды және үйретуді талап ететін. ChatGPT терминді алдын ала дайындалған мәтінсіз немесе дәл баптаусыз дұрыс анықтай алады, бұл салыстырмалы түрде жақсы нәтиже!

Мәтіннің классификациясы

Мәтіндік классификациялар үлкен деректерден мәтінді санаттарға автоматты түрде табу және жіктеу процесін білдіреді, ол мәтіндік деректерді іздеу мен шығаруда маңызды рөл атқарады. Мәтінді жіктеу қолданбаларының мысалдары клиникалық ескертулерді немесе қауіп факторын санаттауды, автоматты диагностикалық жіктеуді және спамды анықтауды қамтиды.

Sentiment analysis

Sentiment analysis мәтін бөлігінде көрсетілген сезімді немесе эмоцияны анықтауды қамтиды. Ол мәтінді алдын ала санаттарға бөлуге бағытталғанdefiавтор жеткізген негізгі ойға негізделген оң, теріс немесе бейтарап. 

Сезімдерді талдаудың қолданбаларына мыналар жатады:

  • тұтынушылардың пікірлері мен пікірлерін талдау,
  • әлеуметтік желідегі көңіл-күйді бақылау,
  • нарықтық үрдістерді бақылау e
  • сайлау науқандары кезіндегі саяси көңіл-күйді өлшеу.

Риепилого

Автоматты қорытындылар бір немесе бірнеше құжаттардың негізгі тақырыптарын анықтап, қысқаша және нақты түрде көрсету процесін білдіреді. Бұл пайдаланушыға қысқа уақыт ішінде деректердің үлкен бөліктерін қарауға мүмкіндік береді. Мысал қолданбаларға жаңалықтар мақалаларынан тезистерді автоматты түрде жасауға және зерттеу жұмысының тезистерінен сөйлемдер алу арқылы ақпаратты қорытындылауға мүмкіндік беретін жиынтық жүйе кіреді.

ChatGPT - бұл әсіресе ұзақ мақалалар мен күрделі шолулар үшін тамаша жиынтық құрал. ChatGPT-те шолуларды қою арқылы біз өнімді шолу қорытындысын бір қарағанда оңай біле аламыз.

LLM шектеуі

Бұл мақаланың мақсаты LLM-дің мәтінді талдау тапсырмаларын орындау қабілетін зерттеу болғандықтан, олардың шектеулерін де мойындау өте маңызды. LLM-нің кейбір негізгі шектеулеріне мыналар жатады:

  1. Ресурстарды пайдалану : LLM пайдалану маңызды есептеу және қаржылық ресурстарды қажет етеді, бұл шағын ұйымдар немесе ресурстары шектеулі жеке зерттеушілер үшін қиындық тудыруы мүмкін. Бүгінгі күні ChatGPT деректердің үлкен көлемін талдау үшін енгізу және шығару үшін шамамен 8.000 XNUMX таңбалауышты ғана қабылдайды, пайдаланушыдан мәтінді деректердің бірнеше бөліктеріне бөлуді талап етеді және тапсырмалар үшін бірнеше API қоңырауларын қажет етуі мүмкін.
  2. Жедел сөйлемдерге сезімталдық : LLM жұмысына шақырулардың жазылу тәсілі әсер етуі мүмкін. Шұғыл тұжырымдағы шамалы өзгерту әртүрлі нәтижелерді тудыруы мүмкін, бұл дәйекті және сенімді нәтижені іздеу кезінде алаңдаушылық тудыруы мүмкін.
  3. Доменге арнайы сараптаманың болмауы : LLM әртүрлі домендер туралы жалпы түсінікке ие болғанымен, олар доменге қатысты деректер бойынша оқытылған мамандандырылған үлгілермен бірдей тәжірибе деңгейіне ие болмауы мүмкін. Нәтижесінде олардың өнімділігі кейбір жағдайларда оңтайлы болмауы мүмкін және дәл реттеуді немесе сыртқы білімді қажет етуі мүмкін, әсіресе жоғары мамандандырылған немесе техникалық ақпаратпен жұмыс істегенде.

Ercole Palmeri

Инновациялық ақпараттық бюллетень
Инновация туралы ең маңызды жаңалықтарды жіберіп алмаңыз. Оларды электрондық пошта арқылы алу үшін тіркеліңіз.

Соңғы мақалалар

Баспагерлер мен OpenAI жасанды интеллект өңдейтін ақпарат ағынын реттеу үшін келісімдерге қол қояды.

Өткен дүйсенбіде Financial Times OpenAI-мен келісім туралы жариялады. FT өзінің әлемдік деңгейдегі журналистикасына лицензия береді…

30 Сәуір 2024

Онлайн төлемдер: Міне, ағынды қызметтер сізге мәңгілік төлем жасауға мүмкіндік береді

Миллиондаған адамдар ай сайынғы абоненттік төлемді төлей отырып, ағынды қызметтерге ақы төлейді. Жалпы пікір, сіз…

29 Сәуір 2024

Veeam қорғаныстан жауап беруге және қалпына келтіруге дейін төлемдік бағдарламалық құралға ең жан-жақты қолдау көрсетеді

Veeam ұсынған Coveware кибербопсалау оқиғаларына жауап беру қызметтерін көрсетуді жалғастырады. Coveware криминалистикалық және қалпына келтіру мүмкіндіктерін ұсынады ...

23 Сәуір 2024

Жасыл және цифрлық революция: болжамды техникалық қызмет көрсету мұнай және газ саласын қалай өзгертеді

Болжалды техникалық қызмет көрсету зауытты басқаруға инновациялық және белсенді көзқараспен мұнай және газ секторында төңкеріс жасайды.…

22 Сәуір 2024

Инновацияны өз тіліңізде оқыңыз

Инновациялық ақпараттық бюллетень
Инновация туралы ең маңызды жаңалықтарды жіберіп алмаңыз. Оларды электрондық пошта арқылы алу үшін тіркеліңіз.

Артымыздан