Yayin da adadin bayanan da ba a tsara su ba ya ci gaba da girma sosai, buƙatar ingantaccen kayan aikin nazarin rubutu da inganci ya zama mai mahimmanci a cikin masana'antu daban-daban kamar tallace-tallace, kuɗi, kiwon lafiya, da kuma ilimin zamantakewa.
A al'adance, an yi nazarin rubutu ta hanyar amfani da hanyoyin da suka dogara da doka da dabarun koyon injin kamar SpaCY da fasaha na canji. Duk da yake waɗannan hanyoyin sun tabbatar da inganci, suna buƙatar ƙoƙari da ƙwarewa don kammalawa.
Tare da zuwan manyan nau'ikan harshe (LLM) kamar Taɗi GPT di BABI. Ya nuna iyawa na ban mamaki wajen samar da rubutu irin na mutum da fahimtar mahallin, yana mai da shi kayan aiki mai ban sha'awa don ayyukan nazarin rubutu kamar su. entity recognition
, sentiment analysis
, e topic modeling
.
Bari mu ga yanzu yadda za mu iya yin nazarin rubutu ta amfani da ChatGPT.
A baya, koyaushe muna amfani da samfura daban-daban don ayyuka daban-daban a cikin koyon injin. Misali, idan ina son fitar da ilimi daga rubutu, zan bukaci yin amfani da samfurin gane mahalli mai suna (NER - Named Entity Recognition
), idan ina buƙatar rarraba rubutu na zuwa azuzuwan daban, zan buƙaci ƙirar ƙira. Kowane aiki daban-daban yana buƙatar ƙirar don horar da su daban don kowane aiki, ko dai ta hanyar canja wurin koyo ko ta horo.
Tare da gabatarwar Large Language Models (LLM), samfurin LLM zai iya yin ayyukan NLP da yawa tare da ko ba tare da horo ba. Duk wani aiki na iya zama definished kawai ta canza umarni a cikin faɗakarwa.
Yanzu bari mu ga yadda ake yin aikin NLP na gargajiya a ciki Taɗi GPT kuma a kwatanta shi da hanyar gargajiya. Ayyukan NLP da za a yi ta Taɗi GPT a cikin wannan labarin akwai:
Sentiment analysis
Gane mahallin mai suna (NER) yana nufin aikin gano kalmomi ta atomatik a cikin tubalan bayanan rubutu daban-daban. Ana amfani da shi musamman don cire mahimman nau'ikan mahaɗan kamar sunayen ƙwayoyi daga bayanan asibiti, sharuɗɗan da suka shafi haɗari daga da'awar inshora, da sauran ƙayyadaddun ƙayyadaddun yanki daga bayanan.
Lura cewa wannan aikin ya keɓance ga yankin likita. Ya kasance yana buƙatar mu yi bayani da horar da fiye da layuka 10.000 na bayanai don ƙira ɗaya don sanin takamaiman aji da kalmar da ke cikin rubutu. ChatGPT na iya tantance kalmar daidai ba tare da wani rubutu da aka riga aka horar da shi ba ko daidaitawa, wanda hakan kyakkyawan sakamako ne!
Rarraba rubutu yana nufin tsarin ganowa da rarraba rubutu ta atomatik zuwa nau'ikan bayanai daga manyan bayanai, yana taka muhimmiyar rawa wajen dawo da bayanan rubutu da cirewa. Misalai na aikace-aikacen rarraba rubutu sun haɗa da faɗakarwar asibiti ko rarrabuwar abubuwan haɗari, rarrabuwa ta atomatik, da gano spam.
Sentiment analysis
Sentiment analysis
ya ƙunshi ƙayyade ji ko motsin zuciyar da aka bayyana a cikin guntun rubutu. Yana nufin rarraba rubutu zuwa nau'ikan farkodefinite, a matsayin tabbatacce, korau, ko tsaka tsaki, bisa tushen abin da marubucin ya gabatar.
Aikace-aikacen nazarin jin daɗi sun haɗa da:
Takaitattun bayanai na atomatik suna nufin tsarin da ake gano manyan batutuwan ɗaya ko fiye da gabatar da su cikin ƙayyadadden tsari. Wannan yana bawa mai amfani damar duba manyan ɓangarorin bayanai a cikin ɗan gajeren lokaci. Misali aikace-aikace sun haɗa da tsarin taƙaitaccen bayani wanda ke ba da izinin ƙirƙirar atomatik na abubuwan da aka rubuta daga labaran labarai da kuma taƙaita bayanai ta hanyar ciro jimloli daga ƙayyadaddun takarda na bincike.
ChatGPT kyakkyawan kayan aiki ne na taƙaitawa, musamman don dogon labarai da sake dubawa masu rikitarwa. Ta liƙa bita-da-kulli a cikin ChatGPT, za mu iya sauƙin sanin taƙaitaccen bitar samfur a kallo.
Tunda manufar wannan labarin shine bincika ikon LLMs don aiwatar da ayyukan nazarin rubutu, yana da mahimmanci kuma a gane iyakokin su. Wasu mahimman iyakoki na LLM sun haɗa da:
Ercole Palmeri
Coveware ta Veeam zai ci gaba da ba da sabis na amsa abin da ya faru ta hanyar intanet. Coveware zai ba da damar bincikar bincike da damar gyarawa…
Kulawa da tsinkaya yana kawo sauyi a fannin mai & iskar gas, tare da sabbin hanyoyin kula da tsirrai.…
Hukumar CMA ta Burtaniya ta ba da gargadi game da halayen Big Tech a cikin kasuwar bayanan sirri. Akwai…
Dokar "Green Houses" da Tarayyar Turai ta tsara don inganta ingantaccen makamashi na gine-gine, ta kammala aikinta na majalisar tare da…