Como o volume de dados não estruturados continua a crescer exponencialmente, a necessidade de ferramentas de análise de texto precisas e eficientes tornou-se cada vez mais crítica em setores tão diversos quanto marketing, finanças, saúde e ciências sociais.
Tradicionalmente, a análise de texto é realizada usando métodos baseados em regras e técnicas de aprendizado de máquina, como SpaCY e a técnica do transformador. Embora esses métodos tenham se mostrado eficazes, eles exigem esforço e experiência consideráveis para serem aperfeiçoados.
Com o advento dos modelos de linguagem grande (LLM), como ChatGPT di OpenAI. Ele demonstrou recursos notáveis na geração de texto semelhante ao humano e na compreensão do contexto, tornando-o uma ferramenta promissora para tarefas de análise de texto, como entity recognition
, sentiment analysis
e topic modeling
.
Vamos ver agora como podemos realizar a análise de texto usando o ChatGPT.
No passado, sempre usamos modelos diferentes para tarefas diferentes no aprendizado de máquina. Por exemplo, se eu quiser extrair conhecimento de um texto, precisarei usar um modelo de reconhecimento de entidades nomeadas (NER – Named Entity Recognition
), se precisar classificar meu texto em classes separadas, precisarei de um modelo de classificação. Cada atividade diferente exigia que os modelos fossem treinados de forma diferente para cada atividade, seja por aprendizado de transferência ou por treinamento.
Com a introdução de Large Language Models (LLM), um modelo LLM será capaz de realizar múltiplas tarefas de PNL com ou sem treinamento. Qualquer atividade pode ser deficoncluído simplesmente alterando as instruções nos prompts.
Agora vamos ver como fazer a tarefa tradicional de PNL em ChatGPT e compará-lo com a forma tradicional. As tarefas de PNL que serão executadas por ChatGPT neste artigo são:
Sentiment analysis
O Named Entity Recognition (NER) refere-se à tarefa de identificar automaticamente termos em diferentes blocos de dados textuais. É usado principalmente para extrair categorias de entidades importantes, como nomes de medicamentos de notas clínicas, termos relacionados a acidentes de reivindicações de seguro e outros termos específicos de domínio de registros.
Observe que esta atividade é específica para o domínio médico. Costumava exigir que anotássemos e treinássemos mais de 10.000 linhas de dados para um único modelo para conhecer a classe e o termo específicos no texto. O ChatGPT pode identificar corretamente o termo sem nenhum texto pré-treinado ou ajuste fino, o que é um resultado relativamente bom!
As classificações de texto referem-se ao processo automático de localização e classificação de texto em categorias a partir de dados enormes, desempenhando um papel essencial na recuperação e extração de dados de texto. Exemplos de aplicativos de classificação de texto incluem alertas clínicos ou categorização de fatores de risco, classificação automática de diagnóstico e detecção de spam.
Sentiment analysis
Sentiment analysis
envolve a determinação do sentimento ou emoção expressa em um pedaço de texto. Tem como objetivo classificar o texto em pré-categoriasdefifinito, como positivo, negativo ou neutro, com base no sentimento subjacente transmitido pelo autor.
As aplicações da análise de sentimento incluem:
Resumos automáticos referem-se ao processo pelo qual os principais tópicos de um ou mais documentos são identificados e apresentados de forma concisa e precisa. Isso permite que o usuário dê uma olhada em grandes blocos de dados em um curto período de tempo. Os aplicativos de exemplo incluem um sistema de resumo que permite a geração automática de resumos de artigos de notícias e o resumo de informações extraindo sentenças de resumos de artigos de pesquisa.
O ChatGPT é uma excelente ferramenta de resumo, especialmente para artigos longos e revisões complicadas. Ao colar as análises no ChatGPT, podemos conhecer facilmente o resumo da análise do produto rapidamente.
Como o objetivo deste artigo é explorar a capacidade dos LLMs de realizar tarefas de análise de texto, é essencial também reconhecer suas limitações. Algumas das principais limitações dos LLMs incluem:
Ercole Palmeri
Uma operação de oftalmoplastia usando o visualizador comercial Apple Vision Pro foi realizada na Policlínica Catania…
O desenvolvimento de habilidades motoras finas por meio da coloração prepara as crianças para habilidades mais complexas, como escrever. Colorir…
O setor naval é uma verdadeira potência económica global, que navegou para um mercado de 150 mil milhões...
Na segunda-feira passada, o Financial Times anunciou um acordo com a OpenAI. O FT licencia seu jornalismo de classe mundial…