bens

Análise de texto usando chatGPT

A análise de texto, ou mineração de texto, é uma técnica vital para extrair insights valiosos de grandes quantidades de dados de texto não estruturados. 

Envolve processamento e análise de texto para descobrir padrões, tendências e relacionamentos.

Ele permite que empresas, pesquisadores e organizações tomem decisões com base em informações extraídas de textos. 

Como o volume de dados não estruturados continua a crescer exponencialmente, a necessidade de ferramentas de análise de texto precisas e eficientes tornou-se cada vez mais crítica em setores tão diversos quanto marketing, finanças, saúde e ciências sociais.

Tradicionalmente, a análise de texto é realizada usando métodos baseados em regras e técnicas de aprendizado de máquina, como SpaCY e a técnica do transformador. Embora esses métodos tenham se mostrado eficazes, eles exigem esforço e experiência consideráveis ​​para serem aperfeiçoados.

Com o advento dos modelos de linguagem grande (LLM), como ChatGPT di OpenAI. Ele demonstrou recursos notáveis ​​na geração de texto semelhante ao humano e na compreensão do contexto, tornando-o uma ferramenta promissora para tarefas de análise de texto, como entity recognition, sentiment analysise topic modeling.

Vamos ver agora como podemos realizar a análise de texto usando o ChatGPT.

Método tradicional (modelos únicos) vs. LLM

No passado, sempre usamos modelos diferentes para tarefas diferentes no aprendizado de máquina. Por exemplo, se eu quiser extrair conhecimento de um texto, precisarei usar um modelo de reconhecimento de entidades nomeadas (NER – Named Entity Recognition), se precisar classificar meu texto em classes separadas, precisarei de um modelo de classificação. Cada atividade diferente exigia que os modelos fossem treinados de forma diferente para cada atividade, seja por aprendizado de transferência ou por treinamento.

Com a introdução de Large Language Models (LLM), um modelo LLM será capaz de realizar múltiplas tarefas de PNL com ou sem treinamento. Qualquer atividade pode ser deficoncluído simplesmente alterando as instruções nos prompts.

Agora vamos ver como fazer a tarefa tradicional de PNL em ChatGPT e compará-lo com a forma tradicional. As tarefas de PNL que serão executadas por ChatGPT neste artigo são:

  • Extração de Conhecimento (NER)
  • classificação de texto
  • Sentiment analysis
  • resumo

Extração de Conhecimento (NER)

O Named Entity Recognition (NER) refere-se à tarefa de identificar automaticamente termos em diferentes blocos de dados textuais. É usado principalmente para extrair categorias de entidades importantes, como nomes de medicamentos de notas clínicas, termos relacionados a acidentes de reivindicações de seguro e outros termos específicos de domínio de registros.

Observe que esta atividade é específica para o domínio médico. Costumava exigir que anotássemos e treinássemos mais de 10.000 linhas de dados para um único modelo para conhecer a classe e o termo específicos no texto. O ChatGPT pode identificar corretamente o termo sem nenhum texto pré-treinado ou ajuste fino, o que é um resultado relativamente bom!

classificação de texto

As classificações de texto referem-se ao processo automático de localização e classificação de texto em categorias a partir de dados enormes, desempenhando um papel essencial na recuperação e extração de dados de texto. Exemplos de aplicativos de classificação de texto incluem alertas clínicos ou categorização de fatores de risco, classificação automática de diagnóstico e detecção de spam.

Sentiment analysis

Sentiment analysis envolve a determinação do sentimento ou emoção expressa em um pedaço de texto. Tem como objetivo classificar o texto em pré-categoriasdefifinito, como positivo, negativo ou neutro, com base no sentimento subjacente transmitido pelo autor. 

As aplicações da análise de sentimento incluem:

  • análise de comentários e feedback de clientes,
  • rastreamento de sentimento de mídia social,
  • monitoramento das tendências do mercado e
  • a medição do sentimento político durante as campanhas eleitorais.

resumo

Resumos automáticos referem-se ao processo pelo qual os principais tópicos de um ou mais documentos são identificados e apresentados de forma concisa e precisa. Isso permite que o usuário dê uma olhada em grandes blocos de dados em um curto período de tempo. Os aplicativos de exemplo incluem um sistema de resumo que permite a geração automática de resumos de artigos de notícias e o resumo de informações extraindo sentenças de resumos de artigos de pesquisa.

O ChatGPT é uma excelente ferramenta de resumo, especialmente para artigos longos e revisões complicadas. Ao colar as análises no ChatGPT, podemos conhecer facilmente o resumo da análise do produto rapidamente.

Limite dos LLMs

Como o objetivo deste artigo é explorar a capacidade dos LLMs de realizar tarefas de análise de texto, é essencial também reconhecer suas limitações. Algumas das principais limitações dos LLMs incluem:

  1. Utilização de recursos : O uso de LLMs requer recursos computacionais e financeiros significativos, o que pode ser um desafio para organizações menores ou pesquisadores individuais com recursos limitados. A partir de hoje, o ChatGPT aceita apenas cerca de 8.000 tokens para entrada e saída, para analisar uma grande quantidade de dados, exige que o usuário divida o texto em vários blocos de dados e pode exigir várias chamadas de API para tarefas.
  2. Sensibilidade ao fraseado imediato : o desempenho dos LLMs pode ser afetado pela maneira como os prompts são redigidos. Uma pequena alteração no texto do prompt pode produzir resultados diferentes, o que pode ser motivo de preocupação ao procurar uma saída consistente e confiável.
  3. Falta de conhecimento específico do domínio : embora os LLMs tenham uma compreensão geral de vários domínios, eles podem não ter o mesmo nível de especialização que os modelos especializados treinados em dados específicos do domínio. Como resultado, seu desempenho pode não ser o ideal em alguns casos e pode exigir um ajuste fino ou conhecimento externo, principalmente quando se trata de informações altamente especializadas ou técnicas.

Ercole Palmeri

Boletim de inovação
Não perca as notícias mais importantes sobre inovação. Cadastre-se para recebê-los por e-mail.

Artigos recentes

Intervenção inovadora em Realidade Aumentada, com visualizador Apple na Policlínica de Catânia

Uma operação de oftalmoplastia usando o visualizador comercial Apple Vision Pro foi realizada na Policlínica Catania…

3 Maio 2024

Os benefícios das páginas para colorir para crianças - um mundo de magia para todas as idades

O desenvolvimento de habilidades motoras finas por meio da coloração prepara as crianças para habilidades mais complexas, como escrever. Colorir…

2 Maio 2024

O futuro está aqui: como a indústria naval está revolucionando a economia global

O setor naval é uma verdadeira potência económica global, que navegou para um mercado de 150 mil milhões...

1 Maio 2024

Editoras e OpenAI assinam acordos para regular o fluxo de informações processadas por Inteligência Artificial

Na segunda-feira passada, o Financial Times anunciou um acordo com a OpenAI. O FT licencia seu jornalismo de classe mundial…

Abril 30 2024