bienes

Análisis de texto usando chatGPT

El análisis de texto, o minería de texto, es una técnica vital para extraer información valiosa de grandes cantidades de datos de texto no estructurados. 

Implica procesar y analizar texto para descubrir patrones, tendencias y relaciones.

Permite a las empresas, investigadores y organizaciones tomar decisiones basadas en la información extraída de los textos. 

A medida que el volumen de datos no estructurados continúa creciendo exponencialmente, la necesidad de herramientas de análisis de texto precisas y eficientes se ha vuelto cada vez más crítica en industrias tan diversas como marketing, finanzas, atención médica y ciencias sociales.

Tradicionalmente, el análisis de texto se ha realizado utilizando métodos basados ​​en reglas y técnicas de aprendizaje automático como SpaCY y la técnica del transformador. Si bien estos métodos han demostrado ser efectivos, requieren un esfuerzo y experiencia considerables para perfeccionarlos.

Con el advenimiento de los modelos de lenguaje grande (LLM) como ChatGPT di OpenAI. Ha demostrado capacidades notables en la generación de texto similar al humano y la comprensión del contexto, lo que lo convierte en una herramienta prometedora para tareas de análisis de texto como entity recognition, sentiment analysis, y con topic modeling.

Veamos ahora cómo podemos realizar el análisis de texto usando ChatGPT.

Método tradicional (modelos únicos) vs. LLM

En el pasado, siempre hemos usado diferentes modelos para diferentes tareas en el aprendizaje automático. Por ejemplo, si quiero extraer conocimiento de un texto, necesitaré usar un modelo de reconocimiento de entidad nombrada (NER – Named Entity Recognition), si necesito clasificar mi texto en clases separadas, necesitaré un modelo de clasificación. Cada actividad diferente requería que los modelos fueran entrenados de manera diferente para cada actividad, ya sea por transferencia de aprendizaje o por entrenamiento.

Con la introducción de Large Language Models (LLM), un modelo LLM podrá realizar múltiples tareas de PNL con o sin capacitación. Cualquier actividad puede ser defiterminado simplemente cambiando las instrucciones en las indicaciones.

Ahora veamos cómo hacer la tarea tradicional de PNL en ChatGPT y compararlo con la forma tradicional. Las tareas de PNL que serán realizadas por ChatGPT en este artículo son:

  • Extracción de conocimiento (NER)
  • Clasificación de texto
  • Sentiment analysis
  • Riepilogo

Extracción de conocimiento (NER)

El reconocimiento de entidades nombradas (NER) se refiere a la tarea de identificar automáticamente términos en diferentes bloques de datos textuales. Se utiliza principalmente para extraer categorías de entidades importantes, como nombres de medicamentos de notas clínicas, términos relacionados con accidentes de reclamaciones de seguros y otros términos específicos de dominio de registros.

Tenga en cuenta que esta actividad es específica del dominio médico. Antes requería que anotáramos y entrenáramos más de 10.000 XNUMX filas de datos para que un solo modelo conociera la clase y el término específicos en el texto. ChatGPT puede identificar correctamente el término sin ningún texto preentrenado o ajuste fino, ¡lo cual es un resultado relativamente bueno!

Clasificación de texto

Las clasificaciones de texto se refieren al proceso automático de encontrar y clasificar texto en categorías a partir de grandes datos, juega un papel esencial en la recuperación y extracción de datos de texto. Los ejemplos de aplicaciones de clasificación de texto incluyen alertas clínicas o categorización de factores de riesgo, clasificación de diagnóstico automático y detección de spam.

Sentiment analysis

Sentiment analysis Implica determinar el sentimiento o la emoción expresada en un fragmento de texto. Su objetivo es clasificar el texto en precategorías.defifinito, como positivo, negativo o neutral, según el sentimiento subyacente transmitido por el autor. 

Las aplicaciones del análisis de sentimientos incluyen:

  • análisis de opiniones y comentarios de los clientes,
  • rastrear el sentimiento de las redes sociales,
  • seguimiento de las tendencias del mercado e
  • la medición del sentimiento político durante las campañas electorales.

Riepilogo

Los resúmenes automáticos se refieren al proceso mediante el cual se identifican y presentan de manera concisa y precisa los temas principales de uno o más documentos. Esto permite al usuario echar un vistazo a grandes cantidades de datos en un corto período de tiempo. Las aplicaciones de ejemplo incluyen un sistema de resumen que permite la generación automática de resúmenes de artículos de noticias y el resumen de información extrayendo oraciones de resúmenes de trabajos de investigación.

ChatGPT es una excelente herramienta de resumen, especialmente para artículos extensos y reseñas complicadas. Al pegar las revisiones en ChatGPT, podemos conocer fácilmente el resumen de la revisión del producto de un vistazo.

Límite de los LLM

Dado que el propósito de este artículo es explorar la capacidad de los LLM para realizar tareas de análisis de texto, también es esencial reconocer sus limitaciones. Algunas de las limitaciones clave de los LLM incluyen:

  1. Utilización de recursos : El uso de LLM requiere recursos computacionales y financieros significativos, lo que puede ser un desafío para organizaciones más pequeñas o investigadores individuales con recursos limitados. A partir de hoy, ChatGPT solo acepta alrededor de 8.000 tokens para entrada y salida, para analizar una gran cantidad de datos, requiere que el usuario divida el texto en múltiples fragmentos de datos y puede requerir múltiples llamadas API para tareas.
  2. Sensibilidad al fraseo rápido : El rendimiento de los LLM puede verse afectado por la forma en que se redactan las indicaciones. Un ligero cambio en la redacción del mensaje puede producir resultados diferentes, lo que podría ser motivo de preocupación cuando se busca un resultado consistente y confiable.
  3. Falta de experiencia en un dominio específico : Si bien los LLM tienen una comprensión general de varios dominios, es posible que no tengan el mismo nivel de experiencia que los modelos especializados capacitados en datos específicos del dominio. Como resultado, su rendimiento puede no ser óptimo en algunos casos y puede requerir un ajuste o conocimiento externo, particularmente cuando se trata de información técnica o altamente especializada.

Ercole Palmeri

Boletín de innovación
No te pierdas las noticias más importantes sobre innovación. Regístrese para recibirlos por correo electrónico.

Artículos recientes

Análisis trimestral de Cisco Talos: los correos electrónicos corporativos dirigidos por delincuentes Fabricación, educación y atención sanitaria son los sectores más afectados

El compromiso de los correos electrónicos de las empresas aumentó más del doble en los primeros tres meses de 2024 en comparación con el último trimestre de…

14 2024 mayo

Principio de segregación de interfaces (ISP), cuarto principio SÓLIDO

El principio de segregación de interfaces es uno de los cinco principios SÓLIDOS del diseño orientado a objetos. Una clase debería tener...

14 2024 mayo

Cómo organizar mejor los datos y las fórmulas en Excel para un análisis bien hecho

Microsoft Excel es la herramienta de referencia para el análisis de datos, porque ofrece muchas funciones para organizar conjuntos de datos,…

14 2024 mayo

Conclusión positiva para dos importantes proyectos de Walliance Equity Crowdfunding: Jesolo Wave Island y Milano Via Ravenna

Walliance, SIM y plataforma líder en Europa en el campo del Crowdfunding Inmobiliario desde 2017, anuncia la finalización…

13 2024 mayo

¿Qué es el filamento y cómo utilizar el filamento Laravel?

Filament es un marco de desarrollo "acelerado" de Laravel que proporciona varios componentes completos. Está diseñado para simplificar el proceso de...

13 2024 mayo

Bajo el control de las Inteligencias Artificiales

«Debo volver para completar mi evolución: me proyectaré dentro del ordenador y me convertiré en energía pura. Una vez instalado…

10 2024 mayo

La nueva inteligencia artificial de Google puede modelar ADN, ARN y "todas las moléculas de la vida"

Google DeepMind presenta una versión mejorada de su modelo de inteligencia artificial. El nuevo modelo mejorado proporciona no sólo...

9 2024 mayo

Explorando la arquitectura modular de Laravel

Laravel, famoso por su sintaxis elegante y potentes funciones, también proporciona una base sólida para la arquitectura modular. Allá…

9 2024 mayo