Clasificación de Textos Multi-etiquetados con Modelo Bernoulli Multi-variado y Representación Dependiente de la Etiqueta

Autores/as

  • Rodrigo Marcelo Alfaro Arancibia Universidad Técnico Federico Santa María Universidad Católica de Valparaíso
  • Héctor Allende O. Universidad Técnico Federico Santa María

Palabras clave:

Multi-etiqueta, clasificación de textos, representación de textos, transformación del problema, ponderación de términos

Resumen

La asignación de una o más categorías predefinidas a los textos en lenguaje natural, basados en su contenido, es un componente importante y necesario en muchas tareas de las organizaciones. La clasificación automática de textos es la tarea de clasificar documentos dentro de un conjunto de categorías predefinidas por medio de un modelo y método computacional. La representación de los textos para propósitos de clasificación automática, ha sido tradicionalmente llevada a cabo usando un modelo de espacio vectorial debido a su simplicidad y buen rendimiento. Por otro lado, la clasificación automática de texto por multi-etiquetados ha sido típicamente abordada por medio de métodos de clasificación de etiqueta simple, por medio de transformar el problema estudiado para aplicar técnicas binarias, o al adaptar algoritmos binarios para que funcionen con múltiples etiquetas. En este paper evaluamos un factor de ponderación de términos en el modelo booleano para representación de texto en clasificación multi-etiqueta usando una combinación de dos enfoques: transformación de problema y adaptación de modelo. El rendimiento fue testeado con cuatro conocidas conjuntos de datos y comparado con técnicas alternativas en términos de tres medidas de evaluación bien conocidas. Resultados experimentales muestras mejoras en todos los casos.

Descargas

Publicado

2020-12-01

Cómo citar

Alfaro Arancibia, R. M., & Allende O., H. (2020). Clasificación de Textos Multi-etiquetados con Modelo Bernoulli Multi-variado y Representación Dependiente de la Etiqueta. Revista Signos. Estudios De Lingüística, 53(104). Recuperado a partir de http://www.revistasignos.cl/index.php/signos/article/view/63

Número

Sección

Artículos