Clasificación de Textos Multi-etiquetados con Modelo Bernoulli Multi-variado y Representación Dependiente de la Etiqueta

Resumen La asignación de una o más categorías predefinidas a los textos en lenguaje natural, basados en su contenido, es un componente importante y necesario en muchas tareas al interior de las organizaciones. Esta tarea se realiza comúnmente a través de la clasificación automática de textos, esto e...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Alfaro A.,Rodrigo, Allende O.,Héctor
Lenguaje:Spanish / Castilian
Publicado: Pontificia Universidad Católica de Valparaíso. Instituto de Literatura y Ciencias del Lenguaje 2020
Materias:
Acceso en línea:http://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-09342020000300549
Etiquetas: Agregar Etiqueta
Sin Etiquetas, Sea el primero en etiquetar este registro!
id oai:scielo:S0718-09342020000300549
record_format dspace
spelling oai:scielo:S0718-093420200003005492020-12-15Clasificación de Textos Multi-etiquetados con Modelo Bernoulli Multi-variado y Representación Dependiente de la EtiquetaAlfaro A.,RodrigoAllende O.,Héctor Multi-etiqueta clasificación de textos representación de textos transformación del problema ponderación de términos Resumen La asignación de una o más categorías predefinidas a los textos en lenguaje natural, basados en su contenido, es un componente importante y necesario en muchas tareas al interior de las organizaciones. Esta tarea se realiza comúnmente a través de la clasificación automática de textos, esto es, clasificando documentos dentro de un conjunto de categorías predefinidas por medio de un modelo y método computacional. La representación de los textos para propósitos de clasificación automática ha sido tradicionalmente llevada a cabo usando un modelo de espacio vectorial debido a su simplicidad y buen rendimiento. Por otro lado, la clasificación automática de textos por multi-etiquetados ha sido típicamente abordada utilizando métodos de clasificación de etiqueta simple, lo que implica transformar el problema estudiado para aplicar técnicas binarias o adaptar algoritmos binarios para que funcionen con múltiples etiquetas. En este artículo el objetivo es evaluar un factor de ponderación de las palabras de los textos en el modelo booleano para representación de texto en clasificación multi-etiqueta, usando una combinación de dos enfoques: transformación de problema y adaptación de modelo. Este factor de ponderación y la combinación de enfoques en la clasifiación automática fue puesto a prueba con cuatro diferentes conjuntos de datos textuales utilizados en la literatura especializada y comparado con técnicas alternativas por medio de tres medidas de evaluación. Los resultados presentan mejoras superiores al 10% en el rendimiento de los clasificadores, atribuidas a nuestra propuesta, en todos los casos analizados.info:eu-repo/semantics/openAccessPontificia Universidad Católica de Valparaíso. Instituto de Literatura y Ciencias del LenguajeRevista signos v.53 n.104 20202020-12-01text/htmlhttp://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-09342020000300549es10.4067/S0718-09342020000300549
institution Scielo Chile
collection Scielo Chile
language Spanish / Castilian
topic Multi-etiqueta
clasificación de textos
representación de textos
transformación del problema
ponderación de términos
spellingShingle Multi-etiqueta
clasificación de textos
representación de textos
transformación del problema
ponderación de términos
Alfaro A.,Rodrigo
Allende O.,Héctor
Clasificación de Textos Multi-etiquetados con Modelo Bernoulli Multi-variado y Representación Dependiente de la Etiqueta
description Resumen La asignación de una o más categorías predefinidas a los textos en lenguaje natural, basados en su contenido, es un componente importante y necesario en muchas tareas al interior de las organizaciones. Esta tarea se realiza comúnmente a través de la clasificación automática de textos, esto es, clasificando documentos dentro de un conjunto de categorías predefinidas por medio de un modelo y método computacional. La representación de los textos para propósitos de clasificación automática ha sido tradicionalmente llevada a cabo usando un modelo de espacio vectorial debido a su simplicidad y buen rendimiento. Por otro lado, la clasificación automática de textos por multi-etiquetados ha sido típicamente abordada utilizando métodos de clasificación de etiqueta simple, lo que implica transformar el problema estudiado para aplicar técnicas binarias o adaptar algoritmos binarios para que funcionen con múltiples etiquetas. En este artículo el objetivo es evaluar un factor de ponderación de las palabras de los textos en el modelo booleano para representación de texto en clasificación multi-etiqueta, usando una combinación de dos enfoques: transformación de problema y adaptación de modelo. Este factor de ponderación y la combinación de enfoques en la clasifiación automática fue puesto a prueba con cuatro diferentes conjuntos de datos textuales utilizados en la literatura especializada y comparado con técnicas alternativas por medio de tres medidas de evaluación. Los resultados presentan mejoras superiores al 10% en el rendimiento de los clasificadores, atribuidas a nuestra propuesta, en todos los casos analizados.
author Alfaro A.,Rodrigo
Allende O.,Héctor
author_facet Alfaro A.,Rodrigo
Allende O.,Héctor
author_sort Alfaro A.,Rodrigo
title Clasificación de Textos Multi-etiquetados con Modelo Bernoulli Multi-variado y Representación Dependiente de la Etiqueta
title_short Clasificación de Textos Multi-etiquetados con Modelo Bernoulli Multi-variado y Representación Dependiente de la Etiqueta
title_full Clasificación de Textos Multi-etiquetados con Modelo Bernoulli Multi-variado y Representación Dependiente de la Etiqueta
title_fullStr Clasificación de Textos Multi-etiquetados con Modelo Bernoulli Multi-variado y Representación Dependiente de la Etiqueta
title_full_unstemmed Clasificación de Textos Multi-etiquetados con Modelo Bernoulli Multi-variado y Representación Dependiente de la Etiqueta
title_sort clasificación de textos multi-etiquetados con modelo bernoulli multi-variado y representación dependiente de la etiqueta
publisher Pontificia Universidad Católica de Valparaíso. Instituto de Literatura y Ciencias del Lenguaje
publishDate 2020
url http://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-09342020000300549
work_keys_str_mv AT alfaroarodrigo clasificaciondetextosmultietiquetadosconmodelobernoullimultivariadoyrepresentaciondependientedelaetiqueta
AT allendeohector clasificaciondetextosmultietiquetadosconmodelobernoullimultivariadoyrepresentaciondependientedelaetiqueta
_version_ 1714201873357996032