Segmentación automática de noticias mediante procesamiento de formas prosódicas

La segmentación automatizada de noticias en tiempo real es un problema que ha tenido un abordaje fundamentalmente lingüístico y de procesamiento de la señal en los últimos años. El trabajo que presentamos tiene un enfoque sustancialmente diferente: desde una perspectiva comunicológica, se toman las...

Descripción completa

Guardado en:

Detalles Bibliográficos
Autor principal:	Mas Manchón,Lluís
Lenguaje:	Spanish / Castilian
Publicado:	Universidad de Tarapacá. 2014
Materias:	Locución informativa segmentación automática formas prosódicas cepstrum estilización macromelódica
Acceso en línea:	http://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-33052014000300008
Etiquetas:	Agregar Etiqueta Sin Etiquetas, Sea el primero en etiquetar este registro!

Descripción
Sumario:	La segmentación automatizada de noticias en tiempo real es un problema que ha tenido un abordaje fundamentalmente lingüístico y de procesamiento de la señal en los últimos años. El trabajo que presentamos tiene un enfoque sustancialmente diferente: desde una perspectiva comunicológica, se toman las formas prosódicas típicas del discurso informativo y se intentan programar mediante el procesamiento cepstrum en el entorno Labview. Después de numerosas pruebas se fijan los diferentes parámetros de procesamiento y estilización de la curva macromelódica basada en los máximos de pitch (parábolas). Se formula un algoritmo de segmentación automática de noticias a partir de la detección de pausas y el análisis de formas prosódicas de inicio y final de noticia. Sobre una muestra de cinco informativos reales emitidos en el canal español Cuatro en julio de 2009, el entorno detecta 98 pausas y etiqueta correctamente (corte/no corte) el 76% de las mismas. La totalidad de los cortes estaban contenidos en las 98 pausas localizadas, de los cuales el algoritmo pasa por alto 9 y genera 15 errores de cortes mal emplazados. Tanto la lingüística computacional como el procesamiento del habla pueden tener un importante margen de mejora si también se asume la perspectiva comunicológica: agrupar datos acústicos como variables complejas asociadas a cada acto de comunicación. Para futuros trabajos, este algoritmo puede ser mejorado si se complementa con sistemas de identificación de locutores, discriminación de ruidos y word spotting.

Segmentación automática de noticias mediante procesamiento de formas prosódicas

Ejemplares similares