Segmentación automática de noticias mediante procesamiento de formas prosódicas
La segmentación automatizada de noticias en tiempo real es un problema que ha tenido un abordaje fundamentalmente lingüístico y de procesamiento de la señal en los últimos años. El trabajo que presentamos tiene un enfoque sustancialmente diferente: desde una perspectiva comunicológica, se toman las...
Guardado en:
Autor principal: | |
---|---|
Lenguaje: | Spanish / Castilian |
Publicado: |
Universidad de Tarapacá.
2014
|
Materias: | |
Acceso en línea: | http://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-33052014000300008 |
Etiquetas: |
Agregar Etiqueta
Sin Etiquetas, Sea el primero en etiquetar este registro!
|
Sumario: | La segmentación automatizada de noticias en tiempo real es un problema que ha tenido un abordaje fundamentalmente lingüístico y de procesamiento de la señal en los últimos años. El trabajo que presentamos tiene un enfoque sustancialmente diferente: desde una perspectiva comunicológica, se toman las formas prosódicas típicas del discurso informativo y se intentan programar mediante el procesamiento cepstrum en el entorno Labview. Después de numerosas pruebas se fijan los diferentes parámetros de procesamiento y estilización de la curva macromelódica basada en los máximos de pitch (parábolas). Se formula un algoritmo de segmentación automática de noticias a partir de la detección de pausas y el análisis de formas prosódicas de inicio y final de noticia. Sobre una muestra de cinco informativos reales emitidos en el canal español Cuatro en julio de 2009, el entorno detecta 98 pausas y etiqueta correctamente (corte/no corte) el 76% de las mismas. La totalidad de los cortes estaban contenidos en las 98 pausas localizadas, de los cuales el algoritmo pasa por alto 9 y genera 15 errores de cortes mal emplazados. Tanto la lingüística computacional como el procesamiento del habla pueden tener un importante margen de mejora si también se asume la perspectiva comunicológica: agrupar datos acústicos como variables complejas asociadas a cada acto de comunicación. Para futuros trabajos, este algoritmo puede ser mejorado si se complementa con sistemas de identificación de locutores, discriminación de ruidos y word spotting. |
---|