Statistical and Visual Analysis of Audio, Text, and Image Features for Multi-Modal Music Genre Recognition

We present a multi-modal genre recognition framework that considers the modalities audio, text, and image by features extracted from audio signals, album cover images, and lyrics of music tracks. In contrast to pure learning of features by a neural network as done in the related work, handcrafted fe...

Descripción completa

Guardado en:

Detalles Bibliográficos
Autores principales:	Ben Wilkes, Igor Vatolkin, Heinrich Müller
Formato:	article
Lenguaje:	EN
Publicado:	MDPI AG 2021
Materias:	music genre recognition multi-modal classification feature evaluation audio signal features album cover images lyrics Science Q Astrophysics QB460-466 Physics QC1-999
Acceso en línea:	https://doaj.org/article/260d78d3e8cc474fbad690f2379f312d
Etiquetas:	Agregar Etiqueta Sin Etiquetas, Sea el primero en etiquetar este registro!

Sea el primero en dejar un comentario!

Statistical and Visual Analysis of Audio, Text, and Image Features for Multi-Modal Music Genre Recognition

Ejemplares similares