Hacia una normalización de la frecuencia de los corpus CREA y CORDE

El Corpus Diacrónico del Español (CORDE) y el Corpus de Referencia del Español Actual (CREA) integran uno de los bancos de datos documentales más grande del español y son usados por especialistas en el estudio de la lengua española. Este recurso presenta algunas limitaciones en términos de tamaño, u...

Descripción completa

Guardado en:

Detalles Bibliográficos
Autores principales:	Molina Salinas,Claudio, Sierra Martínez,Gerardo
Lenguaje:	Spanish / Castilian
Publicado:	Pontificia Universidad Católica de Valparaíso. Instituto de Literatura y Ciencias del Lenguaje 2015
Materias:	Lingüística de corpus estadística de corpus normalización de frecuencias de corpus lingüística cuantitativa corpus CORDE y CREA
Acceso en línea:	http://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-09342015000300002
Etiquetas:	Agregar Etiqueta Sin Etiquetas, Sea el primero en etiquetar este registro!

Descripción
Sumario:	El Corpus Diacrónico del Español (CORDE) y el Corpus de Referencia del Español Actual (CREA) integran uno de los bancos de datos documentales más grande del español y son usados por especialistas en el estudio de la lengua española. Este recurso presenta algunas limitaciones en términos de tamaño, unidad de muestra y representatividad, que condicionan sus resultados y, por tanto, las descripciones de cualquier fenómeno lingüístico estudiado. En el presente trabajo identificamos estas limitaciones y proponemos un método de normalización de frecuencias de documento, por medio del cálculo de medias móviles. Esto permite una interpretación más realista de la lengua española, a través de los datos del corpus, y un aprovechamiento más efectivo del propio recurso.

Hacia una normalización de la frecuencia de los corpus CREA y CORDE

Ejemplares similares