LOS CORPUS DEL ESPAÑOL CLÁSICO Y MODERNO: ENTRE LA FILOLOGÍA Y LA LINGÜÍSTICA COMPUTACIONAL

RESUMEN En este artículo se analiza la práctica habitual de elaboración de corpus del español, tanto europeo como americano, del periodo comprendido entre finales del siglo XV y finales del XIX. Se prestará especial atención al modelo seguido por seis corpus diacrónicos: CHARTA, CODEA 2015, CORDIAM,...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: CALDERÓN CAMPOS,MIGUEL
Lenguaje:Spanish / Castilian
Publicado: Universidad de Concepción. Facultad de Humanidades y Arte 2019
Materias:
XML
Acceso en línea:http://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-48832019000200041
Etiquetas: Agregar Etiqueta
Sin Etiquetas, Sea el primero en etiquetar este registro!
id oai:scielo:S0718-48832019000200041
record_format dspace
spelling oai:scielo:S0718-488320190002000412020-04-09LOS CORPUS DEL ESPAÑOL CLÁSICO Y MODERNO: ENTRE LA FILOLOGÍA Y LA LINGÜÍSTICA COMPUTACIONALCALDERÓN CAMPOS,MIGUEL Historia de la lengua española corpus diacrónicos lingüistica de corpus XML oralidad en los textos escritos RESUMEN En este artículo se analiza la práctica habitual de elaboración de corpus del español, tanto europeo como americano, del periodo comprendido entre finales del siglo XV y finales del XIX. Se prestará especial atención al modelo seguido por seis corpus diacrónicos: CHARTA, CODEA 2015, CORDIAM, CorLexIn, Post Scriptum y Cíbola, con el objeto de extraer conclusiones metodológicas aplicables a trabajos futuros o iniciales, como el corpus Oralia diacrónica del español (ODE), actualmente en fase de elaboración en la Universidad de Granada. El análisis efectuado revela que, si bien no se aprecian grandes diferencias en el rigor y los criterios de transcripción documental, no parece haber acuerdo en lo referente a la manera de procesar y estructurar la información, tanto textual como metatextual. En este trabajo se defiende la conveniencia de adoptar un modelo estandarizado basado en el uso de XML, siguiendo las directrices del consorcio TEI para la codificación y etiquetado de corpus históricos. Este modelo permitirá la integración de diferentes corpus y, sobre todo, un más fácil acceso a la información por parte de los usuarios.info:eu-repo/semantics/openAccessUniversidad de Concepción. Facultad de Humanidades y ArteRLA. Revista de lingüística teórica y aplicada v.57 n.2 20192019-12-01text/htmlhttp://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-48832019000200041es10.4067/S0718-48832019000200041
institution Scielo Chile
collection Scielo Chile
language Spanish / Castilian
topic Historia de la lengua española
corpus diacrónicos
lingüistica de corpus
XML
oralidad en los textos escritos
spellingShingle Historia de la lengua española
corpus diacrónicos
lingüistica de corpus
XML
oralidad en los textos escritos
CALDERÓN CAMPOS,MIGUEL
LOS CORPUS DEL ESPAÑOL CLÁSICO Y MODERNO: ENTRE LA FILOLOGÍA Y LA LINGÜÍSTICA COMPUTACIONAL
description RESUMEN En este artículo se analiza la práctica habitual de elaboración de corpus del español, tanto europeo como americano, del periodo comprendido entre finales del siglo XV y finales del XIX. Se prestará especial atención al modelo seguido por seis corpus diacrónicos: CHARTA, CODEA 2015, CORDIAM, CorLexIn, Post Scriptum y Cíbola, con el objeto de extraer conclusiones metodológicas aplicables a trabajos futuros o iniciales, como el corpus Oralia diacrónica del español (ODE), actualmente en fase de elaboración en la Universidad de Granada. El análisis efectuado revela que, si bien no se aprecian grandes diferencias en el rigor y los criterios de transcripción documental, no parece haber acuerdo en lo referente a la manera de procesar y estructurar la información, tanto textual como metatextual. En este trabajo se defiende la conveniencia de adoptar un modelo estandarizado basado en el uso de XML, siguiendo las directrices del consorcio TEI para la codificación y etiquetado de corpus históricos. Este modelo permitirá la integración de diferentes corpus y, sobre todo, un más fácil acceso a la información por parte de los usuarios.
author CALDERÓN CAMPOS,MIGUEL
author_facet CALDERÓN CAMPOS,MIGUEL
author_sort CALDERÓN CAMPOS,MIGUEL
title LOS CORPUS DEL ESPAÑOL CLÁSICO Y MODERNO: ENTRE LA FILOLOGÍA Y LA LINGÜÍSTICA COMPUTACIONAL
title_short LOS CORPUS DEL ESPAÑOL CLÁSICO Y MODERNO: ENTRE LA FILOLOGÍA Y LA LINGÜÍSTICA COMPUTACIONAL
title_full LOS CORPUS DEL ESPAÑOL CLÁSICO Y MODERNO: ENTRE LA FILOLOGÍA Y LA LINGÜÍSTICA COMPUTACIONAL
title_fullStr LOS CORPUS DEL ESPAÑOL CLÁSICO Y MODERNO: ENTRE LA FILOLOGÍA Y LA LINGÜÍSTICA COMPUTACIONAL
title_full_unstemmed LOS CORPUS DEL ESPAÑOL CLÁSICO Y MODERNO: ENTRE LA FILOLOGÍA Y LA LINGÜÍSTICA COMPUTACIONAL
title_sort los corpus del español clásico y moderno: entre la filología y la lingüística computacional
publisher Universidad de Concepción. Facultad de Humanidades y Arte
publishDate 2019
url http://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-48832019000200041
work_keys_str_mv AT calderoncamposmiguel loscorpusdelespanolclasicoymodernoentrelafilologiaylalinguisticacomputacional
_version_ 1714204659543965696