Un corpus de bigramas utilizado como corrector ortográfico y gramatical destinado a hablantes nativos de español

Este artículo describe el funcionamiento de un algoritmo de corrección ortográfica y gramatical para textos escritos en español, destinado a hablantes nativos competentes que realizan labores de corrección de textos. Los posibles errores se identifican por medio de análisis estadísticos (en vez de e...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: San Mateo,Alicia
Lenguaje:Spanish / Castilian
Publicado: Pontificia Universidad Católica de Valparaíso. Instituto de Literatura y Ciencias del Lenguaje 2016
Materias:
Acceso en línea:http://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-09342016000100005
Etiquetas: Agregar Etiqueta
Sin Etiquetas, Sea el primero en etiquetar este registro!
id oai:scielo:S0718-09342016000100005
record_format dspace
spelling oai:scielo:S0718-093420160001000052016-03-14Un corpus de bigramas utilizado como corrector ortográfico y gramatical destinado a hablantes nativos de españolSan Mateo,Alicia Bigramas corrección de textos corrector gramatical detección de errores pares de palabras Este artículo describe el funcionamiento de un algoritmo de corrección ortográfica y gramatical para textos escritos en español, destinado a hablantes nativos competentes que realizan labores de corrección de textos. Los posibles errores se identifican por medio de análisis estadísticos (en vez de emplear el sistema de ‘etiquetado’ y análisis sintáctico que utiliza la mayor parte de correctores), comparando las combinaciones de palabras utilizadas con un corpus de referencia de cien millones de vocablos. De esa manera, se señalan los pares de palabras (bigramas) poco o muy poco frecuentes, y que, en muchas ocasiones, lo son porque contienen algún error. La limitación fundamental es que no se detectan errores que no puedan ser deducidos del análisis de palabras adyacentes. Pero, como hemos comprobado aquí en el análisis de diferentes textos, el algoritmo es capaz de localizar errores que otros correctores no identifican.info:eu-repo/semantics/openAccessPontificia Universidad Católica de Valparaíso. Instituto de Literatura y Ciencias del LenguajeRevista signos v.49 n.90 20162016-03-01text/htmlhttp://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-09342016000100005es10.4067/S0718-09342016000100005
institution Scielo Chile
collection Scielo Chile
language Spanish / Castilian
topic Bigramas
corrección de textos
corrector gramatical
detección de errores
pares de palabras
spellingShingle Bigramas
corrección de textos
corrector gramatical
detección de errores
pares de palabras
San Mateo,Alicia
Un corpus de bigramas utilizado como corrector ortográfico y gramatical destinado a hablantes nativos de español
description Este artículo describe el funcionamiento de un algoritmo de corrección ortográfica y gramatical para textos escritos en español, destinado a hablantes nativos competentes que realizan labores de corrección de textos. Los posibles errores se identifican por medio de análisis estadísticos (en vez de emplear el sistema de ‘etiquetado’ y análisis sintáctico que utiliza la mayor parte de correctores), comparando las combinaciones de palabras utilizadas con un corpus de referencia de cien millones de vocablos. De esa manera, se señalan los pares de palabras (bigramas) poco o muy poco frecuentes, y que, en muchas ocasiones, lo son porque contienen algún error. La limitación fundamental es que no se detectan errores que no puedan ser deducidos del análisis de palabras adyacentes. Pero, como hemos comprobado aquí en el análisis de diferentes textos, el algoritmo es capaz de localizar errores que otros correctores no identifican.
author San Mateo,Alicia
author_facet San Mateo,Alicia
author_sort San Mateo,Alicia
title Un corpus de bigramas utilizado como corrector ortográfico y gramatical destinado a hablantes nativos de español
title_short Un corpus de bigramas utilizado como corrector ortográfico y gramatical destinado a hablantes nativos de español
title_full Un corpus de bigramas utilizado como corrector ortográfico y gramatical destinado a hablantes nativos de español
title_fullStr Un corpus de bigramas utilizado como corrector ortográfico y gramatical destinado a hablantes nativos de español
title_full_unstemmed Un corpus de bigramas utilizado como corrector ortográfico y gramatical destinado a hablantes nativos de español
title_sort un corpus de bigramas utilizado como corrector ortográfico y gramatical destinado a hablantes nativos de español
publisher Pontificia Universidad Católica de Valparaíso. Instituto de Literatura y Ciencias del Lenguaje
publishDate 2016
url http://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-09342016000100005
work_keys_str_mv AT sanmateoalicia uncorpusdebigramasutilizadocomocorrectorortograficoygramaticaldestinadoahablantesnativosdeespanol
_version_ 1714201849999917056