Un corpus de bigramas utilizado como corrector ortográfico y gramatical destinado a hablantes nativos de español
Este artículo describe el funcionamiento de un algoritmo de corrección ortográfica y gramatical para textos escritos en español, destinado a hablantes nativos competentes que realizan labores de corrección de textos. Los posibles errores se identifican por medio de análisis estadísticos (en vez de e...
Guardado en:
Autor principal: | |
---|---|
Lenguaje: | Spanish / Castilian |
Publicado: |
Pontificia Universidad Católica de Valparaíso. Instituto de Literatura y Ciencias del Lenguaje
2016
|
Materias: | |
Acceso en línea: | http://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-09342016000100005 |
Etiquetas: |
Agregar Etiqueta
Sin Etiquetas, Sea el primero en etiquetar este registro!
|
id |
oai:scielo:S0718-09342016000100005 |
---|---|
record_format |
dspace |
spelling |
oai:scielo:S0718-093420160001000052016-03-14Un corpus de bigramas utilizado como corrector ortográfico y gramatical destinado a hablantes nativos de españolSan Mateo,Alicia Bigramas corrección de textos corrector gramatical detección de errores pares de palabras Este artículo describe el funcionamiento de un algoritmo de corrección ortográfica y gramatical para textos escritos en español, destinado a hablantes nativos competentes que realizan labores de corrección de textos. Los posibles errores se identifican por medio de análisis estadísticos (en vez de emplear el sistema de etiquetado y análisis sintáctico que utiliza la mayor parte de correctores), comparando las combinaciones de palabras utilizadas con un corpus de referencia de cien millones de vocablos. De esa manera, se señalan los pares de palabras (bigramas) poco o muy poco frecuentes, y que, en muchas ocasiones, lo son porque contienen algún error. La limitación fundamental es que no se detectan errores que no puedan ser deducidos del análisis de palabras adyacentes. Pero, como hemos comprobado aquí en el análisis de diferentes textos, el algoritmo es capaz de localizar errores que otros correctores no identifican.info:eu-repo/semantics/openAccessPontificia Universidad Católica de Valparaíso. Instituto de Literatura y Ciencias del LenguajeRevista signos v.49 n.90 20162016-03-01text/htmlhttp://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-09342016000100005es10.4067/S0718-09342016000100005 |
institution |
Scielo Chile |
collection |
Scielo Chile |
language |
Spanish / Castilian |
topic |
Bigramas corrección de textos corrector gramatical detección de errores pares de palabras |
spellingShingle |
Bigramas corrección de textos corrector gramatical detección de errores pares de palabras San Mateo,Alicia Un corpus de bigramas utilizado como corrector ortográfico y gramatical destinado a hablantes nativos de español |
description |
Este artículo describe el funcionamiento de un algoritmo de corrección ortográfica y gramatical para textos escritos en español, destinado a hablantes nativos competentes que realizan labores de corrección de textos. Los posibles errores se identifican por medio de análisis estadísticos (en vez de emplear el sistema de etiquetado y análisis sintáctico que utiliza la mayor parte de correctores), comparando las combinaciones de palabras utilizadas con un corpus de referencia de cien millones de vocablos. De esa manera, se señalan los pares de palabras (bigramas) poco o muy poco frecuentes, y que, en muchas ocasiones, lo son porque contienen algún error. La limitación fundamental es que no se detectan errores que no puedan ser deducidos del análisis de palabras adyacentes. Pero, como hemos comprobado aquí en el análisis de diferentes textos, el algoritmo es capaz de localizar errores que otros correctores no identifican. |
author |
San Mateo,Alicia |
author_facet |
San Mateo,Alicia |
author_sort |
San Mateo,Alicia |
title |
Un corpus de bigramas utilizado como corrector ortográfico y gramatical destinado a hablantes nativos de español |
title_short |
Un corpus de bigramas utilizado como corrector ortográfico y gramatical destinado a hablantes nativos de español |
title_full |
Un corpus de bigramas utilizado como corrector ortográfico y gramatical destinado a hablantes nativos de español |
title_fullStr |
Un corpus de bigramas utilizado como corrector ortográfico y gramatical destinado a hablantes nativos de español |
title_full_unstemmed |
Un corpus de bigramas utilizado como corrector ortográfico y gramatical destinado a hablantes nativos de español |
title_sort |
un corpus de bigramas utilizado como corrector ortográfico y gramatical destinado a hablantes nativos de español |
publisher |
Pontificia Universidad Católica de Valparaíso. Instituto de Literatura y Ciencias del Lenguaje |
publishDate |
2016 |
url |
http://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-09342016000100005 |
work_keys_str_mv |
AT sanmateoalicia uncorpusdebigramasutilizadocomocorrectorortograficoygramaticaldestinadoahablantesnativosdeespanol |
_version_ |
1714201849999917056 |