Conceptos relacionados con estrella. Lingüística de corpus de astronomía

The PhD. thesis was made within the line of research of the GICEC (Group of Research of Concepts in Science Teaching). The research focus on the improvement and justification of the methodology used for determining frequent vocabularies, specific vocabularies, collocations and relations between lexi...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Hansen Ruiz, Cristina Silvia
Otros Autores: Pérez Ceballos, Jesús Miguel (Universidad de La Laguna)
Formato: text (thesis)
Lenguaje:spa
Publicado: Universidad de La Laguna (España) 2011
Materias:
Acceso en línea:https://dialnet.unirioja.es/servlet/oaites?codigo=24261
Etiquetas: Agregar Etiqueta
Sin Etiquetas, Sea el primero en etiquetar este registro!
id oai-TES0000002939
record_format dspace
institution DialNet
collection DialNet
language spa
topic Didáctica de la ciencia
Astronomía
Lingüística de corpus
Análisis de textos
Análisis de conceptos
Science teaching
Astronomy
Corpus linguistics
Text analysis
Concept analysis
spellingShingle Didáctica de la ciencia
Astronomía
Lingüística de corpus
Análisis de textos
Análisis de conceptos
Science teaching
Astronomy
Corpus linguistics
Text analysis
Concept analysis
Hansen Ruiz, Cristina Silvia
Conceptos relacionados con estrella. Lingüística de corpus de astronomía
description The PhD. thesis was made within the line of research of the GICEC (Group of Research of Concepts in Science Teaching). The research focus on the improvement and justification of the methodology used for determining frequent vocabularies, specific vocabularies, collocations and relations between lexical units. This requires the use of the software PAFE (Software for Frequency Analysis and Environment Studies) and techniques based on corpus linguistics for detecting specific vocabularies, frequent vocabularies and collocations. The methodology has been tested applying it to a particular text of more of 1000 words: a text of Astronomy made by the Hubble European Space Agency Information Centre (ESA/ESO) for Secondary Education. The frequency data of the lexical units obtained with the PAFE software is used to propose a mathematical way of obtaining frequent vocabularies based on the analysis of the absolute frequencies distribution. Specific vocabularies are found comparing the relative frequencies of a given text with the ones of a general corpus following techniques developed in corpus linguistics. Collocations are found comparing frequencies and relations between lexical units. Frequencies and relations are then used to build the semantic networks enriched with the previously detected information. The research concludes the need of: removing all functional words; unifying synonyms spellings only for words which are in the high and medium intervals; not removing the mathematical language due to its importance in frequencies and semantic networks; an expert in the subject being analyzed to correct the data obtained when finding collocations and specific vocabulary; the mathematical determination of the frequent vocabulary; determining the optimal system analyzing the conservation of relations for each lemma and the conservation of total relations within the system; and enriching semantic networks with the data about specific vocabularies and relation conservation. Moreover possible errors in the methodology are delimited, the limitations that affect the results are analyzed and possible errors in each of the phases of the methodology are quantified.
author2 Pérez Ceballos, Jesús Miguel (Universidad de La Laguna)
author_facet Pérez Ceballos, Jesús Miguel (Universidad de La Laguna)
Hansen Ruiz, Cristina Silvia
format text (thesis)
author Hansen Ruiz, Cristina Silvia
author_sort Hansen Ruiz, Cristina Silvia
title Conceptos relacionados con estrella. Lingüística de corpus de astronomía
title_short Conceptos relacionados con estrella. Lingüística de corpus de astronomía
title_full Conceptos relacionados con estrella. Lingüística de corpus de astronomía
title_fullStr Conceptos relacionados con estrella. Lingüística de corpus de astronomía
title_full_unstemmed Conceptos relacionados con estrella. Lingüística de corpus de astronomía
title_sort conceptos relacionados con estrella. lingüística de corpus de astronomía
publisher Universidad de La Laguna (España)
publishDate 2011
url https://dialnet.unirioja.es/servlet/oaites?codigo=24261
work_keys_str_mv AT hansenruizcristinasilvia conceptosrelacionadosconestrellalinguisticadecorpusdeastronomia
_version_ 1718346597817909248
spelling oai-TES00000029392020-10-15Conceptos relacionados con estrella. Lingüística de corpus de astronomíaHansen Ruiz, Cristina SilviaDidáctica de la cienciaAstronomíaLingüística de corpusAnálisis de textosAnálisis de conceptosScience teachingAstronomyCorpus linguisticsText analysisConcept analysisThe PhD. thesis was made within the line of research of the GICEC (Group of Research of Concepts in Science Teaching). The research focus on the improvement and justification of the methodology used for determining frequent vocabularies, specific vocabularies, collocations and relations between lexical units. This requires the use of the software PAFE (Software for Frequency Analysis and Environment Studies) and techniques based on corpus linguistics for detecting specific vocabularies, frequent vocabularies and collocations. The methodology has been tested applying it to a particular text of more of 1000 words: a text of Astronomy made by the Hubble European Space Agency Information Centre (ESA/ESO) for Secondary Education. The frequency data of the lexical units obtained with the PAFE software is used to propose a mathematical way of obtaining frequent vocabularies based on the analysis of the absolute frequencies distribution. Specific vocabularies are found comparing the relative frequencies of a given text with the ones of a general corpus following techniques developed in corpus linguistics. Collocations are found comparing frequencies and relations between lexical units. Frequencies and relations are then used to build the semantic networks enriched with the previously detected information. The research concludes the need of: removing all functional words; unifying synonyms spellings only for words which are in the high and medium intervals; not removing the mathematical language due to its importance in frequencies and semantic networks; an expert in the subject being analyzed to correct the data obtained when finding collocations and specific vocabulary; the mathematical determination of the frequent vocabulary; determining the optimal system analyzing the conservation of relations for each lemma and the conservation of total relations within the system; and enriching semantic networks with the data about specific vocabularies and relation conservation. Moreover possible errors in the methodology are delimited, the limitations that affect the results are analyzed and possible errors in each of the phases of the methodology are quantified.La tesis se enmarca en la línea de investigación del GICEC (Grupo de Investigación de Conceptos en la Enseñanza de las Ciencias).La investigación se centra en la mejora y justificación de la metodología usada para la determinación de vocabularios frecuentes, vocabularios específicos, colocaciones y relaciones entre unidades léxicas. Ello requiere el uso conjunto del PAFE (Programa de Análisis de Frecuencias y Estudios de Entorno) y técnicas de detección de vocabularios específicos, vocabularios frecuentes y colocaciones, provenientes o basadas en la lingüística de corpus. La evaluación de la metodología se ha hecho aplicándola a un caso particular de más de 1000 palabras: un texto de Astronomía realizado por El Centro de Información de la Agencia Espacial Europea del Hubble (ESA/ESO) para la Educación Secundaria. Los datos de frecuencia estadística de las unidades léxicas obtenidos con el PAFE son usados para proponer una forma matemática de obtener vocabularios frecuentes basados en el análisis de la distribución de frecuencias absolutas. Los vocabularios específicos se hallan comparando las frecuencias relativas del texto particular con las de un corpus general siguiendo técnicas desarrolladas en la lingüística de corpus. Se obtienen colocaciones comparando frecuencias y relaciones entre unidades léxicas. Las frecuencias y relaciones se usan para construir las redes semánticas enriquecidas por la información detectada previamente. La investigación concluye la necesidad de: eliminar todas las palabras funcionales; unificar grafías de sinónimos sólo para palabras situadas en las franjas alta y media; no eliminar el lenguaje matemático debido a su importancia tanto en frecuencias como en las redes semánticas; requerir de un experto en el tema abordado para corregir los datos obtenidos al hallar colocaciones y vocabulario específico; determinar matemáticamente el vocabulario más frecuente; determinar el sistema óptimo mediante el estudio de la conservación de relaciones por cada lema además de la conservación de relaciones globales del sistema; e incorporar en las redes semánticas la información de vocabulario específico y conservación de relaciones. Además se acotan los errores posibles en la metodología, se precisan las limitaciones que afectan a los resultados y se cuantifican los posibles errores de cada una de las fases del proceso.Universidad de La Laguna (España)Pérez Ceballos, Jesús Miguel (Universidad de La Laguna)2011text (thesis)application/pdfhttps://dialnet.unirioja.es/servlet/oaites?codigo=24261spaLICENCIA DE USO: Los documentos a texto completo incluidos en Dialnet son de acceso libre y propiedad de sus autores y/o editores. Por tanto, cualquier acto de reproducción, distribución, comunicación pública y/o transformación total o parcial requiere el consentimiento expreso y escrito de aquéllos. Cualquier enlace al texto completo de estos documentos deberá hacerse a través de la URL oficial de éstos en Dialnet. Más información: https://dialnet.unirioja.es/info/derechosOAI | INTELLECTUAL PROPERTY RIGHTS STATEMENT: Full text documents hosted by Dialnet are protected by copyright and/or related rights. This digital object is accessible without charge, but its use is subject to the licensing conditions set by its authors or editors. Unless expressly stated otherwise in the licensing conditions, you are free to linking, browsing, printing and making a copy for your own personal purposes. All other acts of reproduction and communication to the public are subject to the licensing conditions expressed by editors and authors and require consent from them. Any link to this document should be made using its official URL in Dialnet. More info: https://dialnet.unirioja.es/info/derechosOAI