Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos

El objetivo de este artículo es hacer uso de la técnica Web Scraping para extraer datos de Google Scholar (GS)a través de diferentes métodos. El Web Scraping es una forma de minería de datos no estructurada, que permite extraer información de páginas web, escanear su código HTML y generar patrones d...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Danny Murillo, Dalys Saavedra, Erika Quintero
Formato: article
Lenguaje:ES
Publicado: Editorial Universitaria 2018
Materias:
Acceso en línea:https://doaj.org/article/83797facf31647f4ad382447d53386a2
Etiquetas: Agregar Etiqueta
Sin Etiquetas, Sea el primero en etiquetar este registro!
id oai:doaj.org-article:83797facf31647f4ad382447d53386a2
record_format dspace
spelling oai:doaj.org-article:83797facf31647f4ad382447d53386a22021-11-16T19:05:11ZExtracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos1680-88942219-671410.33412/idt.v14.1.1807https://doaj.org/article/83797facf31647f4ad382447d53386a22018-06-01T00:00:00Zhttps://revistas.utp.ac.pa/index.php/id-tecnologico/article/view/1807https://doaj.org/toc/1680-8894https://doaj.org/toc/2219-6714El objetivo de este artículo es hacer uso de la técnica Web Scraping para extraer datos de Google Scholar (GS)a través de diferentes métodos. El Web Scraping es una forma de minería de datos no estructurada, que permite extraer información de páginas web, escanear su código HTML y generar patrones de extracción de datos. Además, con el fin de realizar un análisis más profundo, se creó un algoritmo en el lenguaje R para comparar la velocidad de extracción de los datos y la eficiencia en el formato de salida de los datos. El artículo muestra las pruebas realizadas de estos métodos para medir la velocidad de extracción de los datos y buscar la mejor forma de extraer los datos de GS de forma estructurada.Danny MurilloDalys SaavedraErika QuinteroEditorial Universitariaarticleweb scrapinggoogle scholarminería de datoslenguaje ranálisis de datos.BiotechnologyTP248.13-248.65ESRevista de I + D Tecnológico, Vol 14, Iss 1, Pp 94-104 (2018)
institution DOAJ
collection DOAJ
language ES
topic web scraping
google scholar
minería de datos
lenguaje r
análisis de datos.
Biotechnology
TP248.13-248.65
spellingShingle web scraping
google scholar
minería de datos
lenguaje r
análisis de datos.
Biotechnology
TP248.13-248.65
Danny Murillo
Dalys Saavedra
Erika Quintero
Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos
description El objetivo de este artículo es hacer uso de la técnica Web Scraping para extraer datos de Google Scholar (GS)a través de diferentes métodos. El Web Scraping es una forma de minería de datos no estructurada, que permite extraer información de páginas web, escanear su código HTML y generar patrones de extracción de datos. Además, con el fin de realizar un análisis más profundo, se creó un algoritmo en el lenguaje R para comparar la velocidad de extracción de los datos y la eficiencia en el formato de salida de los datos. El artículo muestra las pruebas realizadas de estos métodos para medir la velocidad de extracción de los datos y buscar la mejor forma de extraer los datos de GS de forma estructurada.
format article
author Danny Murillo
Dalys Saavedra
Erika Quintero
author_facet Danny Murillo
Dalys Saavedra
Erika Quintero
author_sort Danny Murillo
title Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos
title_short Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos
title_full Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos
title_fullStr Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos
title_full_unstemmed Extracción de datos de perfiles en Google Scholar utilizando un algoritmo en el lenguaje R para hacer minería de datos
title_sort extracción de datos de perfiles en google scholar utilizando un algoritmo en el lenguaje r para hacer minería de datos
publisher Editorial Universitaria
publishDate 2018
url https://doaj.org/article/83797facf31647f4ad382447d53386a2
work_keys_str_mv AT dannymurillo extracciondedatosdeperfilesengooglescholarutilizandounalgoritmoenellenguajerparahacermineriadedatos
AT dalyssaavedra extracciondedatosdeperfilesengooglescholarutilizandounalgoritmoenellenguajerparahacermineriadedatos
AT erikaquintero extracciondedatosdeperfilesengooglescholarutilizandounalgoritmoenellenguajerparahacermineriadedatos
_version_ 1718426111813091328