Aplicação de Métodos Computacionais de Mineração de Dados na Classificação e Seleção de Oncogenes Medidos por Microarray

Introdução: Nas últimas décadas, o câncer ganhou uma dimensão maior, convertendo-se em um evidente problema de saúde pública mundial. A Organização Mundial da Saúde estimou que, no ano 2030, podem-se esperar 27 milhões de casos incidentes de câncer e 17 milhões de mortes por câncer. Frente a esse ce...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Fabrício Alves Rodrigues, Laurence Rodrigues do Amaral
Formato: article
Lenguaje:EN
PT
Publicado: Instituto Nacional de Câncer José Alencar Gomes da Silva (INCA) 2012
Materias:
Acceso en línea:https://doaj.org/article/be1e7b237e9341578aa6dc287dbca5e5
Etiquetas: Agregar Etiqueta
Sin Etiquetas, Sea el primero en etiquetar este registro!
id oai:doaj.org-article:be1e7b237e9341578aa6dc287dbca5e5
record_format dspace
spelling oai:doaj.org-article:be1e7b237e9341578aa6dc287dbca5e52021-11-29T20:14:30ZAplicação de Métodos Computacionais de Mineração de Dados na Classificação e Seleção de Oncogenes Medidos por Microarray10.32635/2176-9745.RBC.2012v58n2.6250034-71162176-9745https://doaj.org/article/be1e7b237e9341578aa6dc287dbca5e52012-06-01T00:00:00Zhttps://rbc.inca.gov.br/revista/index.php/revista/article/view/625https://doaj.org/toc/0034-7116https://doaj.org/toc/2176-9745Introdução: Nas últimas décadas, o câncer ganhou uma dimensão maior, convertendo-se em um evidente problema de saúde pública mundial. A Organização Mundial da Saúde estimou que, no ano 2030, podem-se esperar 27 milhões de casos incidentes de câncer e 17 milhões de mortes por câncer. Frente a esse cenário alarmante, a mineração de dados traz métodos e ferramentas capazes de auxiliar na construção de conhecimentos mais incisivos sobre o câncer. Objetivo: Este trabalho tem por objetivo aplicar cinco métodos tradicionais da mineração de dados à base de dados NCI60, construída com dados oriundos de experimentos de microarray, com níveis de expressão de 1.000 genes agrupados em nove classes de câncer. Método: Foram utilizados neste trabalho os métodos J48, Random Forest, PART , IBK e Naive Bayes, pertencentes ao ambiente Weka, bem tradicionais na mineração de dados. Devido ao baixo número de registros para determinadas classes, utilizou-se, na validação dos resultados obtidos pelos classificadores, o 3-fold cross validation. Resultados: O classificador que obteve a melhor precisão foi o IBK, enquanto os classificadores J48 e PART conseguiram diminuir o conjunto de genes drasticamente, construindo conhecimento de alto nível na forma de árvores ou regras. Conclusão: Os resultados obtidos neste trabalho podem ser utilizados como ferramentas que visam a auxiliar no enfrentamento do câncer, podendo ser utilizadas na classificação de novos casos ou para se conhecer, cada vez mais, as relações gene/gene e gene/câncer. Fabrício Alves RodriguesLaurence Rodrigues do AmaralInstituto Nacional de Câncer José Alencar Gomes da Silva (INCA)articleBiologia ComputacionalExpressão GênicaMineração de DadosOncologiaBases de Dados como AssuntoNeoplasms. Tumors. Oncology. Including cancer and carcinogensRC254-282ENPTRevista Brasileira de Cancerologia, Vol 58, Iss 2 (2012)
institution DOAJ
collection DOAJ
language EN
PT
topic Biologia Computacional
Expressão Gênica
Mineração de Dados
Oncologia
Bases de Dados como Assunto
Neoplasms. Tumors. Oncology. Including cancer and carcinogens
RC254-282
spellingShingle Biologia Computacional
Expressão Gênica
Mineração de Dados
Oncologia
Bases de Dados como Assunto
Neoplasms. Tumors. Oncology. Including cancer and carcinogens
RC254-282
Fabrício Alves Rodrigues
Laurence Rodrigues do Amaral
Aplicação de Métodos Computacionais de Mineração de Dados na Classificação e Seleção de Oncogenes Medidos por Microarray
description Introdução: Nas últimas décadas, o câncer ganhou uma dimensão maior, convertendo-se em um evidente problema de saúde pública mundial. A Organização Mundial da Saúde estimou que, no ano 2030, podem-se esperar 27 milhões de casos incidentes de câncer e 17 milhões de mortes por câncer. Frente a esse cenário alarmante, a mineração de dados traz métodos e ferramentas capazes de auxiliar na construção de conhecimentos mais incisivos sobre o câncer. Objetivo: Este trabalho tem por objetivo aplicar cinco métodos tradicionais da mineração de dados à base de dados NCI60, construída com dados oriundos de experimentos de microarray, com níveis de expressão de 1.000 genes agrupados em nove classes de câncer. Método: Foram utilizados neste trabalho os métodos J48, Random Forest, PART , IBK e Naive Bayes, pertencentes ao ambiente Weka, bem tradicionais na mineração de dados. Devido ao baixo número de registros para determinadas classes, utilizou-se, na validação dos resultados obtidos pelos classificadores, o 3-fold cross validation. Resultados: O classificador que obteve a melhor precisão foi o IBK, enquanto os classificadores J48 e PART conseguiram diminuir o conjunto de genes drasticamente, construindo conhecimento de alto nível na forma de árvores ou regras. Conclusão: Os resultados obtidos neste trabalho podem ser utilizados como ferramentas que visam a auxiliar no enfrentamento do câncer, podendo ser utilizadas na classificação de novos casos ou para se conhecer, cada vez mais, as relações gene/gene e gene/câncer.
format article
author Fabrício Alves Rodrigues
Laurence Rodrigues do Amaral
author_facet Fabrício Alves Rodrigues
Laurence Rodrigues do Amaral
author_sort Fabrício Alves Rodrigues
title Aplicação de Métodos Computacionais de Mineração de Dados na Classificação e Seleção de Oncogenes Medidos por Microarray
title_short Aplicação de Métodos Computacionais de Mineração de Dados na Classificação e Seleção de Oncogenes Medidos por Microarray
title_full Aplicação de Métodos Computacionais de Mineração de Dados na Classificação e Seleção de Oncogenes Medidos por Microarray
title_fullStr Aplicação de Métodos Computacionais de Mineração de Dados na Classificação e Seleção de Oncogenes Medidos por Microarray
title_full_unstemmed Aplicação de Métodos Computacionais de Mineração de Dados na Classificação e Seleção de Oncogenes Medidos por Microarray
title_sort aplicação de métodos computacionais de mineração de dados na classificação e seleção de oncogenes medidos por microarray
publisher Instituto Nacional de Câncer José Alencar Gomes da Silva (INCA)
publishDate 2012
url https://doaj.org/article/be1e7b237e9341578aa6dc287dbca5e5
work_keys_str_mv AT fabricioalvesrodrigues aplicacaodemetodoscomputacionaisdemineracaodedadosnaclassificacaoeselecaodeoncogenesmedidospormicroarray
AT laurencerodriguesdoamaral aplicacaodemetodoscomputacionaisdemineracaodedadosnaclassificacaoeselecaodeoncogenesmedidospormicroarray
_version_ 1718407069095165952