Aplicação de Métodos Computacionais de Mineração de Dados na Classificação e Seleção de Oncogenes Medidos por Microarray
Introdução: Nas últimas décadas, o câncer ganhou uma dimensão maior, convertendo-se em um evidente problema de saúde pública mundial. A Organização Mundial da Saúde estimou que, no ano 2030, podem-se esperar 27 milhões de casos incidentes de câncer e 17 milhões de mortes por câncer. Frente a esse ce...
Guardado en:
Autores principales: | , |
---|---|
Formato: | article |
Lenguaje: | EN PT |
Publicado: |
Instituto Nacional de Câncer José Alencar Gomes da Silva (INCA)
2012
|
Materias: | |
Acceso en línea: | https://doaj.org/article/be1e7b237e9341578aa6dc287dbca5e5 |
Etiquetas: |
Agregar Etiqueta
Sin Etiquetas, Sea el primero en etiquetar este registro!
|
id |
oai:doaj.org-article:be1e7b237e9341578aa6dc287dbca5e5 |
---|---|
record_format |
dspace |
spelling |
oai:doaj.org-article:be1e7b237e9341578aa6dc287dbca5e52021-11-29T20:14:30ZAplicação de Métodos Computacionais de Mineração de Dados na Classificação e Seleção de Oncogenes Medidos por Microarray10.32635/2176-9745.RBC.2012v58n2.6250034-71162176-9745https://doaj.org/article/be1e7b237e9341578aa6dc287dbca5e52012-06-01T00:00:00Zhttps://rbc.inca.gov.br/revista/index.php/revista/article/view/625https://doaj.org/toc/0034-7116https://doaj.org/toc/2176-9745Introdução: Nas últimas décadas, o câncer ganhou uma dimensão maior, convertendo-se em um evidente problema de saúde pública mundial. A Organização Mundial da Saúde estimou que, no ano 2030, podem-se esperar 27 milhões de casos incidentes de câncer e 17 milhões de mortes por câncer. Frente a esse cenário alarmante, a mineração de dados traz métodos e ferramentas capazes de auxiliar na construção de conhecimentos mais incisivos sobre o câncer. Objetivo: Este trabalho tem por objetivo aplicar cinco métodos tradicionais da mineração de dados à base de dados NCI60, construída com dados oriundos de experimentos de microarray, com níveis de expressão de 1.000 genes agrupados em nove classes de câncer. Método: Foram utilizados neste trabalho os métodos J48, Random Forest, PART , IBK e Naive Bayes, pertencentes ao ambiente Weka, bem tradicionais na mineração de dados. Devido ao baixo número de registros para determinadas classes, utilizou-se, na validação dos resultados obtidos pelos classificadores, o 3-fold cross validation. Resultados: O classificador que obteve a melhor precisão foi o IBK, enquanto os classificadores J48 e PART conseguiram diminuir o conjunto de genes drasticamente, construindo conhecimento de alto nível na forma de árvores ou regras. Conclusão: Os resultados obtidos neste trabalho podem ser utilizados como ferramentas que visam a auxiliar no enfrentamento do câncer, podendo ser utilizadas na classificação de novos casos ou para se conhecer, cada vez mais, as relações gene/gene e gene/câncer. Fabrício Alves RodriguesLaurence Rodrigues do AmaralInstituto Nacional de Câncer José Alencar Gomes da Silva (INCA)articleBiologia ComputacionalExpressão GênicaMineração de DadosOncologiaBases de Dados como AssuntoNeoplasms. Tumors. Oncology. Including cancer and carcinogensRC254-282ENPTRevista Brasileira de Cancerologia, Vol 58, Iss 2 (2012) |
institution |
DOAJ |
collection |
DOAJ |
language |
EN PT |
topic |
Biologia Computacional Expressão Gênica Mineração de Dados Oncologia Bases de Dados como Assunto Neoplasms. Tumors. Oncology. Including cancer and carcinogens RC254-282 |
spellingShingle |
Biologia Computacional Expressão Gênica Mineração de Dados Oncologia Bases de Dados como Assunto Neoplasms. Tumors. Oncology. Including cancer and carcinogens RC254-282 Fabrício Alves Rodrigues Laurence Rodrigues do Amaral Aplicação de Métodos Computacionais de Mineração de Dados na Classificação e Seleção de Oncogenes Medidos por Microarray |
description |
Introdução: Nas últimas décadas, o câncer ganhou uma dimensão maior, convertendo-se em um evidente problema de saúde pública mundial. A Organização Mundial da Saúde estimou que, no ano 2030, podem-se esperar 27 milhões de casos incidentes de câncer e 17 milhões de mortes por câncer. Frente a esse cenário alarmante, a mineração de dados traz métodos e ferramentas capazes de auxiliar na construção de conhecimentos mais incisivos sobre o câncer. Objetivo: Este trabalho tem por objetivo aplicar cinco métodos tradicionais da mineração de dados à base de dados NCI60, construída com dados oriundos de experimentos de microarray, com níveis de expressão de 1.000 genes agrupados em nove classes de câncer. Método: Foram utilizados neste trabalho os métodos J48, Random Forest, PART , IBK e Naive Bayes, pertencentes ao ambiente Weka, bem tradicionais na mineração de dados. Devido ao baixo número de registros para determinadas classes, utilizou-se, na validação dos resultados obtidos pelos classificadores, o 3-fold cross validation. Resultados: O classificador que obteve a melhor precisão foi o IBK, enquanto os classificadores J48 e PART conseguiram diminuir o conjunto de genes drasticamente, construindo conhecimento de alto nível na forma de árvores ou regras. Conclusão: Os resultados obtidos neste trabalho podem ser utilizados como ferramentas que visam a auxiliar no enfrentamento do câncer, podendo ser utilizadas na classificação de novos casos ou para se conhecer, cada vez mais, as relações gene/gene e gene/câncer.
|
format |
article |
author |
Fabrício Alves Rodrigues Laurence Rodrigues do Amaral |
author_facet |
Fabrício Alves Rodrigues Laurence Rodrigues do Amaral |
author_sort |
Fabrício Alves Rodrigues |
title |
Aplicação de Métodos Computacionais de Mineração de Dados na Classificação e Seleção de Oncogenes Medidos por Microarray |
title_short |
Aplicação de Métodos Computacionais de Mineração de Dados na Classificação e Seleção de Oncogenes Medidos por Microarray |
title_full |
Aplicação de Métodos Computacionais de Mineração de Dados na Classificação e Seleção de Oncogenes Medidos por Microarray |
title_fullStr |
Aplicação de Métodos Computacionais de Mineração de Dados na Classificação e Seleção de Oncogenes Medidos por Microarray |
title_full_unstemmed |
Aplicação de Métodos Computacionais de Mineração de Dados na Classificação e Seleção de Oncogenes Medidos por Microarray |
title_sort |
aplicação de métodos computacionais de mineração de dados na classificação e seleção de oncogenes medidos por microarray |
publisher |
Instituto Nacional de Câncer José Alencar Gomes da Silva (INCA) |
publishDate |
2012 |
url |
https://doaj.org/article/be1e7b237e9341578aa6dc287dbca5e5 |
work_keys_str_mv |
AT fabricioalvesrodrigues aplicacaodemetodoscomputacionaisdemineracaodedadosnaclassificacaoeselecaodeoncogenesmedidospormicroarray AT laurencerodriguesdoamaral aplicacaodemetodoscomputacionaisdemineracaodedadosnaclassificacaoeselecaodeoncogenesmedidospormicroarray |
_version_ |
1718407069095165952 |