Aplicação de Métodos Computacionais de Mineração de Dados na Classificação e Seleção de Oncogenes Medidos por Microarray

Introdução: Nas últimas décadas, o câncer ganhou uma dimensão maior, convertendo-se em um evidente problema de saúde pública mundial. A Organização Mundial da Saúde estimou que, no ano 2030, podem-se esperar 27 milhões de casos incidentes de câncer e 17 milhões de mortes por câncer. Frente a esse ce...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Fabrício Alves Rodrigues, Laurence Rodrigues do Amaral
Formato: article
Lenguaje:EN
PT
Publicado: Instituto Nacional de Câncer José Alencar Gomes da Silva (INCA) 2012
Materias:
Acceso en línea:https://doaj.org/article/be1e7b237e9341578aa6dc287dbca5e5
Etiquetas: Agregar Etiqueta
Sin Etiquetas, Sea el primero en etiquetar este registro!
Descripción
Sumario:Introdução: Nas últimas décadas, o câncer ganhou uma dimensão maior, convertendo-se em um evidente problema de saúde pública mundial. A Organização Mundial da Saúde estimou que, no ano 2030, podem-se esperar 27 milhões de casos incidentes de câncer e 17 milhões de mortes por câncer. Frente a esse cenário alarmante, a mineração de dados traz métodos e ferramentas capazes de auxiliar na construção de conhecimentos mais incisivos sobre o câncer. Objetivo: Este trabalho tem por objetivo aplicar cinco métodos tradicionais da mineração de dados à base de dados NCI60, construída com dados oriundos de experimentos de microarray, com níveis de expressão de 1.000 genes agrupados em nove classes de câncer. Método: Foram utilizados neste trabalho os métodos J48, Random Forest, PART , IBK e Naive Bayes, pertencentes ao ambiente Weka, bem tradicionais na mineração de dados. Devido ao baixo número de registros para determinadas classes, utilizou-se, na validação dos resultados obtidos pelos classificadores, o 3-fold cross validation. Resultados: O classificador que obteve a melhor precisão foi o IBK, enquanto os classificadores J48 e PART conseguiram diminuir o conjunto de genes drasticamente, construindo conhecimento de alto nível na forma de árvores ou regras. Conclusão: Os resultados obtidos neste trabalho podem ser utilizados como ferramentas que visam a auxiliar no enfrentamento do câncer, podendo ser utilizadas na classificação de novos casos ou para se conhecer, cada vez mais, as relações gene/gene e gene/câncer.