Atividade Mineração de Dados
Por: Gaspar Compras • 28/3/2019 • Trabalho acadêmico • 438 Palavras (2 Páginas) • 149 Visualizações
[pic 1]
Universidade Estadual do Tocantins- Unitins
Sistemas de Informação, 6º Período,
Disciplina: Mineração de Dados
Professor: Marco Firmino
Acadêmico: Carlesandro Gaspar
Atividade avaliativa
Data set: Cervical cancer (Risk Factors)
Site: https://archive.ics.uci.edu/ml/datasets/Cervical+cancer+%28Risk+Factors%29
Para cada questão a seguir, apresente um texto descritivo sobre seu procedimento para resolver o problema, o script utilizado e a saída obtida (gráfico, tabela, valor).
Considerando o data set fornecido, que tipo de mineração julga apropriada?
Foi utilizado o modelo SVM (0.97863247...), devido A necessidade de analisar as colunas e verificar a compatibilidade entre a Coluna Exame com as demais após análise de critérios. Além do que no modelo Naves Bayes foi obtido o resultado de Taxa de acerto de 0.96168582..., ou seja, uma taxa de acerto inferior, conforme imagem.
[pic 2]
Após analisar o data set, qual campo pretende utilizar como saída (class) e qual é sua hipótese?
Schiller devido ser um exame especifico para descoberta de câncer de útero, neste caso o objeto em analise são os fatores de risco e fazendo a junção destes riscos e tendo o exame feito de forma singular a tal problema, nota-se um grau de relevância alto.
Qual procedimento foi adotado para separar a base de treino e teste?
Foi adotado a porcentagem de 70% para realização do Treino da análise e 30% para Teste do referida tabela de 858 linhas.
[pic 3]
Quais campos são apropriados para entrada na mineração realizada? Justifique a escolha e associe com a hipótese.
Foi realizado um teste de compatibilidade da Coluna Exame em relação a todas as colunas da tabela diagnostico, conforme demonstra imagem, utilizando o comando:
random.forest.importance(Exame ~ . , diagnostico) |
[pic 4]
Nisto percebe-se que alguns campos não demonstram importância quando comparadas com a coluna Exame, o critério utilizado foi descartar as comparações com valores negativos.
Como exemplo a comparação da coluna Exame com a coluna Fuma..anos que tem valor de -3,65... ,isso significa que o fato da pessoa fumar em quantidade de anos não tem relação o resultado final do exame Schiller.
Em contraparte, utilizou-se para criação dos modelos os demais Campos, conforme o camando:
modelo = svm(Exame ~ Idade+primeira.relacao.sexual..idade.+Contraceptivos.Hormonais+DIU.years+DSTs..numero.+DST..condilomatose+DST..condilomatose.cervical+DSTs..condilomatose.vaginal+DST..condilomatose.vulvo.perineal+DSTs..sifilis+DSTs..doenÃ.a.inflamatoria.pelvica+DSTs..herpes.genital+STDs.AIDS+STDs.Hepatitis.B+STDs.HPV+Dx.Cancer+Dx.CIN+Hinselmann+Citology+Biopsy, diagnosticoTreino) |
...