A Inteligência Artificial
Por: Allan Santana • 19/11/2021 • Trabalho acadêmico • 1.965 Palavras (8 Páginas) • 118 Visualizações
[pic 1][pic 2]
CURSO DE ENGENHARIA DE COMPUTAÇÃO
INTELIGÊNCIA ARTIFICIAL
2020
CENTRO UNIVERSITÁRIO CARIOCA
Curso de Engenharia da Computação
Relatório dos Experimentos com o naive bayesian learning, árvores de decisão e redes neurais
Aluno: Allan Vieira de Santana
Matrícula: 2017103203
Rio de Janeiro 2020
ALLAN VIEIRA DE SANTANA
Relatório dos Experimentos com o naive bayesian learning, árvores de decisão e redes neurais
Relatório apresentado como 2ª avaliação da disciplina de Inteligência Artificial do Curso de Engenharia da Computação do Centro Universitário Carioca
Professora: Daisy Cristine Albuquerque Silva
Período: 8°
Rio de Janeiro 2020
SUMÁRIO
- Introdução 3
- Descrição do problema e Base de dados 4
- Descrição da base de dados 4
- Divisão da base de dados 4
- Pré-processamento 5
- Experimentos 5
- Naive Bayesian Learning 5
- Experimento com árvores de decisão 9
- Redes Neurais.................................................................................................11
- Análise comparativa 14
- Árvores de Decisão e Naive Bayesian Learning..............................................14
- Árvores de Decisão e Redes Neurais..............................................................14
- Naive Bayesian learning e Redes Neurais.......................................................15
- Conclusão.........................................................................................................15
- Sugestões para melhoria dos experimentos...........................................................16
- Referências bibliográficas........................................................................................16
- Apresentação do Trabalho Acadêmico....................................................................16
3
Introdução
A ferramenta WEKA será a ferramenta utilizada no trabalho para realizar a medição de acurácia realizando experimentos com Naive Bayesian Learning, árvores de decisão e redes neurais, onde o programa tentará adivinhar qual é a letra de acordo com as variáveis numéricas que são passadas para o programa. De acordo com os resultados obtidos, levando em conta a porcentagem de acertos conseguiremos medir a acurácia, que seria a proximidade entre o valor obtido experimentalmente e o valor verdadeiro na medição.
4
Descrição do problema e Base de Dados
Inicialmente foi disponibilizada uma base de dados que tinha a letra e as variáveis numéricas (que faziam parte da composição daquela letra), devemos usar o WEKA para avaliar através de qual algoritmo e com quais parâmetros vamos obter um índice de acertos de forma mais satisfatória.
Descrição da base de dados
A base de dados contém 2 arquivos importantes para o andamento do nosso exercício, um é o arquivo .names que contem o nome das variáveis que estão contidas no arquivo .data, esse último com vinte mil registros com 17 atributos cada um.
- Divisão da base de dados
Para resolução do problema proposto inicialmente foi verificado a base de dados que foi disponibilizada no AVA de modo que ela possa ser aceita pelo WEKA, ou seja, um arquivo com extensão .arff e que tenha a formatação adequada como mostra na figura abaixo:
[pic 3]
5
Como podemos perceber temos dezessete variáveis declaradas (as variáveis receberam os nomes sugeridos no arquivo .names) , onde uma delas é do tipo nominal e as demais do tipo numérico. O restante do arquivo – após “@DATA” – é igual ao arquivo .data que foi disponibilizado, que é salvo como .arff (formato aceito pelo WEKA, como já mencionado).
- Pré-processamento
A aceitação dos dados ocorre de maneira rápida, onde pude encontrar um pouco de dificuldade apenas pelo fato da variável lettr precisar ser do tipo nominal, o WEKA tem a funcionalidade “stringtonominal”, que particularmente não consegui implementar, mas da maneira como foi apresentado ( um vetor que mostra caracteres do tipo nominal que são aceitos), dessa forma o WEKA aceitou nossa base de dados e sendo assim foi possível trabalhar com ela.
- Experimentos
- Naive Bayesian Learning
Com o referido modelo implementamos de forma simples e rápida todos os treinamentos propostos, no entanto não encontramos um modelo que acerte com uma precisão tão elevada.
- Metodologia de treinamento (valores dos parâmetros)
Utilizamos para todos os canários 10-fold cross validation. E os Para os parâmetros do algoritmo, foi utilizado 3 configurações distintas, que foram:
(useKernelEstimator=false e useSupervisedDiscretization=false);
(useKernelEstimator=true e useSupervisedDiscretization=false);
(useKernelEstimator=false e useSupervisedDiscretization=true).
- Resultados obtidos
No Primeiro teste, isso é com (useKernelEstimator=false e useSupervisedDiscretization=false) obtivemos o seguinte resultado:
6
[pic 4]
O que nos mostra que rapidamente tivemos uma resposta, entretanto o índice de acertos foi de apenas 64%, que podemos considerar uma taxa baixa.
...