Comparação de Algoritmos de Classificação
Por: Diogo Cabral • 1/7/2016 • Trabalho acadêmico • 550 Palavras (3 Páginas) • 245 Visualizações
Universidade Federal de Alagoas – Campus Arapiraca[pic 1]
Aprendizagem de Máquina
Diogo Cabral da Silva
Comparação entre métodos de classificação
Conjunto de dados
O conjunto de dados usado nessa comparação contém informações biomecânicas de pacientes ortopédicos usados para caracterizar pacientes com duas doenças da coluna vertebral.
Os atributos coletados correspondem as seguintes características biomecânicas:
- Incidência pélvica;
- Inclinação pélvica;
- Ângulo de lordose lombar;
- Inclinação sacral;
- Raio pélvico;
- Grau de espondilolistese.
Esses atributos são usados para caracterizar as seguintes anomalias da coluna vertebral:
- Hérnia de disco;
- Espondilolistese;
Foram coletados 300 casos ao total, onde 240 foram usados para o conjunto de treinamento e 60 para o conjunto de teste. O conjunto total está divido em 100 casos para cada uma das anomalias e 100 casos normais.
KNN (K-Nearest Neighbor)
Um dos algoritmos de classificação mais simples, classifica objetos com base em exemplos de treinamento que estão mais próximos no espaço de características. Para o KNN vamos definir os parâmetros a seguir:
- Métrica para calcular a distância:
- Usaremos a distância euclidiana para calcular.
- Definir o valor de K:
- Por ser um conjunto de dados pequeno, usaremos valores de K variando de 1 a 13.
Testes:
[pic 2][pic 3][pic 4][pic 5][pic 6][pic 7][pic 8][pic 9][pic 10][pic 11][pic 12][pic 13][pic 14]
Considerações:
O gráfico a seguir revela que a taxa de acerto maior, para o conjunto de dados proposto foi com K = 1.
[pic 15]
Árvore de decisão:
A classificação por árvore de decisão é um método indutivo que utiliza uma árvore binária ou de múltiplos caminhos usando suas folhas como decisões finais.
Testes:
Para a árvore de decisão, obtivemos o seguinte resultado para o conjunto de dados proposto:
[pic 16]
É possível observar pela matriz de dispersão acima que apenas 43 casos foram classificados corretamente, alcançando uma acurácia de 71.6667% (o mesmo valor obtido pelo KNN com K = 5).
A árvore de decisão formada pelo classificador é a seguinte:
Observa-se pela árvore acima, que houve poda na árvore.
[pic 17]
Rede Neural Artificial – Multilayer Perceptron (MLP)
MLP é um algoritmo que mapeia conjuntos de entradas de dados em conjuntos de saídas de dados em uma rede neural artificial, onde duas camadas são definidas por padrão, camada de entrada e camada de saída.
...