Comparação de Algoritmos de Agrupamento
Por: Diogo Cabral • 1/7/2016 • Trabalho acadêmico • 1.093 Palavras (5 Páginas) • 284 Visualizações
Universidade Federal de Alagoas – Campus Arapiraca
Aprendizagem de Máquina
Diogo Cabral da Silva
Comparação entre métodos de agrupamento
Conjunto de dados
O conjunto de dados usado nessa comparação contém informações biomecânicas de pacientes ortopédicos usados para caracterizar pacientes com duas doenças da coluna vertebral.
Os atributos coletados correspondem as seguintes características biomecânicas:
Incidência pélvica;
Inclinação pélvica;
Ângulo de lordose lombar;
Inclinação sacral;
Raio pélvico;
Grau de espondilolistese.
Esses atributos são usados para caracterizar as seguintes anomalias da coluna vertebral:
Hérnia de disco;
Espondilolistese;
Foram coletados 310 casos ao total. O conjunto está divido em 100 casos Normais, 150 casos de Espondilolistese e 60 casos de Hérnia.
Algoritmo K-means (K-médias)
Algoritmo simples de aprendizagem não supervisionado para agrupamento (Clustering). Basicamente, usa a distância das instâncias para o centro gravitacional (Centroide) dos K grupos para determinar a pertinência da instância ao grupo.
Para os testes, determinaremos os seguintes parâmetros:
Usando a distância euclidiana para medir as distâncias entre os centroides;
Valores de K:
o 2
o 3
o 4
o 5
o 6
Resultados
Para K = 2:
Grupo Normal Espondilolistese Hérnia Total Grupo 0 1 0 89 90
Grupo 1
99
60
61
220
Para K = 3:
Classe Grupo 0 Grupo 1 Grupo 2 Normal 90 0 10
Espondilolistese
67
56
47 Hérnia 56 0 4
Para K = 4:
Classe Grupo 0 Grupo 1 Grupo 2 Grupo 3 Normal 0 88 12 0
Espondilolistese
41
8
73
28 Hérnia 0 53 7 0
0
20
40
60
80
100
120
Grupo 0Grupo 0Grupo 0Grupo 0Grupo 0Grupo 0
Grupo 1Grupo 1Grupo 1Grupo 1Grupo 1Grupo 1
Classes por grupoClasses por grupo Classes por grupo Classes por grupoClasses por grupo Classes por grupoClasses por grupo Classes por grupoClasses por grupo
NormalNormalNormal
EspondilolisteseEspondilolisteseEspondilolisteseEspondilolisteseEspondilolisteseEspondilolisteseEspondilolisteseEspondilolisteseEspondilolisteseEspondilolisteseEspondilolisteseEspondilolisteseEspondilolisteseEspondilolisteseEspondilolisteseEspondilolistese
HérniaHérniaHérnia HérniaHérnia
0
10
20
30
40
50
60
70
80
90
100
Grupo 0Grupo 0Grupo 0Grupo 0Grupo 0Grupo 0
Grupo 1Grupo 1Grupo 1Grupo 1Grupo 1Grupo 1
Grupo 2Grupo 2Grupo 2Grupo 2Grupo 2Grupo 2
Classes por grupoClasses por grupo Classes por grupoClasses por grupo Classes por grupo Classes por grupoClasses por grupo
NormalNormalNormal
EspondilolisteseEspondilolisteseEspondilolisteseEspondilolisteseEspondilolisteseEspondilolisteseEspondilolisteseEspondilolisteseEspondilolisteseEspondilolisteseEspondilolisteseEspondilolisteseEspondilolisteseEspondilolisteseEspondilolisteseEspondilolistese
HérniaHérniaHérnia HérniaHérnia
Para K = 5:
Classe Grupo 0 Grupo 1 Grupo 2 Grupo 3 Grupo 4 Normal 1 50 0 12 37
Espondilolistese
53
3
67
1
26 Hérnia 1 40 0 8 11
Para K = 6:
Classe Grupo 0 Grupo 1 Grupo 2 Grupo 3 Grupo 4 Grupo 5 Normal 0 37 0 52 11 0
Espondilolistese
50
1
18
7
29
45 Hérnia 0 32 4 24 0 0
0
10
20
30
40
50
60
70
80
90
100
Grupo 0Grupo 0Grupo 0Grupo 0Grupo 0Grupo 0
Grupo
...