Classificando Vinhos Baseado em Suas Características
Por: Isaías Gonçalves Ribeiro • 1/9/2019 • Trabalho acadêmico • 881 Palavras (4 Páginas) • 131 Visualizações
[pic 1]
Classificando vinhos baseado em suas características
João Paulo Barbosa Pena, Isaías Gonçalves Ribeiro
Ciências da Computação
LAVRAS
2018
1. INTRODUÇÃO
Este trabalho olhou para um problema bem conhecido visando classificação
de vinhos tintos (1599) e vinhos brancos (4898), foram classificados em 7 classes (pontuação de vinho que varia de 3 a 9), com base na sua qualidade e as suas 11 características físico-químicas, dando 6497 vinhos de amostras no total. Este relatório apresenta uma investigação sobre uma rede neural em busca de encontrar a maior precisão, enquanto classifica os vinhos.
[pic 2]
Figura 1 - Histograma dos dados de vinho vermelho e branco
Tabela 1 - Entrada
Nome do recurso | Significância | Min std | Max |
Tipo do vinho | 0,75 | 0,42 0,00 | 1 |
Acidez fixo | 7,22 | 1,30 3,80 | 15.90 |
Acidez volátil | 0,34 | 0,16 0,08 | 1,58 |
Ácido cítrico | 0,32 | 0,15 0,00 | 1,66 |
Açúcar Residual | 5,44 | 4,76 0,60 | 65,8 |
Açúcar Residual | 0,06 | 0,04 0,01 | 0,61 |
Dióxido de enxofre livre | 30,53 | 17,75 1,00 | 289 |
Total de Dióxido de Enxofre | 115,74 | 56,52 6,00 | 440 |
Densidade | 0.99 | 0,00 0,99 | 1,04 |
ph | 3,22 | 0,16 2,72 | 4,01 |
Sulfatos | 0,53 | 0,15 0,22 | 2 |
Álcool | 10,49 | 1,19 8,00 | 14,9 |
2. OBJETIVO
O objetivo deste trabalho é criar uma RNA capaz de qualificar por notas de 3 a 9 vinhos por suas características físico químicas
3. ESTUDO DE CASO
No cenário mundial a RNA vem proporcionando um avanço significativo para a humanidade o que diz respeito à facilitação de uma série de atividades. Com tudo sempre visamos a tar aperfeiçoando as ferramentas já existentes. Seguindo esse pensamento decidimos fazer um estudo sobre classificação de dados, nesse artigo fizemos classificação de vinhos vermelhos e brancos.
A implementação seria no auxílio da classificação de vinhos utilizando características físico químico de tal.
Classificação de dados tem sido estudado por anos pois apresenta uma vasta aplicabilidade, como prever algo que pode acontecer, por exemplo.
4. METODOLOGIA
Tal trabalho foi feito utilizando o linguagem de programação Python, foi utilizada a biblioteca Tensorflow. Os dados tiveram que ser mudados para ser compatível com a função softmax na última camada.
Foi definido um número de neurônios para ter uma precisão nas regiões não lineares, também um número de camadas ocultas e foi definido uma função ativação.
[pic 3]Figura 2 - Molde de um Rede Neural MLP
5. DISCUSSÃO E RESULTADOS
5.1 Número de Neurônios
Baseado na complexidade da classificação, não era esperado mais de 100 neurônios. Daí começamos com 12-7-7 (12 neurônios na camada de entrada, 7 neurônio na camada oculta e 7 neurônio na camada de saída) com modelo 7, 10, 20, 40, 80, 100 neurônios na camada escondida, com taxa de aprendizagem 0,001, 5 épocas e um tamanho de 256 amostra e uma função de ativação na camada oculta foi a Relu onde [pic 4]. Foi utilizado Dropout para forçar os neurônios serem auto suficiente e desenvolver suas próprias características distintas e espaciais.
Tabela 2 - Número de neurônios que afetam a precisão de validação
Neurônios | 7 | 10 | 20 | 40 | 80 | 100 |
Validação % | 49.0 | 50.5 | 51.2 | 51.5 | 52.9 | 51.3 |
[pic 5]
Figura 3 - Precisão de validação para N neurônios
Observando a figura 2 foi notado que 80 neurônios obtivemos melhor resultado de validação, então foi decidido utilizar 80 neurônios.
5.2 Número de Camadas Ocultas
Aumentando o número de camadas ocultas espera-se que obtenha melhor resultado, porém curiosamente no nosso caso, não melhorou, apenas piorou, como mostra a tabela a seguir.
...