A Mineração de dados utilizando a álgebra linear
Por: larissavalentini • 15/11/2017 • Trabalho acadêmico • 632 Palavras (3 Páginas) • 601 Visualizações
UFMG – Universidade Federal de Minas Gerais[pic 1]
[pic 2]
ENGENHARIA CIVIL
Aluno: Larissa Valentini
Matrícula: 2014014102
Mineração de dados utilizando a álgebra linear
Professor: Marcos Augusto dos Santos
Problema: Wine
[pic 3]
Belo Horizonte
2014
- Introdução:
O vinho é uma bebida obtida genericamente pela fermentação alcoólica do sumo da uva, feita por vários tipos de leveduras que consomem os açúcares da fruta e os transformam em álcool. Os diversos processos de obtenção do vinho (fermentação parcial, total; uvas inteiras ou esmagadas; etc) remetem a uma grande diversidade de amostras da bebida.
Dessa forma, o vinho pode ser classificado por diversos critérios como aroma, cor, sabor, textura e teor alcoólico. Pode ser dividido também em dois grupos: o tinto e o branco, nos quais os vinhos tintos são feitos de uvas mais escuras e são considerado mais saudáveis do que os brancos.
Ao analisar o vinho quimicamente é possível identificar uma série de características essenciais para a sua classificação. Diante disso, o problema Wine traz a análise química de 178 tipos de vinhos de três culturas distintas de uma determinada região da Itália. As categorias estabelecidas para obter os dados para essa análise foram:
1) Álcool
2)Acidez
3)Ash
4) Alcalinidade
5)Magnésio
6) Antioxidante
7) Flavonoides
8) antocianinas
9) Proantocianidinas
10) Intensidade da cor
11) Aroma
12) OD280/OD315 diluídos no vinho
13) Prolina (aminoácido)
Utilizando os dados dessa análise química é possível determinar a origem dos vinhos, uma vez que cada cultivo possui determinadas características que serão associadas à bebida em questão. Para isso usamos o conceito de Mineração de Dados, que usando análise matemática de uma grande quantidade de informações, determina padrões e tendências que permitem regras de associação ou sequências temporais, detectando relação entre as variáveis. Dessa forma, é possível separar, a partir de suas características, os 178 vinhos computados de acordo com suas respectivas culturas.
- Entrada e Saída:
A entrada desses dados exige uma matriz de 178x14, sendo que as colunas representam as informações da análise química (itens especificados acima) e as linhas os 178 vinhos do problema. A mineração de dados no matlab, entretanto, produz como saída dois gráficos, sendo que o primeiro consiste na redução de posto e o segundo em um gráfico de dispersão que consiste em 3 conjuntos diferentes de pontos, representando os três cultivos procurados.
- Metodologia:
Os vinhos podem ser divididos entre os três cultivos a partir do método de decomposição por valores singulares, que consiste na redução de posto, de acordo com o seguinte comando (sendo que U e V são matrizes ortogonais e S é uma matriz diagonal - com seus elementos de forma decrescente):
...