A MINERAÇÃO DE DADOS
Por: zatt1 • 4/5/2017 • Trabalho acadêmico • 600 Palavras (3 Páginas) • 164 Visualizações
[pic 1]
UNIVERSIDADE DO SUL DE SANTA CATARINA
Sistema de apoio a decisão:
Mineração de dados
Tubarão
2015
introdução A MINERAÇÃO DE DADOS
Atualmente os dados vêm sendo armazenados em grandes quantidades, formando volumes imensos de dados. Sua extração é uma tarefa que pode gerar um pouco de dificuldade para os analistas, se não forem usadas as ferramentas certas. O conjunto dessas ferramentas e teorias, pertence a um grupo chamado, DCBD. Esse grupo se preocupa com o mapeamento de dados brutos, genéricos, ou uteis, que possui em seu meio, aplicações e técnicas para identificação e extração dos dados.
Essas Técnicas são conhecidas como mineração de dados, por identificarem padrões e valores relevantes para a empresa, ou seja, caçar as informações, por meio de uma busca fina ao dado bruto. Um dos softwares responsável por essa mineração, é o WEKA, um software gratuito que pode ser usado para mineras seus próprios dados e transformar o conhecimento sobre seus clientes, ou seu negócio em informações uteis para aumentar suas vendas entre outros.
2 KDD
- Knowledge Discovery Database (Descoberta de Conhecimento em Base de Dados ) é o processo de transformação de dados em conhecimento.
É empregado para descrever todo o processo de extração de conhecimentos dos dados, e possui varias etapas interligadas como: seleção, pré-processamento, transformação, Data-Mining e interpretação enquanto que data mining é empregado somente para o estagio de descoberta do processo de KDD.
- O objetivo fundamental do KDD é descobrir conhecimento útil, válido, relevante e novo sobre uma determinada atividade através de algoritmos, tendo em conta as ordens de magnitude crescente nos dados.
- Etapas
- Seleção: Seleção ou segmentação dos dados apropriados para a análise de acordo com algum critério. (Exemplos: Todas as pessoas que possuem carro.);
- Pré-processamento e Limpeza: Estágio de limpeza dos dados, Reconfiguração dos dados para assegurar formatos consistentes;
- Transformação dos Dados: Padronizar os dados para suprir limitações das técnicas de Mineração de dados, disponibilizar os dados de maneira usável e navegável;
- Data Mining: Aplica-se técnicas e algoritmos para descobrir novos conhecimentos, oriundas de diversas áreas: Aprendizado de Máquina, Estatística, Redes Neurais, Banco de Dados, etc;
- Interpretação e Avaliação: Interpretar o conhecimento extraído através de ferramentas estatísticas e de visualização;
3 Experimento
O problema é composto pelas seguintes variáveis:
- Status do Aluno (Passou, Recuperação, Reprovado);
- Aproveitamento (Ótimo, Bom, Regular, Ruim );
- Bom Comportamento (true, false);
- Reunião dos Pais (yes, no).
[pic 2]
Resultados:
- Os pais dos alunos que ficaram em recuperação foram a reunião de pais, com 100% de confiança;
- Dos alunos reprovados, em que os pais compareceram as reuniões, não possuem bom comportamento;
- Os alunos com aproveitamento ruim acabaram reprovando, com 100% de confiança;
- Dos alunos reprovados que não possuem bom comportamento, 100% dos pais comparecem a reunião;
- Todos os alunos com aproveitamento ruim, possuem comportamento ruim;
- Todos os alunos com comportamento ruim, tiveram os pais presentes nas reuniões;
- Se o aluno não tem bom comportamento e seus pais não foram na reunião, ele passou com 100% de confiança;
- Se o aluno tem bom comportamento e seus pais não foram na reunião, ele passou com 100% de confiança;
- Todos os alunos com aproveitamento Regular que ficaram em recuperação, os pais estiveram presentes nas reuniões.
conclusão
Destaca-se Data Mining como parte de um processo maior, denominado KDD, e que se refere ao meio pelo qual padrões são extraídos e enumerados a partir dos dados. O uso dessas técnicas proporciona meios para encontrar informações que permitam detectar tendências e características até então desconhecidas, reagir rapidamente a um evento que ainda pode estar por vir, entre outras coisas.
...