Mineração De Dados: Uma Abordagem Conceitual
Ensaios: Mineração De Dados: Uma Abordagem Conceitual. Pesquise 862.000+ trabalhos acadêmicosPor: layanaheck • 8/11/2013 • 1.883 Palavras (8 Páginas) • 309 Visualizações
Abstract: The amount of data produced and stored is increasing daily and
Data Mining is highlighted as an intelligent technology and practice of
extracting information, and you can find a variety of studies on the subject.
The article aims to introduce basic concepts of this tool to interested parties
who are beginning their study of such. It presented some concepts about the
techniques involving the discovery of knowledge in large data sets, besides
mentioning the existence of specific software and some applications of this
tool.
Resumo: A quantidade de dados produzidos e armazenados tem aumentado
diariamente e a Mineração de dados é destacada como uma tecnologia
inteligente e prática de extração de informações, sendo possível encontrar
uma variedade de estudos sobre o tema. O artigo possui como objetivo
introduzir conceitos básicos dessa ferramenta a interessados que estão
iniciando o seu estudo sobre tal. É apresentado alguns conceitos sobre as
técnicas que envolvem a descoberta de conhecimento em grandes conjuntos
de dados, além de citar a existência de softwares específicos e algumas
aplicações dessa ferramenta.
1.Introdução
Na atualidade o volume de dados produzidos e armazenados pelos diversos sistemas de
computação tem aumentado expressivamente. Estima-se que a quantidade de
informação no mundo dobra a cada 20 meses e que o tamanho e a quantidade dos
bancos de dados crescem com velocidade ainda maior. É necessário ter ferramentas que
facilitem a análise desses dados de forma inteligente e prática, possibilitando
transformar terabytes em conhecimento. As informações de grande valia estão
implícitas em um grande número de informações e não são facilmente encontradas
utilizando os sistemas convencionais, surgindo a Mineração de dados.
A mineração de dados é uma tecnologia que abrange três áreas: estatística
clássica, inteligência artificial e aprendizado de máquina. Tal ferramenta permite a
extração não trivial de conhecimento previamente desconhecido e potencialmente útil
de um banco dados.
O presente artigo tem como finalidade apresentar conceitos sobre as principais
técnicas que envolvem a descoberta de conhecimento em grandes conjuntos de dados e
descrever algumas características da mineração de dados. Além disso, suas técnicas e as
metodologias estatísticas que as fundamentam.
2. Desenvolvimento
Considere-se que se algum significado especial é atribuído a um dado, ele se transforma
em uma informação (ou fato). Se uma norma é elaborada, a interpretação do confronto
entre o fato e a regra constitui um conhecimento. Como o processo KDD é constituído
de várias etapas que são executadas de forma interativa e iterativa, as etapas são
interativas porque envolvem a cooperação da pessoa responsável pela análise de dados
(conhecimento prévio do domínio orientará a execução do processo). Por outro lado, a
iteração é em decorrência de que, em muitas vezes, esse processo não é executado de
forma sequencial, mas envolve repetidas seleções de parâmetros e conjunto de dados,
como aplicações das técnicas de Mineração de Dados (Data Mining) e posterior análise
dos resultados obtidos. Dessa forma, um resultado mais refinado pode ser extraído,
apresentando maior coerência e confiabilidade.
A Mineração de Dados tem início com o entendimento do domínio da aplicação
e dos objetivos a serem atingidos. Após, há um agrupamento de todos os dados
necessários para alcançar um objetivo específico. Como em toda análise quantitativa, a
qualidade dos dados é essencial para a obtenção de resultados confiáveis. Dessa forma,
dados limpos e compreensíveis são imprescindíveis para o sucesso do Data Mining. A
fim de se assegurar tais objetivos, a limpeza dos dados (Data Cleaning) é realizada por
meio de um pré-processamento. Devido sua grande importância para o processo de
mineração de dados essa etapa pode tomar até 80% do tempo necessário para todo o
processo, devido às dificuldades na integração de bases de dados distintas. Os dados
pré-processados devem passar por outra transformação, que os armazena
adequadamente, visando facilitar o uso das técnicas de Data Mining. Nessa fase, o uso
de Data Warehouses é bastante utilizado. Esse processo é definido utilização de um
depósito central de dados, extraído de dados operacionais, em que a informação é
orientada a assuntos de natureza histórica. Devido a essas características, Data
Warehouses tendem a se tornar grandes fonte de dados extremamente organizados,
facilitando a aplicação do Data Mining. Após essa etapa é que se chega especificamente
à
...