TrabalhosGratuitos.com - Trabalhos, Monografias, Artigos, Exames, Resumos de livros, Dissertações
Pesquisar

Data Mining No Contexto Esportivo

Trabalho Universitário: Data Mining No Contexto Esportivo. Pesquise 862.000+ trabalhos acadêmicos

Por:   •  10/5/2014  •  3.045 Palavras (13 Páginas)  •  696 Visualizações

Página 1 de 13

Data Mining no Contexto Esportivo

Diogo V. Tito1, Peter R. Thorun1

1Instituto de Ciências Exatas e Informática (ICEI) – Pontifícia Universidade Católica de Minas Gerais – Belo Horizonte – MG – Brasil

{diogovargas, prthorun}@gmail.com

Abstract. This paper shows how to use the technique of Data Mining can help in the discovery of knowledge from a large database volume. The experiments were performed using sports data aimed not known as a subject discussed everyday aspects. We also demonstrate that the use of specific tools to generate results can be a good option to have several ways to visualize data generated, facilitating the discovery of knowledge not previously obtained.

Resumo. Este artigo mostra como o uso da técnica de Mineração de Dados pode ajudar na descoberta de conhecimentos a partir de uma base de dados de grande volume. Os experimentos foram feitos utilizando dados esportivos visando aspectos não conhecidos de um assunto tão discutido todos os dias. Podemos demonstrar também que a utilização de ferramentas específicas para geração de resultados pode ser uma boa opção, por termos várias maneiras de visualizar os dados gerados, facilitando a descoberta de conhecimento não previamente obtidos.

1. Introdução

Este estudo é realizado com intuito de colocar em prática as técnicas de mineração de dados estudadas em sala de aula. Dentre as várias técnicas selecionamos clustering e association para aplicarmos a uma base de dados montada ao passar dos anos e que contém todos os resultados dos times mais relevantes do futebol brasileiro desde sua fundação. Os resultados são especificados por competição, se o jogo ocorreu em casa, fora ou em campo neutro, placares, jogadores que marcaram e data. Pensamos que o aspecto mais interessante da mineração de dados é justamente aplicar o conhecimento a objetos comuns do nosso dia a dia, o futebol no nosso caso, e esperamos que possamos destacar aspectos interessantes sobre o esporte.

2. Trabalhos Relacionados

Tentamos encontrar trabalhos relacionados ao nosso assunto, onde buscamos aplicar a técnica de mineração de dados para o ambiente esportivo, porém não foi possível. Assim, nosso referencial teórico ficou restrita às técnicas de mineração e aos algorítmos utilizados para a descoberta de conhecimento em banco de dados.

3. Descoberta de Conhecimento

"Data mining, ou mineração de dados, é uma técnica que faz parte de uma das etapas da descoberta de conhecimento em banco de dados. Ela é capaz de revelar, automaticamente, o conhecimento que está implícito em grandes quantidades de informações armazenadas nos bancos de dados de uma organização. Essa técnica pode fazer, entre outras, uma análise antecipada dos eventos, possibilitando prever tendências e comportamentos futuros, permitindo aos gestores a tomada de decisões baseada em fatos e não em suposições" Cardoso e Machado (2008).

Segundo Fayyad (1996), o modelo tradicional para transformação dos dados em informação (conhecimento) para tal tomada de decisão, consiste em um processamento manual de todas essas informações por especialistas que, então, produzem relatórios que deverão ser analisados. Na grande maioria das situações, devido ao grande volume de dados, esse processo manual torna-se impraticável.

Assim chegamos ao KDD (Knowledge Discovery in Databases ou Descoberta de Conhecimento nas Bases de Dados) que é uma tentativa de solucionar o problema causado pela chamada "era da informação": a sobrecarga de dados. Para Fayyad (1996) o KDD refere-se a todo o processo de descoberta de conhecimento, e a Mineração de Dados a uma das atividades do processo. No entanto, todos concordam que o processo de mineração deve ser iterativo, interativo e divido em fases. Na figura 1 podemos ver uma representação do processo de KDD.

Figura 1: Figura representando o processo de KDD [2]

Uma das definições mais utilizadas para o termo KDD é de Fayyad (1996), que o define como "um processo não trivial de identificação de novos padrões válidos, úteis e compreensíveis".

Neste artigo utilizaremos 2 algorítmos para identificação de padrões sendo elas: Agrupamento (Clustering) e Associação (Association). Cada um com um algorítmo específico.

3.1 Clustering

Agrupamento (Clustering): A tarefa de agrupamento visa identificar e aproximar os registros similares. Um cluster é uma coleção de registros similares entre si, porém diferentes dos outros registros nos demais agrupamentos, conforme mostra a figura 2.

Figura 2: Figura representando o de agrupamento por similaridade

As aplicações das tarefas de agrupamento são as mais variadas possíveis: pesquisa de mercado, reconhecimento de padrões, processamento de imagens, análise de dados, segmentação de mercado, taxonomia de plantas e animais, pesquisas geográficas, classificação de documentos da Web, detecção de comportamentos atípicos (fraudes), entre outras, Oliveira e Carvalho (2008). Geralmente a tarefa de agrupamento é combinada com outras tarefas, além de serem usadas na fase de preparação dos dados.

Podemos classificar os algorítmos de agrupamento como Métodos de Particionamento (Partitioning Methods): Dado um conjunto D de dados com n registros e k o número de agrupamentos desejados, os algorítmos de particionamento organizam os objetos em k agrupamentos, tal que k <= n. Um dos algorítmos mais comuns de agrupamento é: k-Means.

3.1.1 k-Means

Esse foi o algorítmo escolhido para demonstração da técnica, onde utilizamos o conceito da centróide. Dado um conjunto de dados, o algorítmo seleciona de forma aleatória k registros, cada um representando um agrupamento. Para cada registro restante, é calculada a similaridade entre o registro analisado e o centro de cada agrupamento. O objeto é inserido no agrupamento com a menor distância, ou seja, maior similaridade. O centro do cluster é recalculado a cada novo elemento inserido.

3.2 Association

As regras de Associação têm como premissa básica encontrar elementos que implicam na presença de outros elementos em uma mesma transação, ou seja, encontrar relacionamentos ou padrões frequentes entre conjuntos de dados. O termo transação indica quais itens foram consultados em uma determinada

...

Baixar como (para membros premium)  txt (21.1 Kb)  
Continuar por mais 12 páginas »
Disponível apenas no TrabalhosGratuitos.com