Data Mining No Contexto Esportivo

Trabalho Universitário: Data Mining No Contexto Esportivo. Pesquise 863.000+ trabalhos acadêmicos

Por: diogovargas • 10/5/2014 • 3.045 Palavras (13 Páginas) • 818 Visualizações

Página 1 de 13

Data Mining no Contexto Esportivo

Diogo V. Tito1, Peter R. Thorun1

1Instituto de Ciências Exatas e Informática (ICEI) – Pontifícia Universidade Católica de Minas Gerais – Belo Horizonte – MG – Brasil

{diogovargas, prthorun}@gmail.com

Abstract. This paper shows how to use the technique of Data Mining can help in the discovery of knowledge from a large database volume. The experiments were performed using sports data aimed not known as a subject discussed everyday aspects. We also demonstrate that the use of specific tools to generate results can be a good option to have several ways to visualize data generated, facilitating the discovery of knowledge not previously obtained.

Resumo. Este artigo mostra como o uso da técnica de Mineração de Dados pode ajudar na descoberta de conhecimentos a partir de uma base de dados de grande volume. Os experimentos foram feitos utilizando dados esportivos visando aspectos não conhecidos de um assunto tão discutido todos os dias. Podemos demonstrar também que a utilização de ferramentas específicas para geração de resultados pode ser uma boa opção, por termos várias maneiras de visualizar os dados gerados, facilitando a descoberta de conhecimento não previamente obtidos.

1. Introdução

Este estudo é realizado com intuito de colocar em prática as técnicas de mineração de dados estudadas em sala de aula. Dentre as várias técnicas selecionamos clustering e association para aplicarmos a uma base de dados montada ao passar dos anos e que contém todos os resultados dos times mais relevantes do futebol brasileiro desde sua fundação. Os resultados são especificados por competição, se o jogo ocorreu em casa, fora ou em campo neutro, placares, jogadores que marcaram e data. Pensamos que o aspecto mais interessante da mineração de dados é justamente aplicar o conhecimento a objetos comuns do nosso dia a dia, o futebol no nosso caso, e esperamos que possamos destacar aspectos interessantes sobre o esporte.

2. Trabalhos Relacionados

Tentamos encontrar trabalhos relacionados ao nosso assunto, onde buscamos aplicar a técnica de mineração de dados para o ambiente esportivo, porém não foi possível. Assim, nosso referencial teórico ficou restrita às técnicas de mineração e aos algorítmos utilizados para a descoberta de conhecimento em banco de dados.

3. Descoberta de Conhecimento

"Data mining, ou mineração de dados, é uma técnica que faz parte de uma das etapas da descoberta de conhecimento em banco de dados. Ela é capaz de revelar, automaticamente, o conhecimento que está implícito em grandes quantidades de informações armazenadas nos bancos de dados de uma organização. Essa técnica pode fazer, entre outras, uma análise antecipada dos eventos, possibilitando prever tendências e comportamentos futuros, permitindo aos gestores a tomada de decisões baseada em fatos e não em suposições" Cardoso e Machado (2008).

Segundo Fayyad (1996), o modelo tradicional para transformação dos dados em informação (conhecimento) para tal tomada de decisão, consiste em um processamento manual de todas essas informações por especialistas que, então, produzem relatórios que deverão ser analisados. Na grande maioria das situações, devido ao grande volume de dados, esse processo manual torna-se impraticável.

Assim chegamos ao KDD (Knowledge Discovery in Databases ou Descoberta de Conhecimento nas Bases de Dados) que é uma tentativa de solucionar o problema causado pela chamada "era da informação": a sobrecarga de dados. Para Fayyad (1996) o KDD refere-se a todo o processo de descoberta de conhecimento, e a Mineração de Dados a uma das atividades do processo. No entanto, todos concordam que o processo de mineração deve ser iterativo, interativo e divido em fases. Na figura 1 podemos ver uma representação do processo de KDD.

Figura 1: Figura representando o processo de KDD [2]

Uma das definições mais utilizadas para o termo KDD é de Fayyad (1996), que o define como "um processo não trivial de identificação de novos padrões válidos, úteis e compreensíveis".

Neste artigo utilizaremos 2 algorítmos para identificação de padrões sendo elas: Agrupamento (Clustering) e Associação (Association). Cada um com um algorítmo específico.

3.1 Clustering

Agrupamento (Clustering): A tarefa de agrupamento visa identificar e aproximar os registros similares. Um cluster é uma coleção de registros similares entre si, porém diferentes dos outros registros nos demais agrupamentos, conforme mostra a figura 2.

Figura 2: Figura representando o de agrupamento por similaridade

As aplicações das tarefas de agrupamento são as mais variadas possíveis: pesquisa de mercado, reconhecimento de padrões, processamento de imagens, análise de dados, segmentação de mercado, taxonomia de plantas e animais, pesquisas geográficas, classificação de documentos da Web, detecção de comportamentos atípicos (fraudes), entre outras, Oliveira e Carvalho (2008). Geralmente a tarefa de agrupamento é combinada com outras tarefas, além de serem usadas na fase de preparação dos dados.

Podemos classificar os algorítmos de agrupamento como Métodos de Particionamento (Partitioning Methods): Dado um conjunto D de dados com n registros e k o número de agrupamentos desejados, os algorítmos de particionamento organizam os objetos em k agrupamentos, tal que k <= n. Um dos algorítmos mais comuns de agrupamento é: k-Means.

3.1.1 k-Means

Esse foi o algorítmo escolhido para demonstração da técnica, onde utilizamos o conceito da centróide. Dado um conjunto de dados, o algorítmo seleciona de forma aleatória k registros, cada um representando um agrupamento. Para cada registro restante, é calculada a similaridade entre o registro analisado e o centro de cada agrupamento. O objeto é inserido no agrupamento com a menor distância, ou seja, maior similaridade. O centro do cluster é recalculado a cada novo elemento inserido.

3.2 Association

As regras de Associação têm como premissa básica encontrar elementos que implicam na presença de outros elementos em uma mesma transação, ou seja, encontrar relacionamentos ou padrões frequentes entre conjuntos de dados. O termo transação indica quais itens foram consultados em uma determinada

...

Baixar como (para membros premium) txt (21.1 Kb)

Continuar por mais 12 páginas »

Disponível apenas no TrabalhosGratuitos.com

Ler documento completo Salvar

Informação

Denunciar este trabalho

Trabalhos relacionados

Data Mining
INTRODUÇÃO A velocidade na ocorrência das mudanças em nossa sociedade e o aumento da competição dos mercados globais tem contribuído para um processo de questionamento

5 Páginas • 814 Visualizações
Data Mining
Data Mining Data mining mineração de dados ou garimpagem de dados significa extrair informações que serão uteis e que estão no Data Warehouseou em qualquer

3 Páginas • 740 Visualizações
Banco de Dados Distribuídos: Introdução, conceitos e características, Data Warehouse e Data Mining: Princípios, Conceitos e Aplicações
eve conter o resultado das atividades dos passos anteriores desta Etapa: 3.1 Tutorial Otimização de Consultas. Apresentar os tutoriais desenvolvidos por cada membro da equipe

2 Páginas • 1001 Visualizações
Conceito E Aplicação Nas Organizações De Data Mining
A cada ano que passa, as companhias acumulam mais e mais informações em seus bancos de dados. Como conseqüência, esses bancos passam a conter verdadeiros

2 Páginas • 632 Visualizações
DATA MINING E DATA WAREHOUSE
1. INTRODUÇÃO O atual mercado competitivo exige que uma organização necessite utilizar de toda a informação disponível para obter uma vantagem competitiva perante sua concorrência.

2 Páginas • 806 Visualizações
Data Mining
Prospecção de dados ou mineração de dados (também conhecida pelo termo inglês data mining) é o processo de explorar grandes quantidades de dados à procura

2 Páginas • 657 Visualizações
Data Mining
UNIVERSIDADE PAULISTA - UNIP CURSO SUPERIOR DE FORMAÇÃO TECNÓLOGO EM GESTÃO FINANCEIRA PROJETO INTEGRADO MULTIDISCIPLINAR – PIM I Andorinha Indústria e Comércio de Peças Automotivas

30 Páginas • 597 Visualizações
Data Mining
4 – Data Mining 4.1 – Conceito e Objetivo Data Mining consiste em um processo analítico projetado para explorar grandes quantidades de dados (tipicamente relacionados

3 Páginas • 768 Visualizações
Artigo Data Mining
Data mining é uma expressão inglesa ligada à informática cuja tradução é mineração de dados. Consiste em uma funcionalidade que agrega e organiza dados, encontrando

2 Páginas • 604 Visualizações
Data mining
1. Defina Data Mining, descreva os tipos de informação obtidos a partir do data mining e explique em que ele difere do OLAP. R –

2 Páginas • 1065 Visualizações

Tópicos similares

Tenha acesso a mais de 863.000 trabalhos e monografias
Junte-se a mais de 3.949.000 outros alunos
Trabalhos e monografias de alta qualidade

Registrar