Dados Enem 2012
Por: mfcarreira • 28/11/2016 • Artigo • 4.684 Palavras (19 Páginas) • 286 Visualizações
1. Introdução
No contexto atual, independentemente da região, país ou cidade onde uma organização desenvolva suas atividades, a necessidade de armazenamento de dados torna-se de suma importância para garantir aos seus gestores as informações referentes às operações por ela realizadas para serem utilizadas quando forem necessárias. O problema é que a quantidade de dados armazenados são cada vez maiores, o que dificulta a geração de informações para a tomada de decisão.
Neste sentido, o presente trabalho, pretende apresentar a Mineração de Dados (MDs) como importante ferramenta de auxílio aos gestores públicos para a tomada de decisão, buscando mostrar que é possível “minerar” dados de um determinado banco de dados e transformá-los em informação para o processo decisório (políticas públicas) e assim, possibilitar a geração de conhecimento, que é o principal objetivo da MDs – para o caso em questão.
O Ministério da Educação e Cultura (MEC), anualmente, realiza o Exame Nacional do Ensino Médio (ENEM) com o objetivo de avaliar o desempenho dos estudantes do ensino médio para aferir o desenvolvimento de competências fundamentais ao exercício pleno da cidadania. Junto ao instrumento de exame são coletados dados socioeconômicos dos estudantes, o qual forma o banco de dados da avaliação deste trabalho. Em média, anualmente, participam do ENEM cerca de 5.000.000 de estudantes.
O foco da pesquisa busca associar o desempenho na prova objetiva com situações socioeconômicas, como o grau de escolaridade de seus pais, o acesso à internet e o tipo de escola em que o estudante cursou o ensino médio (pública ou privada). Os dados analisados são da Região Sul do País (estados do Rio Grande do Sul, Santa Catarina e Paraná).
2. Fundamentação teórica
- Dados versus informação e conhecimento
Atualmente tem-se uma infinidade de dados apresentados através de redes de comunicação como jornais, revistas, televisão e principalmente a internet. Diariamente milhares de dados são “jogados - disponibilizados” para as pessoas, as quais muitas vezes não entendem o que estes dados significam e muitos se encarregam de retransmiti-los sem saber, na verdade, o que representam.
Os dados são apenas números que, isolados, não têm significado algum. A partir do momento em que esses dados são trabalhados e correlacionados com outros é possível ter informação. Os dados (as informações) são transformados em conhecimento à medida que for possível para aquele que o recebe tomar algum tipo de decisão ou mudar sua forma de pensar; ou seja, o conhecimento tende a proporcionar mudanças naquele que o adquire.
Pode-se dizer que a informação proporciona conhecimento quando para aquele que o recebe ocorre algum tipo mudança. Por exemplo, quando se perceber que algo pode ser realizado de maneira diferente, entender que não está realizando o procedimento correto ou da melhor forma. Assim, só se pode afirmar que tal informação gerou conhecimento se ela causar alguma reação ou mudança de comportamento.
O conhecimento tende a mostrar àquele que o adquire uma nova forma de ver o mundo, a fazer surgir uma nova vertente, um novo proceder, enquanto a informação, dependendo do seu nível, causa apenas um impacto momentâneo em quem o recebe, sem, na maioria das vezes, causar uma mudança comportamental.
- Exame Nacional do Ensino Médio - ENEM
O ENEM foi instituído em 1998 pelo MEC para ser aplicado, em caráter voluntário, aos estudantes egressos do Ensino Médio (MEC 2012). Realizado anualmente, tem como objetivo principal avaliar o desempenho do aluno ao término do ensino médio, para aferir o desenvolvimento de competências fundamentais ao exercício da cidadania.
O exame tem como objetivo oferecer uma referência para que o estudante possa proceder à autoavaliação e escolher a competência profissional para a continuidade dos estudos. Busca estruturar, ao final da educação básica, uma avaliação que sirva como modalidade alternativa ou complementar aos processos de seleção nos diferentes mercados de trabalho, além de permitir acesso aos cursos profissionalizantes dos Pós-médios e à Educação Superior. Também credencia os estudantes à participação dos programas governamentais.
O ENEM consiste de uma prova única contendo 180 questões objetivas de múltipla escolha e uma proposta para redação, além de duzentas questões de natureza socioeconômica.
- Descoberta de Conhecimento em Banco de Dados
O KDD (Knowledge Discovery in Databases) é um processo não trivial de identificação de padrões. De acordo com Fayyad et al. (1996), esse processo deve conter na base de dados as características de validade, novidade, utilidade e assimilabilidade. O KDD é o processo de selecionar e processar dados que permitam identificar estruturas interessantes que possam extrair conhecimento dos dados, e para isto aplica-se a mineração de dados. A expressão Mineração de Dados (MDs) refere-se a uma das etapas deste processo.
- Mineração de Dados - MDs
A MDs consiste em abstrair de um banco de dados informações que gerem conhecimento e possam auxiliar no processo de tomada de decisão. De acordo com Fayyad et al. (1996), a mineração de dados é a principal etapa do processo KDD, e está voltada a aplicar algoritmos e produzir padrões sobre uma base de dados.
A MDs de acordo com a DWBrasil (2004), segue três caminhos. O primeiro deles é a estatística clássica, que envolve conceitos básicos (distribuição normal, variância, etc.) usados para estudar os dados e os relacionamentos entre eles; o segundo caminho traçado pela MDs é a Inteligência Artificial, a qual é construída a partir dos fundamentos da heurística, em oposição à estatística, e tenta imitar a maneira como o homem pensa na resolução dos problemas estatísticos; e o terceiro caminho é a aprendizagem de máquina (machine learning), que pode ser compreendida como a junção entre a estatística e a Inteligência Artificial. A aprendizagem de máquina tenta fazer com que os programas de computador aprendam com os dados que utilizam, de tal modo que esses programas tomem decisões diferentes, baseadas nas características dos dados, usando a estatística para os conceitos fundamentais e adicionando heurística avançada da Inteligência Artificial e algoritmos para alcançar os seus objetivos.
...