Análise de Gastos Médios com Lazer e Entretenimento para Abertura do Museu Esportivo Interativo
Por: brunopaes012 • 28/11/2017 • Monografia • 829 Palavras (4 Páginas) • 378 Visualizações
Simulação de Estimadores
Análise de Gastos Médios com Lazer e Entretenimento
para Abertura do Museu Esportivo Interativo
Análise da População
Com a seed de número 523, utilizamos o R Studio para desenvolver nossas análises, que se iniciaram com a análise da população, ou seja, 35.000 registros. Nesse primeiro momento, descobrimos a média dos gastos dessa população, cerca de 1.709,061; também descobrimos a variância dos dados, cerca de 36.800,400, posteriormente descobrimos o Desvio Padrão dos dados, cerca de 606,637. Para nos ajudar em nossas análises, usamos histogramas e boxplots, assim poderíamos enxergar como os dados se comportavam em relação à média.
[pic 3][pic 4]
[pic 5]
O histograma nos permite visualizar que certos intervalos de valores aparecem com mais frequência do que outros, fazendo com que a média fique mais centralizada, visto que muitos picos de frequência são as classes cujo os centros de classe têm valores de 1000, 1500 e 2000. Por sua vez, o boxplot nos permite visualizar o comportamento dos dados em relação à média. Caso só dispuséssemos do boxplot, poderíamos facilmente deduzir que os dados estão mais dispersos em relação à média, visto que o primeiro e o terceiro quartil estão mais afastados da média. No entanto, como dispomos das medidas de dispersão, podemos agora, quantificar essa dispersão dos dados; sendo a variância de 36.800,400 e o Desvio Padrão de 606,637.
Explicação do Código – Metodologia aplicada
Utilizamos em nossas análises, primordialmente a ferramenta R studio. Nossas análises começaram pela população, na qual utilizamos comandos como o mean, var, sd, hist e boxplot. O próximo passo foi a análise das amostras, algo mais trabalhoso, visto que tivemos de utilizar um pequeno loop de 5.000 iterações; em cada iteração um sample de tamanho c(10, 30, 50, 100, 200, 500, 1.000, 5.000 e 20.000), guardava os valores sorteados aleatoriamente; o comando media[i] = c(mean(amostra)), guardava as médias das amostras. Portanto no fim da execução do loop, tínhamos um vetor com 5.000 médias, objeto no qual foi utilizado para fazermos as análises.
Código do loop
for (i in 1:5000) { #controla o número de amostras
amostra = c(sample(tab$gasto, 10)); #controla no número de elementos amostrais
media[i] = c(mean(amostra)); #tira a média das amostras e salva num vetor
}
Demais códigos
mean(x);var(x);sd(x)
hist.(main=””, x, xlab=””, ylab=””, col=vetorCores)
boxplot(main=””, xlab=””, col=vetorCores, arquivo)
Análise das Amostras
Utilizamos a mesma metodologia para todas as 9 amostras colhidas, o que mudava de uma para outra era o número de elementos amostrais colhidos e as cores finais do histograma e boxplot.
Amostras com 10 Elementos amostrais
[pic 6][pic 7][pic 8]
Média: 1.704,563
Variância: 37.439,530
Desvio Padrão: 193,493
Amostras com 30 Elementos amostrais
[pic 9][pic 10][pic 11]
Média: 1.708,559
Variância: 12.508,00
Desvio Padrão: 111,839
Amostras com 50 Elementos amostrais
[pic 12] [pic 13][pic 14]
Média: 1.708.824
Variância: 7.291,196
Desvio Padrão: 85,885
Amostras com 100 Elementos amostrais
[pic 15][pic 16][pic 17]
Média: 1.709,926
Variância: 3.697,495
Desvio Padrão: 60,807
Amostras com 1000 Elementos amostrais
...