Probabilidade e Estatística
Por: Cleide Ana • 3/5/2015 • Trabalho acadêmico • 883 Palavras (4 Páginas) • 362 Visualizações
AULA 3
MEDIDAS DE DISPERSÃO
Variância, desvio-padrão e coeficiente de variação
A dispersão indica o grau de afastamento de um conjunto de dados em relação à sua média.
Uma forma de medir a dispersão consiste simplesmente em tomar a diferença entre o maior e o menor valor, que chamamos de amplitude. A amplitude dá uma idéia do afastamento entre o maior e o menor valor, mas não é uma boa medida de dispersão.
Exemplo: Se vendêssemos 200 pizzas por dia, não haveria dispersão (200 – 200 = 0). Por outro lado, se vendêssemos 400 pizzas na metade do tempo e a outra metade não vendêssemos pizzas, a média ainda seria a mesma, mas o grau de dispersão seria muito maior( 400 – 0 = 400)
Portanto, um problema com a amplitude (que trata apenas dos valores máximos e mínimos) é que ela é fortemente afetada pela presença de valores muito grandes ou muito pequenos. Uma forma de resolver esse problema seria utilizar uma medida que utilize todos os dados. As duas medidas da variabilidade que utilizam todas as entradas em um conjunto de dados são a Variância e o desvio padrão.
Primeiramente, precisamos determinar quão distante da média dos valores, cada número está. Para tanto, devemos subtrair cada número da média encontrada, é o que chamamos de desvio.
Desvio de uma entrada x em um conjunto de dados de uma população é a diferença entre a entrada e a média [pic 2] do conjunto de dados
Desvio de x = x - [pic 3]
Exemplo: Determine o desvio de cada salário inicial para a empresa A.
Salário(milhares) x | Desvio (x - [pic 4])[pic 5] |
41 | -0,5 |
38 | -3,5 |
39 | -2,5 |
45 | 3,5 |
47 | 5,5 |
41 | -0,5 |
44 | 2,5 |
41 | -0,5 |
37 | -4,5 |
42 | 0,5 |
[pic 6] | [pic 7] |
Exemplo: O numero de vendas de pizzas calabresa por dia pode ser representado atrave´s da seguinte tabela:
Vendas tipo calabresa x | Desvio(x - [pic 8]) |
40 | -9 |
56 | 7 |
38 | -11 |
38 | -11 |
63 | 14 |
59 | 10 |
52 | 3 |
49 | 0 |
46 | -3 |
Média dos dados: [pic 9]= [pic 10]
O Desvio médio: [pic 11]
O desvio médio é uma boa média de dispersão porque dá a distância média de cada número em relação à média. Todavia, para muitos propósitos, é conveniente elevar ao quadrado cada desvio e tomar a média de todos esses quadrados, é o que chamamos de variância.
1) Variância (Var):
Valor que corresponde à média aritmética dos quadrados dos desvios em relação à média.
A variância é difícil de ser interpretada.
Ela pode ser populacional e amostral.
- variância da populacão: é calculada a partir de um conjunto de dados da população, com N entradas.
[pic 12]
[pic 13]
- variância da amostra: é calculada a partir de um conjunto de dados de uma amostra com n entradas.
[pic 14]
[pic 15]
A variância é também uma boa medida de dispersão, mas tem uma desvantagem: é difícil interpretar o valor numérico da variância. A variância do exemplo acima das vendas de pizza calabresa, daria 76,222, mas o que significa termos uma variância de 76,222 pizzas ao quadrado?
Por essa razão, é mais conveniente calcularmos a raiz quadrada da variância, chamada de desvio padrão.
2) Desvio-padrão (s):
a) Desvio-padrão populacional : [pic 16][pic 17]
b) Desvio-padrão da amostra: s = [pic 18][pic 19]
Exemplo: Cálculo da variância da amostra dos dados de salários iniciais
Salário mensal x | Média das amostras [pic 20] | Desvio ( x - [pic 21]) | Desvio elevado ao quadrado ( x - [pic 22])2 |
2850 | 2940 | -90 | 8100 |
2950 | 2940 | 10 | 100 |
3050 | 2940 | 110 | 12100 |
2880 | 2940 | -60 | 3600 |
2755 | 2940 | -185 | 34225 |
2710 | 2940 | -230 | 52900 |
2890 | 2940 | -50 | 2500 |
3130 | 2940 | 190 | 36100 |
2940 | 2940 | 0 | 0 |
3325 | 2940 | 385 | 148225 |
2920 | 2940 | -20 | 400 |
2880 | 2940 | -60 | 3600 |
Logo: variância da amostra: s2 = [pic 23]
E o desvio-padrão: s = [pic 24]
3) Coeficiente de variação (cv):
...