ESTATÍSTICA DESCRITIVA MEDIDAS DE DISPERSAO OU DE VARIABILIDADE
Por: Eduardo Emerson • 30/10/2017 • Trabalho acadêmico • 5.463 Palavras (22 Páginas) • 485 Visualizações
ESTATÍSTICA DESCRITIVA MEDIDAS DE DISPERSAO OU DE VARIABILIDADE [pic 1] |
[pic 2]
Vimos até aqui, que a moda, a mediana e a média podem ser utilizadas para sintetizar em um único número o que é médio ou aquilo que é típico (moda) de uma distribuição. Quando empregada individualmente, entretanto, qualquer medida de tendência central produz somente um quadro incompleto de um conjunto de dados e, portanto, pode tanto enganar ou distorcer quando esclarecer, dependendo da conclusão que queira chegar.
São necessários dois tipos de medidas para descrever adequadamente um conjunto de dados:
- MEDIDAS DE TENDÊNCIA CENTRAL
- Média
- Mediana
- moda
- MEDIDAS DE DISPERSÃO
Uma breve reflexão sobre as medidas de tendência central permite-nos concluir que elas não são suficientes para caracterizar totalmente uma seqüência numérica. Podem surgir perguntas do tipo:
- Onde a maior parte dos dados se encontra?
- Os dados variam muito ou pouco em relação à média?
- Até que ponto os resultados se concentram ou não ao redor da tendência central de um conjunto de observações?
Estas perguntas impõem algumas novas necessidades. Para além de expressar através de um único valor em torno do qual tende a se concentrar um conjunto de dados numéricos, importa saber como estas observações estão distribuídas em nossa população de estudo – são elas bastantes próximas entre si ou variam muito?
Isto ocorre porque duas ou mais distribuições podem apresentar médias aritméticas idênticas e, ao mesmo tempo, possuir valores que se distribuem de maneiras completamente diferentes em relação a ela. Por exemplo, considere as três distribuições X, Y e Z.
X: 70 – 70 – 70 – 70 – 70 → [pic 3]
Y: 68 – 69 – 70 – 71 – 72 → [pic 4]
Z: 05 – 15 – 50 – 120 – 160 → [pic 5]
Observe que as três distribuições têm médias aritméticas idênticas, mas seus valores se distribuem de maneira diferente:
- o conjunto X é mais homogêneo que os conjuntos Y e Z.
- o conjunto Y por sua vez é mais homogêneo que o conjunto Z.
Observe que, se conhecêssemos apenas a média e não tivéssemos o conjunto de onde veio a média, não teríamos como fazer observações a respeito da variabilidade dos dados.
Para ilustrar melhor, considere que a média de temperatura em Brasília e Goiânia nos últimos 15 dias foi de 25 ºC.
Podemos presumir que a temperatura é basicamente a mesma durante os 15 dias nas duas cidades? Na verdade, não podemos. O fato das médias de temperaturas serem iguais, não quer dizer que a cada dia a temperatura foi a mesma nas duas cidades. Elas oscilaram de maneira diferente.
Quando se trata de interpretar dados estatísticos, é necessário ter-se uma idéia de o quão distante ou disperso está um dado valor em relação à média. Ou seja, necessitamos de uma medida capaz de expressar a forma como as observações se distribuem em um conjunto de dados. Com as medidas de tendência central apenas, não é possível fazer estas observações.
Para os métodos estatísticos, a medida de dispersão é de fundamental importância, pois a necessidade do uso da estatística é devido à existência de variabilidade nos dados observados. Por exemplo,
- O peso, a altura, o tempo de gestação dos recém-nascidos nem sempre é o mesmo, ou seja, variam.
- Os homens com exatamente 20 anos não possuem a mesma altura.
- Os rendimentos dos cidadãos variam.
- O tempo de vida do ser humano varia.
- A inflação, a temperatura, a pressão sanguínea, o tipo sanguíneo variam.
- O Q.I varia de indivíduo para indivíduo.
- Etc.
Caso não houvesse variabilidade nos dados pesquisados, boa parte das medidas estatísticas seria desnecessária.
Supondo ser a média, a medida de localização mais importante, será relativamente a ela que se definem as principais medidas de dispersão.
DEFINIÇÃO 1 - Medidas de Dispersão – São medidas estatísticas utilizadas para avaliar o grau de variabilidade ou dispersão dos valores em torno da média. Servem para medir a representatividade da média. Quanto mais próximos os valores uns dos outros, mais representativa é a média.
DISPERSÃO
[pic 6]
[pic 7]
[pic 8]
[pic 9]
As principais medidas de dispersão são:
- Amplitude Total ou Range - R
- Desvio médio - Dm
- Variância - s2
- Desvio padrão - s
- Coeficiente de Variação – CV
- Assimetria - AS
1.1 - AMPLITUDE TOTAL OU RANGE
Corresponde à diferença entre o valor máximo e mínimo de uma distribuição, ou seja:
[pic 10]
- [pic 11] = limite superior (maior valor da amostra)
-[pic 12] = limite inferior (menor valor da amostra)
A amplitude fornece apenas uma idéia do campo de variação dos elementos. Quanto maior a amplitude total, maior a dispersão ou variabilidade dos valores da variável.
...