Posição das Medidas
Resenha: Posição das Medidas. Pesquise 862.000+ trabalhos acadêmicosPor: tata123 • 1/12/2013 • Resenha • 556 Palavras (3 Páginas) • 257 Visualizações
Medidas de Posição
Usualmente, emprega-se uma das seguintes medidas de posição(ou localização) central, media, mediana ou moda.
A moda é definida como a realização mais frequente do conjunto de valores observados. Por exemplo, considere a variável Z, número de filhos de cada funcionário casado. Vemos que a moda é 2, correspondente à realização com maior frequência. Em alguns casos, pode haver mais de uma moda, ou seja, a distribuição dos valores pode ser bimodal, tri modal etc.
A mediana é a realização que ocupa a posição central da série de observações, quando estão ordenadas em ordem crescente. Assim, se as cinco observações de uma variável forem 3,4,7,8 e 8, a mediana é o valor 7, correspondendo à terceira observação. Quando o numero de observações for par, usar-se como mediana a média aritmética das duas observações centrais. Acrescentando-se o valor 9 à série acima, a mediana será (7+8)/2=7,5.
A media aritmética, conceito familiar ao leitor, é a soma das observações dividida primeira observações.
Medidas de Dispersão
O resumo de um conjunto de dados por uma única medida representativa de posição central esconde toda a informação sobre a variabilidade do conjunto submeteram-se a um teste, obtendo-se as seguintes notas:
Grupo A (variável X): 3,4,5,6,7,
Grupo B (Variável Y) 1,3,5,7,9
Grupo C (Variável Z) 5,5,5,5,5
Grupo D (Variável W) 3,5,5,7
Grupo E (Variável V) 3,5,5,6,6
Vemos que X=Y=Z=W=V=5,0. A identificação de cada uma destas séries por sua média nada informa sobre suas diferentes variabilidades. Notamos, então, a conveniência de serem criadas medidas que sumarizem a variabilidade de um conjunto.
Um critério frequentemente usado é aquele que mede a dispersão dos dados em torno de sua media, e duas medidas são as mais usadas: desvio médio e variância.
Para o grupo A acima os desvios xi – x são: -2,-1¬,0,1,2. ¬¬¬¬¬¬¬¬¬¬É fácil ver que para qualquer conjunto de dados, a soma dos desvios é igual a zero. Nestas condições, a soma dos desvios ∑5i =1i (xi - x) não é uma boa medida de dispersão para o conjunto A. Duas opções são: considerar o total dos desvios em valor absoluto: considerar o total dos quadrados dos desvios. Para o grupo A teríamos. Respectivamente.
O uso desses totais pode causar dificuldade quando comparamos conjunto de dados como números diferentes de observações, como os conjuntos A e D acima. Desse modo, é mais conveniente exprimir as medidas como médias, isto é, o desvio médio e a variância são definidos por.
Sendo a variância uma medida de dimensão igual ao quadrado da dimensão dos dados (por exemplo, se os dados são expressos em cm, a variância será expressa em cm2), pode causar problema de interpretação. Costuma-se usar, então, o desvio padrão que é definido como a raiz quadrada positiva
...