VARIÂNCIA E DESVIO PADRÃO
Ensaios: VARIÂNCIA E DESVIO PADRÃO. Pesquise 862.000+ trabalhos acadêmicosPor: • 30/11/2014 • 1.240 Palavras (5 Páginas) • 1.841 Visualizações
VARIÂNCIA E DESVIO PADRÃO
Imagine a seguinte situação: o dono de uma microempresa pretende saber, em média, quantos produtos são produzidos por cada funcionário em um dia. O chefe tem conhecimento que nem todos conseguem fazer a mesma quantidade de peças, mas pede que seus funcionários façam um registro de sua produção em uma semana de trabalho. Ao fim desse período, chegou-se à seguinte tabela:
Para saber a produção média de seus funcionários, o chefe faz o cálculo da média aritmética de produção, isto é, a soma do número de peças produzido em cada dia dividida pela quantidade analisada de dias.
A partir desse cálculo, temos a produção diária média de cada funcionário. Mas se observarmos bem a tabela, veremos que há valores distantes da média. O funcionário B, por exemplo, produz uma média de 12,8 peças por dia. No entanto, houve um dia em que ele produziu 16 peças e outro dia em que ele confeccionou apenas 10 peças. Será que o processo utilizado pelo dono da empresa é suficiente para o seu propósito?
Para esse exemplo, ficou fácil concluir que há uma grande variação entre a produção de cada funcionário. Mas e se essa fosse uma grande empresa, com mais de mil funcionários, ou se fosse observada a produção em um ano, será que conseguiríamos definir essa variação com tanta facilidade?
O estudo da Estatística apresenta medidas de dispersão que permitem a análise da dispersão dos dados. Inicialmente veremos a variância, uma medida de dispersão que mostra quão distantes os valores estão da média. Nesse caso, como estamos analisando todos os valores de cada funcionário, e não apenas uma “amostra”, trata-se do cálculo da variância populacional (var).
O cálculo da variância populacional é obtido através da soma dos quadrados da diferença entre cada valor e a média aritmética, dividida pela quantidade de elementos observados. Observe o cálculo simplificado para esse exemplo:
Observação: se estivéssemos trabalhando com a variância amostral, dividiríamos pela quantidade de elementos observados subtraída de um (– 1). Nesse exemplo, teríamos: 5 dias – 1 = 4 dias.
Vamos então calcular a variância populacional para cada funcionário:
Variância → Funcionário A:
var (A) = (10 – 10)² + (9 – 10)² + (11 – 10)² + (12 – 10)² + (8 – 10)²
5
var (A) = 10 = 2,0
5
Variância → Funcionário B:
var (B) = (15 – 12,8)² + (12 – 12,8)² + (16 – 12,8)² + (10 – 12,8)² + (11 – 12,8)²
5
var (B) = 26,8 = 5,36
5
Variância → Funcionário C:
var (C) = (11 – 10,4)² + (10 – 10,4)² + (8 – 10,4)² + (11 – 10,4)² + (12 – 10,4)²
5
var (C) = 9,2 = 1,84
5
Variância → Funcionário D:
var (D) = (8 – 11)² + (12 – 11)² + (15 – 11)² + (9 – 11)² + (11 – 11)²
5
var (D) = 30 = 6,0
5
Podemos afirmar que a produção diária do funcionário C é mais uniforme do que a dos demais funcionários, assim como a quantidade de peças diárias de D é a mais desigual. Quanto maior for a variância, mais distantes da média estarão os valores, e quanto menor for a variância, mais próximos os valores estarão da média.
Em algumas situações, apenas o cálculo da variância pode não ser suficiente, pois essa é uma medida de dispersão muito influenciada por valores que estão muito distantes da média. Além disso, o fato de a variância ser calculada “ao quadrado” causa uma certa camuflagem dos valores, dificultando sua interpretação. Uma alternativa para solucionar esse problema é o desvio padrão, outra medida de dispersão.
O desvio padrão (dp) é simplesmente o resultado positivo da raiz quadrada da variância. Na prática, o desvio padrão indica qual é o “erro” se quiséssemos substituir um dos valores coletados pelo valor da média. Vamos agora calcular o desvio padrão da produção diária de cada funcionário:
Desvio Padrão → Funcionário A:
dp(A) = √var (A)
dp(A) = √2,0
dp(A) ≈ 1,41
Desvio Padrão → Funcionário B:
dp(B) = √var (B)
dp(B) = √5,36
dp(B) ≈ 2,32
Desvio Padrão → Funcionário C:
dp(C) = √var (C)
dp(C) = √1,84
dp(C) ≈ 1,36
Desvio Padrão → Funcionário D:
dp(D) = √var (D)
dp(D) = √6,0
dp(D) ≈ 2,45
Podemos ver a utilização do desvio padrão na apresentação da média aritmética, informando o quão “confiável” é esse valor. Isso é feito da seguinte forma:
média aritmética (x) ± desvio padrão (dp)
Se o dono da empresa de nosso exemplo pretende concluir seu relatório com a produção média diária de seus funcionários, ele fará da seguinte forma:
Funcionário A: 10,0 ± 1,41 peças por dia
Funcionário B: 12,8 ± 2,32 peças por dia
Funcionário C: 10,4 ± 1,36 peças por dia
Funcionário D: 11,0 ± 2,45 peças por dia
COEFICIENTE DE VARIAÇÃO
Os estudos estatísticos estão relacionados às situações que envolvem estratégias e planejamentos, coleta e organização de dados, análise e interpretação clara e objetiva dos dados observados. Para comparação de dois ou mais conjuntos de dados, a estatística utiliza o desvio padrão, desde que esses dados estejam na mesma unidade de medida. Caso os conjuntos de dados sejam medidos em grandezas diferentes (unidades de medida diferentes), a comparação será feita utilizando o coeficiente de variação.
O coeficiente de variação é usado para analisar a dispersão em termos relativos a seu valor médio quando duas ou mais séries de valores apresentam unidades de medida diferentes. Dessa forma, podemos dizer que o coeficiente de variação é uma forma de expressar a variabilidade dos dados excluindo a influência da ordem de grandeza da variável.
O cálculo do coeficiente de variação é feito através da fórmula:
Onde,
s → é o desvio padrão
X ? → é a média dos dados
CV → é o coeficiente de variação
Como o coeficiente de variação analisa a dispersão em termos relativos, ele será dado em %. Quanto menor for o valor do coeficiente de variação, mais homogêneos serão os dados, ou seja, menor será a dispersão em torno da média. De uma forma geral, se o CV:
For menor ou igual a 15% → baixa dispersão: dados homogêneos
For entre 15 e 30% → média dispersão
For maior que 30% → alta dispersão: dados heterogêneos
Vejamos um exemplo:
Em um grupo de moradores de determinada região foram analisadas a idade (em anos) e a altura (em metros) das pessoas. Deseja-se comparar a dispersão em termos relativos em torno da média dos dois conjuntos de dados, a fim de verificar qual deles é mais homogêneo. Na coleta dos dados verificou-se que:
Idade das pessoas: X =41,6 e s = 0,82
Altura das pessoas: X =1,67 e s = 0,2
Qual conjunto de dados apresenta menor dispersão relativa em torno da média?
Solução: O primeiro fato a se observar é que os dados analisados possuem unidades de medida diferentes. Dessa forma, somente o desvio padrão não é suficiente para comparar os dois conjuntos. Nesse caso, é preciso calcular o coeficiente de variação para fazer a comparação da variação em torno da média dos dados.
Assim, teremos:
Cálculo do CV da idade:
Cálculo do CV da altura:
Interpretação dos dados: como o coeficiente de variação da idade foi menor que o coeficiente de variação da altura, pode-se afirmar que os dados relativos à idade são mais homogêneos que os dados da altura.
...