TrabalhosGratuitos.com - Trabalhos, Monografias, Artigos, Exames, Resumos de livros, Dissertações
Pesquisar

VARIÂNCIA E DESVIO PADRÃO

Ensaios: VARIÂNCIA E DESVIO PADRÃO. Pesquise 862.000+ trabalhos acadêmicos

Por:   •  30/11/2014  •  1.240 Palavras (5 Páginas)  •  1.841 Visualizações

Página 1 de 5

VARIÂNCIA E DESVIO PADRÃO

Imagine a seguinte situação: o dono de uma microempresa pretende saber, em média, quantos produtos são produzidos por cada funcionário em um dia. O chefe tem conhecimento que nem todos conseguem fazer a mesma quantidade de peças, mas pede que seus funcionários façam um registro de sua produção em uma semana de trabalho. Ao fim desse período, chegou-se à seguinte tabela:

Para saber a produção média de seus funcionários, o chefe faz o cálculo da média aritmética de produção, isto é, a soma do número de peças produzido em cada dia dividida pela quantidade analisada de dias.

A partir desse cálculo, temos a produção diária média de cada funcionário. Mas se observarmos bem a tabela, veremos que há valores distantes da média. O funcionário B, por exemplo, produz uma média de 12,8 peças por dia. No entanto, houve um dia em que ele produziu 16 peças e outro dia em que ele confeccionou apenas 10 peças. Será que o processo utilizado pelo dono da empresa é suficiente para o seu propósito?

Para esse exemplo, ficou fácil concluir que há uma grande variação entre a produção de cada funcionário. Mas e se essa fosse uma grande empresa, com mais de mil funcionários, ou se fosse observada a produção em um ano, será que conseguiríamos definir essa variação com tanta facilidade?

O estudo da Estatística apresenta medidas de dispersão que permitem a análise da dispersão dos dados. Inicialmente veremos a variância, uma medida de dispersão que mostra quão distantes os valores estão da média. Nesse caso, como estamos analisando todos os valores de cada funcionário, e não apenas uma “amostra”, trata-se do cálculo da variância populacional (var).

O cálculo da variância populacional é obtido através da soma dos quadrados da diferença entre cada valor e a média aritmética, dividida pela quantidade de elementos observados. Observe o cálculo simplificado para esse exemplo:

Observação: se estivéssemos trabalhando com a variância amostral, dividiríamos pela quantidade de elementos observados subtraída de um (– 1). Nesse exemplo, teríamos: 5 dias – 1 = 4 dias.

Vamos então calcular a variância populacional para cada funcionário:

Variância → Funcionário A:

var (A) = (10 – 10)² + (9 – 10)² + (11 – 10)² + (12 – 10)² + (8 – 10)²

5

var (A) = 10 = 2,0

5

Variância → Funcionário B:

var (B) = (15 – 12,8)² + (12 – 12,8)² + (16 – 12,8)² + (10 – 12,8)² + (11 – 12,8)²

5

var (B) = 26,8 = 5,36

5

Variância → Funcionário C:

var (C) = (11 – 10,4)² + (10 – 10,4)² + (8 – 10,4)² + (11 – 10,4)² + (12 – 10,4)²

5

var (C) = 9,2 = 1,84

5

Variância → Funcionário D:

var (D) = (8 – 11)² + (12 – 11)² + (15 – 11)² + (9 – 11)² + (11 – 11)²

5

var (D) = 30 = 6,0

5

Podemos afirmar que a produção diária do funcionário C é mais uniforme do que a dos demais funcionários, assim como a quantidade de peças diárias de D é a mais desigual. Quanto maior for a variância, mais distantes da média estarão os valores, e quanto menor for a variância, mais próximos os valores estarão da média.

Em algumas situações, apenas o cálculo da variância pode não ser suficiente, pois essa é uma medida de dispersão muito influenciada por valores que estão muito distantes da média. Além disso, o fato de a variância ser calculada “ao quadrado” causa uma certa camuflagem dos valores, dificultando sua interpretação. Uma alternativa para solucionar esse problema é o desvio padrão, outra medida de dispersão.

O desvio padrão (dp) é simplesmente o resultado positivo da raiz quadrada da variância. Na prática, o desvio padrão indica qual é o “erro” se quiséssemos substituir um dos valores coletados pelo valor da média. Vamos agora calcular o desvio padrão da produção diária de cada funcionário:

Desvio Padrão → Funcionário A:

dp(A) = √var (A)

dp(A) = √2,0

dp(A) ≈ 1,41

Desvio Padrão → Funcionário B:

dp(B) = √var (B)

dp(B) = √5,36

dp(B) ≈ 2,32

Desvio Padrão → Funcionário C:

dp(C) = √var (C)

dp(C) = √1,84

dp(C) ≈ 1,36

Desvio Padrão → Funcionário D:

dp(D) = √var (D)

dp(D) = √6,0

dp(D) ≈ 2,45

Podemos ver a utilização do desvio padrão na apresentação da média aritmética, informando o quão “confiável” é esse valor. Isso é feito da seguinte forma:

média aritmética (x) ± desvio padrão (dp)

Se o dono da empresa de nosso exemplo pretende concluir seu relatório com a produção média diária de seus funcionários, ele fará da seguinte forma:

Funcionário A: 10,0 ± 1,41 peças por dia

Funcionário B: 12,8 ± 2,32 peças por dia

Funcionário C: 10,4 ± 1,36 peças por dia

Funcionário D: 11,0 ± 2,45 peças por dia

COEFICIENTE DE VARIAÇÃO

Os estudos estatísticos estão relacionados às situações que envolvem estratégias e planejamentos, coleta e organização de dados, análise e interpretação clara e objetiva dos dados observados. Para comparação de dois ou mais conjuntos de dados, a estatística utiliza o desvio padrão, desde que esses dados estejam na mesma unidade de medida. Caso os conjuntos de dados sejam medidos em grandezas diferentes (unidades de medida diferentes), a comparação será feita utilizando o coeficiente de variação.

O coeficiente de variação é usado para analisar a dispersão em termos relativos a seu valor médio quando duas ou mais séries de valores apresentam unidades de medida diferentes. Dessa forma, podemos dizer que o coeficiente de variação é uma forma de expressar a variabilidade dos dados excluindo a influência da ordem de grandeza da variável.

O cálculo do coeficiente de variação é feito através da fórmula:

Onde,

s → é o desvio padrão

X ? → é a média dos dados

CV → é o coeficiente de variação

Como o coeficiente de variação analisa a dispersão em termos relativos, ele será dado em %. Quanto menor for o valor do coeficiente de variação, mais homogêneos serão os dados, ou seja, menor será a dispersão em torno da média. De uma forma geral, se o CV:

For menor ou igual a 15% → baixa dispersão: dados homogêneos

For entre 15 e 30% → média dispersão

For maior que 30% → alta dispersão: dados heterogêneos

Vejamos um exemplo:

Em um grupo de moradores de determinada região foram analisadas a idade (em anos) e a altura (em metros) das pessoas. Deseja-se comparar a dispersão em termos relativos em torno da média dos dois conjuntos de dados, a fim de verificar qual deles é mais homogêneo. Na coleta dos dados verificou-se que:

Idade das pessoas: X =41,6 e s = 0,82

Altura das pessoas: X =1,67 e s = 0,2

Qual conjunto de dados apresenta menor dispersão relativa em torno da média?

Solução: O primeiro fato a se observar é que os dados analisados possuem unidades de medida diferentes. Dessa forma, somente o desvio padrão não é suficiente para comparar os dois conjuntos. Nesse caso, é preciso calcular o coeficiente de variação para fazer a comparação da variação em torno da média dos dados.

Assim, teremos:

Cálculo do CV da idade:

Cálculo do CV da altura:

Interpretação dos dados: como o coeficiente de variação da idade foi menor que o coeficiente de variação da altura, pode-se afirmar que os dados relativos à idade são mais homogêneos que os dados da altura.

...

Baixar como  txt (7.5 Kb)  
Continuar por mais 4 páginas »