Caixa
Tese: Caixa. Pesquise 862.000+ trabalhos acadêmicosPor: logand • 10/9/2014 • Tese • 1.443 Palavras (6 Páginas) • 258 Visualizações
O BOXPLOT
Ana Maria Lima de Farias
Departamento de Estatística (GET/UFF)
Introdução
O boxplot é um gráfico construído com base no resumo dos cinco números, constituído
por:
• Valor mínimo
• Primeiro quartil (Q1)
• Mediana (segundo quartil Q2)
• Terceiro quartil (Q3)
• Valor máximo
O gráfico é formado por uma caixa construída paralelamente ao eixo da escala dos dados
(pode ser horizontal ou vertical). Essa caixa vai desde o primeiro quartil até o terceiro
quartil e nela traça-se uma linha na posição da mediana. Essa caixa, que descreve os
50% centrais da distribuição, é comum a todas as variantes do boxplot. Pode-se
acrescentar também uma linha, paralela à linha da mediana, para indicar a média. Na
figura abaixo, Q1 = 5; Q2 = 7; Q3 = 8.
Na variante que usa efetivamente o resumo dos cinco números, continua-se a construção
do boxplot traçando-se uma linha paralela à escala que vai de cada extremidade da caixa
ao correspondente valor extremo dos dados. É praxe traçarem-se essas linhas pelo meio
da caixa. Na figura abaixo, o mínimo é 3 e o máximo é 15.
Outra variante bastante comum, que é a que usamos nas atividades Conhecendo o
Boxplot e Construindo Boxplots, trata de forma especial os valores atípicos, que são
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15UNIVERSIDADE FEDERAL FLUMINENSE
INSTITUTO DE MATEMÁTICA
CONTEÚDOS DIGITAIS EM MATEMÁTICA E ESTATÍSTICA
2
valores muito afastados da grande maioria dos dados. Suponhamos que, no nosso
exemplo, todas as observações sejam menores que ou iguais a 10, e apenas uma
observação seja igual a 15. Então 15 é um valor atípico. A variante do boxplot
representaria esses dados da seguinte forma:
Há diferentes opções para se estabelecerem os limites que separam os valores atípicos.
Mas estabelecida uma regra, os valores que se encontram entre esses limites são
chamados valores adjacentes e aqueles fora dos limites são chamados valores extremos
ou atípicos.
Cálculo dos quartis
Dada a escala de mensuração dos dados, os quartis são valores nessa escala que dividem
o conjunto de dados em quatro partes, todas elas com o mesmo número de observações.
Isso significa que 25% das observações são menores que o primeiro quartil, 50% são
menores que o segundo quartil e 75% são menores que o terceiro quartil. Note que
estamos falando de escala, de ordem. Assim, para calcularmos os quartis, temos que
ordenar os dados.
O cálculo se inicia com a mediana, ou segundo quartil – ela é o “valor do meio”, o valor
que deixa metade das observações abaixo e a outra metade acima.
Consideremos o conjunto de dados que gerou o boxplot acima; há 18 observações.
A mediana divide o conjunto em duas partes, cada uma com 9 observações.
A mediana será, então, a média dos dois valores centrais:
Q2 = + = 6,5 7,5 7,0 2
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
×
Ordem 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Valor 3,0 3,5 4,5 5,0 5,0 5,5 6,5 6,5 6,5 7,5 7,6 7,9 8,0 8,0 9,0 9,5 10,0 15,0
Ordem 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Valor 3,0 3,5 4,5 5,0 5,0 5,5 6,5 6,5 6,5 7,5 7,6 7,9 8,0 8,0 9,0 9,5 10,0 15,0UNIVERSIDADE FEDERAL FLUMINENSE
INSTITUTO DE MATEMÁTICA
CONTEÚDOS DIGITAIS EM MATEMÁTICA E ESTATÍSTICA
3
Um erro comumente cometido pelos alunos é considerarem a média das posições, e não
dos valores! Se assim fosse, todos os conjuntos de dados com 18 observações teriam a
mesma mediana 9,5...
O cálculo do primeiro e do terceiro quartis é feito calculando-se as medianas das duas
metades – o primeiro quartil é a mediana da metade inferior e o terceiro quartil é a
mediana da metade superior. Nesses cálculos despreza-se a mediana.
Para os dados acima, cada metade tem 9 observações. Logo, a mediana deixará 4
observações abaixo e 4 observações acima, ou seja, a mediana de cada uma dessas
partes será a quinta observação:
Q1 = 5,0
Q3 = 8,0
Consideremos outro conjunto de dados como exemplo:
Como há um número ímpar de observações (13), a mediana deixará 6 observações
abaixo e 6 observações acima dela. Logo, a mediana é a 7a
observação.
Q2 = 25,0
Ignorando
...