TrabalhosGratuitos.com - Trabalhos, Monografias, Artigos, Exames, Resumos de livros, Dissertações
Pesquisar

Caixa

Tese: Caixa. Pesquise 862.000+ trabalhos acadêmicos

Por:   •  10/9/2014  •  Tese  •  1.443 Palavras (6 Páginas)  •  258 Visualizações

Página 1 de 6

O BOXPLOT

Ana Maria Lima de Farias

Departamento de Estatística (GET/UFF)

Introdução

O boxplot é um gráfico construído com base no resumo dos cinco números, constituído

por:

• Valor mínimo

• Primeiro quartil (Q1)

• Mediana (segundo quartil Q2)

• Terceiro quartil (Q3)

• Valor máximo

O gráfico é formado por uma caixa construída paralelamente ao eixo da escala dos dados

(pode ser horizontal ou vertical). Essa caixa vai desde o primeiro quartil até o terceiro

quartil e nela traça-se uma linha na posição da mediana. Essa caixa, que descreve os

50% centrais da distribuição, é comum a todas as variantes do boxplot. Pode-se

acrescentar também uma linha, paralela à linha da mediana, para indicar a média. Na

figura abaixo, Q1 = 5; Q2 = 7; Q3 = 8.

Na variante que usa efetivamente o resumo dos cinco números, continua-se a construção

do boxplot traçando-se uma linha paralela à escala que vai de cada extremidade da caixa

ao correspondente valor extremo dos dados. É praxe traçarem-se essas linhas pelo meio

da caixa. Na figura abaixo, o mínimo é 3 e o máximo é 15.

Outra variante bastante comum, que é a que usamos nas atividades Conhecendo o

Boxplot e Construindo Boxplots, trata de forma especial os valores atípicos, que são

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15UNIVERSIDADE FEDERAL FLUMINENSE

INSTITUTO DE MATEMÁTICA

CONTEÚDOS DIGITAIS EM MATEMÁTICA E ESTATÍSTICA

2

valores muito afastados da grande maioria dos dados. Suponhamos que, no nosso

exemplo, todas as observações sejam menores que ou iguais a 10, e apenas uma

observação seja igual a 15. Então 15 é um valor atípico. A variante do boxplot

representaria esses dados da seguinte forma:

Há diferentes opções para se estabelecerem os limites que separam os valores atípicos.

Mas estabelecida uma regra, os valores que se encontram entre esses limites são

chamados valores adjacentes e aqueles fora dos limites são chamados valores extremos

ou atípicos.

Cálculo dos quartis

Dada a escala de mensuração dos dados, os quartis são valores nessa escala que dividem

o conjunto de dados em quatro partes, todas elas com o mesmo número de observações.

Isso significa que 25% das observações são menores que o primeiro quartil, 50% são

menores que o segundo quartil e 75% são menores que o terceiro quartil. Note que

estamos falando de escala, de ordem. Assim, para calcularmos os quartis, temos que

ordenar os dados.

O cálculo se inicia com a mediana, ou segundo quartil – ela é o “valor do meio”, o valor

que deixa metade das observações abaixo e a outra metade acima.

Consideremos o conjunto de dados que gerou o boxplot acima; há 18 observações.

A mediana divide o conjunto em duas partes, cada uma com 9 observações.

A mediana será, então, a média dos dois valores centrais:

Q2 = + = 6,5 7,5 7,0 2

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

×

Ordem 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

Valor 3,0 3,5 4,5 5,0 5,0 5,5 6,5 6,5 6,5 7,5 7,6 7,9 8,0 8,0 9,0 9,5 10,0 15,0

Ordem 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

Valor 3,0 3,5 4,5 5,0 5,0 5,5 6,5 6,5 6,5 7,5 7,6 7,9 8,0 8,0 9,0 9,5 10,0 15,0UNIVERSIDADE FEDERAL FLUMINENSE

INSTITUTO DE MATEMÁTICA

CONTEÚDOS DIGITAIS EM MATEMÁTICA E ESTATÍSTICA

3

Um erro comumente cometido pelos alunos é considerarem a média das posições, e não

dos valores! Se assim fosse, todos os conjuntos de dados com 18 observações teriam a

mesma mediana 9,5...

O cálculo do primeiro e do terceiro quartis é feito calculando-se as medianas das duas

metades – o primeiro quartil é a mediana da metade inferior e o terceiro quartil é a

mediana da metade superior. Nesses cálculos despreza-se a mediana.

Para os dados acima, cada metade tem 9 observações. Logo, a mediana deixará 4

observações abaixo e 4 observações acima, ou seja, a mediana de cada uma dessas

partes será a quinta observação:

Q1 = 5,0

Q3 = 8,0

Consideremos outro conjunto de dados como exemplo:

Como há um número ímpar de observações (13), a mediana deixará 6 observações

abaixo e 6 observações acima dela. Logo, a mediana é a 7a

observação.

Q2 = 25,0

Ignorando

...

Baixar como (para membros premium)  txt (8.3 Kb)  
Continuar por mais 5 páginas »
Disponível apenas no TrabalhosGratuitos.com