A Aproximação Normal da Distribuição Binomial
Por: Emmas • 31/3/2017 • Trabalho acadêmico • 1.587 Palavras (7 Páginas) • 1.000 Visualizações
2. TEORIA DE AMOSTRAGEM
II. Distribuição Amostral da Proporção
Aproximação normal da distribuição binomial
No capítulo anterior, vimos o Teorema Limite Central, que trata da distribuição da média amostral quando n →∞ . Esse teorema nos diz que, se X é uma população com média μ e variância σ2, então a distribuição amostral da média de uma amostra aleatória simples de tamanho n se aproxima de uma distribuição normal com média μ e variância σ2/ n quando n→∞.[pic 1]
Usando as propriedades da média e da variância, podemos estabelecer esse teorema em termos de , em vez de . Como Sn = n, então E(Sn) = nE() = nµ e V(Sn) = n2V() = n2 σ2/ n então, V(Sn) = nσ2 e isso nos dá o seguinte resultado.[pic 2][pic 3][pic 4][pic 5][pic 6]
Teorema Central do Limite:
Seja uma amostra aleatória simples de uma população X tal que E(X)=μ e V(X)=σ2. Então, a distribuição de converge para a distribuição normal com média nμ e variância nσ2 quando n→∞[pic 7][pic 8]
A variável aleatória binomial foi definida como “número de sucessos em n repetições independentes de um experimento de Bernoulli com parâmetro p”. Então, uma variável binomial é a soma de n variáveis independentes Be(p). Pelo teorema acima e usando o facto de que se X ∼Be(p) então E(X)= p e Var(X)=p(1−p), podemos dizer que a distribuição binomial com parâmetros n e p se aproxima de uma normal com média np e variância np(1−p) quando n→∞ . Alguns cuidados devem ser tomados na aproximação da binomial pela normal. Um fato importante a observar é que a distribuição binomial é discreta, enquanto a variável normal é contínua. Veja a figura que se segue. Aí o histograma representa uma v.a. X com distribuição binomial com n = 12 e p =0,5. Os retângulos, centrados nos possíveis valores de X, têm base 1 e altura igual a P(X = k), de modo que a área de cada retângulo é igual a P(X = k). A curva normal aí representada é de uma v.a. Y com média μ = 12×0,5 = 6 e variância σ2 = 12×0,5×0,5 = 3
[pic 9]
Figura 1: Aproximação normal da distribuição binomial
Suponha que queiramos calcular P(X ≥ 8). Isso equivale a somar as áreas dos 4 últimos retângulos superiores. Pela aproximação normal, no entanto, temos que calcular a área (probabilidade) acima do ponto 7,5, de modo a incluir os 4 retângulos. Assim,
P(X ≥8) ≈P(Y ≥7,5) = P() = P(Z ≥ 0.87) = 1 - P(Z≤0.87) = 0 ,1922.[pic 10]
O valor exato, calculado pela distribuição binomial, é P(X ≥8) = 0,1938.
A aproximação dada pelo teorema limite central é melhor para valores grandes de n. Existe a seguinte regra empírica para nos ajudar a decidir o que é “grande”:
A distribuição binomial com parâmetros n e p pode ser aproximada por uma distribuição normal com média μ = np e variância σ2 = np(1−p) se são satisfeitas as seguintes condições:
1. np ≥ 5
2. n(1−p) ≥ 5
Exercícios
Em cada um dos exercícios abaixo, verifique que as condições para aproximação da binomial pela normal são satisfeitas e calcule a probabilidade pedida usando a aproximação normal.
1. X∼B(18;0,4); P(X ≥15) e P(X<2)
2. X∼B(40;0,3); P(X<10) e P(25
3. X∼B(65;0,9); P(X ≥ 58)e P(60
4. X∼B(100;0,2); P(25≤X ≤35)
5. X∼B(50;0,2); P(X>26) e P(5≤X<10)
A distribuição amostral da proporção
Considere uma população em que cada elemento é classificado de acordo com a presença ou ausência de determinada característica. Por exemplo, podemos pensar em eleitores escolhendo entre 2 candidatos, pessoas classificadas de acordo com o sexo, trabalhadores classificados como desempregados ou não, e assim por diante. Em termos de variável aleatória, essa população é representada por uma v.a. de Bernoulli, isto é:
X = [pic 11]
Vamos denotar por p a proporção de elementos da população que possuem a característica de interesse. Então, P(X = 1) = p, E(X) = p e V(X) = p(1−p). Em geral, esse parâmetro é desconhecido e precisamos estimá-lo a partir de uma amostra. Suponha, então, que
dessa população seja extraída uma amostra aleatória simples com reposição. Essas n extrações correspondem a n variáveis aleatórias de Bernoulli independentes e, como visto, tem distribuição binomial com parâmetros n e p. Note que Sn dá o número total de “sucessos” nas n repetições, onde “sucesso”, neste caso, representa a presença da característica de interesse. Os valores possíveis de Sn são 0,1,2,...,n.Com relação à proporção de elementos na amostra que possuem a característica de interesse, temos que[pic 12][pic 13][pic 14]
(1)[pic 15]
e os valores possíveis de são 0, 1/n, 2/n, …, (n-1)/n, 1 com[pic 16]
(2)[pic 17]
Analisando a expressão (1), podemos ver que nada mais é que a média amostral de[pic 18]
Xi ∼Be(p), i=1,..., n.
Logo, o teorema de limite central se aplica com E(X) = p e V(X) = p(1−p),ou seja:
E() = p[pic 19]
V()= p(1−p) /n[pic 20]
Vemos, então, que a proporção amostral é um estimador não-viesado da proporção populacional p. A distribuição exata é dada pela expressão (2). Como a proporção amostral é uma média de uma amostra aleatória simples de uma população com distribuição de Bernoulli com parâmetro p, o Teorema Limite Central nos diz, então, que a distribuição da proporção amostral se aproxima de uma normal com média p e variância p(1−p)/n . Como essa aproximação é uma consequência directa da aproximação normal da binomial, as mesmas regras continuam valendo: a aproximação deve ser feita se np ≥ 5 e n(1−p ) ≥ 5.
...