Média E Covariância Amostrais
Dissertações: Média E Covariância Amostrais. Pesquise 862.000+ trabalhos acadêmicosPor: 34wagnerrodrigue • 21/3/2015 • 1.093 Palavras (5 Páginas) • 380 Visualizações
A média amostral ou média empírica e a covariância amostral são cálculos de estatística feitos a partir de uma coleta de dados em uma ou mais variáveis aleatórias. A média amostral é um vetor onde cada um dos elementos é a média da amostra de uma das variáveis aleatórias, ou seja, cada um dos elementos é a média aritmética dos valores observados de uma das variáveis. A matriz da covariância de amostra é quadrada, cujo i, j elemento é a covariância da amostra (uma estimativa da covariância da população ) entre os conjuntos de valores observados de duas das variáveis e cujo i, i elemento é a variância da amostra de valores observados de uma das variáveis . Se apenas uma variável teve valores observados , em seguida, a média da amostra é um único número (a média aritmética dos valores observados para a variável) e a matriz da covariância de amostra é simplesmente um único valor (a variância da amostra de valores observados de que variável).
Índice [esconder]
1 Média amostral
2 Covariância amostral
3 Discussão
4 Variância da média amostral
5 Amostras ponderadas
6 Crítica
7 Referências
Média amostral[editar | editar código-fonte]
Seja x_{ij} a i-ésima observação desenhada independentemente (i=1,...,N) no jth. Estas observações podem ser organizadas em N vetores coluna, cada um com entradas K e com K × 1 vetor coluna dando a ith observações de todas as variáveis sendo denotado \mathbf{x}_i (i=1,...,N).
A média do vetor da amostra \mathbf{\bar{x}} é um vetor coluna cujo j th elemento \bar{x}_{j} é o valor médio das observações N da j th da variável:
\bar{x}_{j}=\frac{1}{N}\sum_{i=1}^{N}x_{ij},\quad j=1,\ldots,K.
Assim, a média amostral do vetor contém a média das observações para cada variável, e é escrita:
\mathbf{\bar{x}}=\frac{1}{N}\sum_{i=1}^{N}\mathbf{x}_i.
Covariância amostral[editar | editar código-fonte]
A matriz da covariância amostral é definida por K-x - K matriz \textstyle \mathbf{Q}=\left[ q_{jk}\right] com entradas:
q_{jk}=\frac{1}{N-1}\sum_{i=1}^{N}\left( x_{ij}-\bar{x}_j \right) \left( x_{ik}-\bar{x}_k \right),
Onde, q_{jk} é a estimativa da covariância entre a variável jth e o kth variável da população subjacente aos dados.
Em termos dos vetores de observação, a covariância da amostra é:
\mathbf{Q} = {1 \over {N-1}}\sum_{i=1}^N (\mathbf{x}_i-\mathbf{\bar{x}}) (\mathbf{x}_i-\mathbf{\bar{x}})^\mathrm{T},
Por outro lado, organizando os vetores de observação como as colunas de uma matriz, de modo que
\mathbf{F} = \begin{bmatrix}\mathbf{x}_1 & \mathbf{x}_2 & \dots & \mathbf{x}_N \end{bmatrix},
que é uma matriz de linhas K e colunas N. Assim, a matriz de covariância de amostra pode ser calculada com:
\mathbf{Q} = \frac{1}{N-1}( \mathbf{F} - \mathbf{\bar{x}} \,\mathbf{1}_N^\mathrm{T} ) ( \mathbf{F} - \mathbf{\bar{x}} \,\mathbf{1}_N^\mathrm{T} )^\mathrm{T},
onde, \mathbf{1}_N é o “N” por 1 do vetor.
Se as observações são dispostas como as linhas, em vez de colunas, de modo que \mathbf{\bar{x}} é agora um 1 × K vetor linha e \mathbf{M}=\mathbf{F}^\mathrm{T} > é uma matriz × K N' j cuja coluna é o vetor de observações n na variável “j”, em seguida, transpomos os lugares rendimentos apropriados:
\mathbf{Q} = \frac{1}{N-1}( \mathbf{M} - \mathbf{1}_N \mathbf{\bar{x}} )^\mathrm{T} ( \mathbf{M} - \mathbf{1}_N \mathbf{\bar{x}} ).
Discussão[editar | editar código-fonte]
A média amostral e a matriz de covariância amostral são estimativas imparciais da média e a matriz de covariância do vetor aleatório \textstyle \mathbf{X} , um vetor linha cujos j th elemento (j = 1, ..., K) é uma das variáveis aleatórias. 1 . A matriz da covariância da amostra tem \textstyle N-1 no denominador, em vez de \textstyle N devido a uma variação na função de Bessel: Em suma, a covariância da amostra baseia-se na diferença entre cada observação e a média amostral, mas a média amostral é correlacionada com cada observação. Se a média da população ( \operatorname{E}(\mathbf{X}) )é conhecida, a estimativa imparcial análoga
q_{jk}=\frac{1}{N}\sum_{i=1}^N \left( x_{ij}-\operatorname{E}(X_j)\right) \left( x_{ik}-\operatorname{E}(X_k)\right), usando a média da população , temos \textstyle N no denominador.
Este é um exemplo do por que em probabilidade e estatística é essencial distinguir variável aleatória (letras maiúsculas) e o valor observado das variáveis aleatórias (letras minúsculas).
O valor máximo estimado
q_{jk}=\frac{1}{N}\sum_{i=1}^N \left( x_{ij}-\bar{x}_j \right) \left( x_{ik}-\bar{x}_k \right)
para a distribuição Gaussiana caso tem
...