Regressão Linear Multipla
Exames: Regressão Linear Multipla. Pesquise 862.000+ trabalhos acadêmicosPor: jaider • 24/9/2013 • 1.474 Palavras (6 Páginas) • 428 Visualizações
REGRESSÃO LINEAR MÚLTIPLA
1. INTRODUÇÃO
A regressão múltipla envolve três ou mais variáveis, portanto, estimadores. Ou seja, ainda uma única variável dependente, porém duas ou mais variáveis independentes (explanatórias).
A finalidade das variáveis independentes adicionais é melhorar a capacidade de predição em confronto com a regressão linear simples. Isto é, reduzir o coeficiente do intercepto, o qual, em regressão, significa a parte da variável dependente explicada por outras variáveis, que não a considerada no modelo.
Mesmo quando estamos interessados no efeito de apenas uma das variáveis, é aconselhável incluir as outras capazes de afetar Y, efetuando uma análise de regressão múltipla, por 2 razões:
a) Para reduzir os resíduos estocásticos. Reduzindo-se a variância residual (ERRO PADRÃO DA ESTIMATIVA), aumenta a força dos testes de significância;
b) Para eliminar a tendenciosidade que poderia resultar se simplesmente ignorássemos uma variável que afeta Y substancialmente.
Uma estimativa é tendenciosa quando, por exemplo, numa pesquisa em que se deseja investigar a relação entre a aplicação de fertilizante e o volume de safra, atribuímos erroneamente ao fertilizante os efeitos do fertilizante mais a precipitação pluviométrica.
O ideal é obter o mais alto relacionamento explanatório com o mínimo de variáveis independentes, sobretudo em virtude do custo na obtenção de dados para muitas variáveis e também pela necessidade de observações adicionais para compensar a perda de graus de liberdade decorrente da introdução de mais variáveis independentes.
2. O MODELO MATEMÁTICO
A equação da regressão múltipla tem a forma seguinte:
Yc = a + b1x1 + b2x2 + ... + bkxk, onde:
a = intercepto do eixo y;
bi = coeficiente angular da i-ésima variável;
k = número de variáveis independentes.
ou, como define WONNACOTT (1981, p. 326):
Yi = + xi + zi + ei
é interpretado geometricamente como o coeficiente angular do plano, na medida em que nos deslocamos na direção do eixo dos X’s, mantendo Z constante: é, assim, o efeito marginal da variável X sobre Y.
é o coeficiente do plano na medida em que nos movemos na direção do eixo dos Z’s, mantendo X constante: é, assim, o efeito marginal da variável Z sobre Y.
Enquanto uma regressão simples de duas variáveis resulta na equação de uma reta, um problema de três variáveis implica num plano, e um problema de k variáveis implica em um hiperplano.
Também na regressão múltipla, as estimativas dos mínimos quadrados são obtidas pela escolha dos estimadores que minimizam a soma dos quadrados dos desvios entre os valores observados Yi e os valores ajustados Yc.
3. INTREPRETAÇÃO DA REGRESSÃO “OUTROS FATORES SENDO IGUAIS”
Na regressão simples:
Na regressão múltipla:
4. COMPARAÇÃO ENTRE REGRESSÃO SIMPLES E REGRESSÃO MÚLTIPLA
Suponha uma investigação sobre os benefícios de um sistema de irrigação em determinada região. Ao considerar-se uma regressão simples para se estimar o volume da safra (Y) em função dos índices pluviométricos (r) de vários anos, encontrou-se a seguinte equação:
Y = 60 – 1,67r
Erro padrão do coeficiente b = 4,0
O coeficiente negativo estaria indicando que a chuva (índice pluviométrico) reduz a safra, sugerindo que há algo errado. Ao acrescentar-se a variável temperatura (t), efetuou-se uma regressão múltipla representada pela equação:
Y = 60 + 5,71r + 2,95t
Erro padrão dos coeficientes: b1 = 2,68 e b2 = 0,69
A precipitação pluviométrica tem, de fato, o efeito esperado de aumentar a safra, os outros fatores permanecendo iguais (isto é, quando a temperatura é constante).
Enquanto a regressão múltipla enfatiza e isola a relação direta e a regressão simples não o faz; ao invés disso, o coeficiente de regressão simples reflete os efeitos tanto diretos como indiretos (em nosso exemplo, o efeito direto positivo da precipitação pluviométrica sobre a safra, e seu efeito negativo indireto – o aumento do índice pluviométrico leva à redução da temperatura, que provoca uma redução na safra).
5. VARIÁVEIS BINÁRIAS (0-1)
5.1. Inclusão de Variáveis Binárias
Imagine uma investigação sobre a relação entre a aquisição de títulos do governo (B) e a renda nacional (Y). Observações anuais realizadas mostram que a relação dos títulos em função da renda acusa dois padrões distintos – um para o tempo de guerra e outro para o tempo de paz.
A relação normal de B para Y (reta inferior) está sujeita a uma mudança para cima (reta superior) durante o período de guerra (ver figura abaixo). Dessa forma, B deve ser relacionado com Y e com outra variável – a guerra (W).
W não representa uma série completa de valores, mas apenas dois: fixamos em 1 o seu valor para todo o período de guerra e em 0 para os anos de paz (W é uma variável do tipo 0-1 ou variável muda ou ainda variável DUMMY ou binária).
E(B) = 0 + Y + W
Onde:
W = 0, para os anos de paz E(B) = 0 + Y
W = 1, para os anos de guerra E(B) = 0 + Y +
5.2. Tendenciosidade Causada pela Exclusão da Variável Muda
Pela análise da figura, pode-se observar que o fato de ignorarmos uma variável favorece a tendenciosidade e aumenta a variância residual.
Se deixarmos de calcular a regressão múltipla, incluindo a variável muda guerra, e calcularmos erroneamente a
...