TrabalhosGratuitos.com - Trabalhos, Monografias, Artigos, Exames, Resumos de livros, Dissertações
Pesquisar

Regressão Linear Multipla

Exames: Regressão Linear Multipla. Pesquise 860.000+ trabalhos acadêmicos

Por:   •  24/9/2013  •  1.474 Palavras (6 Páginas)  •  401 Visualizações

Página 1 de 6

REGRESSÃO LINEAR MÚLTIPLA

1. INTRODUÇÃO

A regressão múltipla envolve três ou mais variáveis, portanto, estimadores. Ou seja, ainda uma única variável dependente, porém duas ou mais variáveis independentes (explanatórias).

A finalidade das variáveis independentes adicionais é melhorar a capacidade de predição em confronto com a regressão linear simples. Isto é, reduzir o coeficiente do intercepto, o qual, em regressão, significa a parte da variável dependente explicada por outras variáveis, que não a considerada no modelo.

Mesmo quando estamos interessados no efeito de apenas uma das variáveis, é aconselhável incluir as outras capazes de afetar Y, efetuando uma análise de regressão múltipla, por 2 razões:

a) Para reduzir os resíduos estocásticos. Reduzindo-se a variância residual (ERRO PADRÃO DA ESTIMATIVA), aumenta a força dos testes de significância;

b) Para eliminar a tendenciosidade que poderia resultar se simplesmente ignorássemos uma variável que afeta Y substancialmente.

Uma estimativa é tendenciosa quando, por exemplo, numa pesquisa em que se deseja investigar a relação entre a aplicação de fertilizante e o volume de safra, atribuímos erroneamente ao fertilizante os efeitos do fertilizante mais a precipitação pluviométrica.

O ideal é obter o mais alto relacionamento explanatório com o mínimo de variáveis independentes, sobretudo em virtude do custo na obtenção de dados para muitas variáveis e também pela necessidade de observações adicionais para compensar a perda de graus de liberdade decorrente da introdução de mais variáveis independentes.

2. O MODELO MATEMÁTICO

A equação da regressão múltipla tem a forma seguinte:

Yc = a + b1x1 + b2x2 + ... + bkxk, onde:

 a = intercepto do eixo y;

 bi = coeficiente angular da i-ésima variável;

 k = número de variáveis independentes.

ou, como define WONNACOTT (1981, p. 326):

Yi =  + xi + zi + ei

 é interpretado geometricamente como o coeficiente angular do plano, na medida em que nos deslocamos na direção do eixo dos X’s, mantendo Z constante:  é, assim, o efeito marginal da variável X sobre Y.

 é o coeficiente do plano na medida em que nos movemos na direção do eixo dos Z’s, mantendo X constante:  é, assim, o efeito marginal da variável Z sobre Y.

Enquanto uma regressão simples de duas variáveis resulta na equação de uma reta, um problema de três variáveis implica num plano, e um problema de k variáveis implica em um hiperplano.

Também na regressão múltipla, as estimativas dos mínimos quadrados são obtidas pela escolha dos estimadores que minimizam a soma dos quadrados dos desvios entre os valores observados Yi e os valores ajustados Yc.

3. INTREPRETAÇÃO DA REGRESSÃO “OUTROS FATORES SENDO IGUAIS”

Na regressão simples:

Na regressão múltipla:

4. COMPARAÇÃO ENTRE REGRESSÃO SIMPLES E REGRESSÃO MÚLTIPLA

Suponha uma investigação sobre os benefícios de um sistema de irrigação em determinada região. Ao considerar-se uma regressão simples para se estimar o volume da safra (Y) em função dos índices pluviométricos (r) de vários anos, encontrou-se a seguinte equação:

Y = 60 – 1,67r

Erro padrão do coeficiente b = 4,0

O coeficiente negativo estaria indicando que a chuva (índice pluviométrico) reduz a safra, sugerindo que há algo errado. Ao acrescentar-se a variável temperatura (t), efetuou-se uma regressão múltipla representada pela equação:

Y = 60 + 5,71r + 2,95t

Erro padrão dos coeficientes: b1 = 2,68 e b2 = 0,69

A precipitação pluviométrica tem, de fato, o efeito esperado de aumentar a safra, os outros fatores permanecendo iguais (isto é, quando a temperatura é constante).

Enquanto a regressão múltipla enfatiza e isola a relação direta e a regressão simples não o faz; ao invés disso, o coeficiente de regressão simples reflete os efeitos tanto diretos como indiretos (em nosso exemplo, o efeito direto positivo da precipitação pluviométrica sobre a safra, e seu efeito negativo indireto – o aumento do índice pluviométrico leva à redução da temperatura, que provoca uma redução na safra).

5. VARIÁVEIS BINÁRIAS (0-1)

5.1. Inclusão de Variáveis Binárias

Imagine uma investigação sobre a relação entre a aquisição de títulos do governo (B) e a renda nacional (Y). Observações anuais realizadas mostram que a relação dos títulos em função da renda acusa dois padrões distintos – um para o tempo de guerra e outro para o tempo de paz.

A relação normal de B para Y (reta inferior) está sujeita a uma mudança para cima (reta superior) durante o período de guerra (ver figura abaixo). Dessa forma, B deve ser relacionado com Y e com outra variável – a guerra (W).

W não representa uma série completa de valores, mas apenas dois: fixamos em 1 o seu valor para todo o período de guerra e em 0 para os anos de paz (W é uma variável do tipo 0-1 ou variável muda ou ainda variável DUMMY ou binária).

E(B) = 0 + Y + W

Onde:

W = 0, para os anos de paz  E(B) = 0 + Y

W = 1, para os anos de guerra  E(B) = 0 + Y + 

5.2. Tendenciosidade Causada pela Exclusão da Variável Muda

Pela análise da figura, pode-se observar que o fato de ignorarmos uma variável favorece a tendenciosidade e aumenta a variância residual.

Se deixarmos de calcular a regressão múltipla, incluindo a variável muda guerra, e calcularmos erroneamente a

...

Baixar como (para membros premium)  txt (9.7 Kb)  
Continuar por mais 5 páginas »
Disponível apenas no TrabalhosGratuitos.com