Regressão Linear Simples
Trabalho Escolar: Regressão Linear Simples. Pesquise 862.000+ trabalhos acadêmicosPor: clararsn • 8/7/2013 • 1.115 Palavras (5 Páginas) • 856 Visualizações
REGRESSÃO LINEAR SIMPLES
1. INTRODUÇÃO
A regressão e a correlação são técnicas utilizadas para estimar uma relação que possa existir na população, enquanto as técnicas anteriormente estudadas (Medidas de Tendência Central e de Dispersão: Média, Desvio Padrão, Variância, etc.) servem para estimar um único parâmetro populacional.
A análise de correlação e regressão compreende a análise de dados amostrais para saber se e como duas ou mais variáveis estão relacionadas uma com a outra numa população.
A correlação mede a força, ou grau, de relacionamento entre duas variáveis; a regressão dá a equação que descreve o relacionamento em termos matemáticos.
Os dados para análise de regressão e correlação provêm de observações de variáveis emparelhadas. Na regressão pressupõe-se alguma relação de causa e efeito, de explanação do comportamento entre as variáveis. Ex. a idade e a altura de cada indivíduo; a alíquota de imposto e a arrecadação; preço e quantidade.
2. REGRESSÃO LINEAR
2.1. Introdução
A regressão linear simples constitui uma tentativa de estabelecer uma equação matemática linear (linha reta) que descreva o relacionamento entre duas variáveis.
Da mesma forma como usamos a média para resumir uma variável aleatória, a reta de regressão é usada para resumir a estimativa linear entre duas variáveis aleatórias (Lapponi, 1997, p.344).
Há diversas formas de utilização de equações de regressão:
Estimar valores de uma variável, com base em valores conhecidos da outra. Em situações em que as duas variáveis medem aproximadamente a mesma coisa, mas uma delas é relativamente dispendiosa, ou difícil de lidar, enquanto que a outra não.
Explicar valores de uma variável em termos da outra, ou seja, confirmar uma relação de causa e efeito entre duas variáveis.
Predizer valores futuros de uma variável. Ex. aplicar testes para avaliar o sucesso de um ingressante na escola ou no emprego.
2.2. A Equação Linear (a reta de regressão)
Principais características:
1) O coeficiente angular da reta é dado pela tangente da reta e se denomina “b”.
2) A cota da reta em determinado ponto é o coeficiente linear denominado “a”, que é o valor de Y quando X=0.
Fórmula:
Nesse modelo se verifica que: (Lapponi, p. 345)
1) Para um valor Xi podem existir um ou mais valores de Yi amostrados.
2) Para esse mesmo valor Xi se terá apenas um valor projetado .
3) Para cada valor de Xi existirá um desvio di (ou erro ei) dos valores de , conforme indicado nas figuras da apresentação.
4) Sempre teremos observações que não são pontos da reta.
2.3 Decisão por um tipo de relação
Nem todas as situações são bem aproximadas por uma equação linear.
Quando os dados não podem ser aproximados por um modelo linear, as alternativas são procurar um modelo não-linear conveniente, ou transformar os dados para a forma linear. Por exemplo, a conversão de uma ou de ambas escalas em logaritmos dá por vezes um modelo linear.
3. DETERMINAÇÃO DA EQUAÇÃO MATEMÁTICA
Na regressão, os valores y são preditos com base em valores dados ou conhecidos de x. A variável y é chamada variável dependente, e a variável x, variável independente.
Que critério devemos aplicar para obter os valores dos coeficientes a e b?
Existem 2 critérios (Lapponi, p.345):
1) Ajustar um reta horizontal de valor igual à média dos valores de y, isto é, , pois a média é uma reta de regressão com b = 0.
2) Ajustar um reta que divida os pontos observados de forma que a soma dos desvios seja nula. No entanto, a simples soma dos desvios leva à compensação dos desvios positivos e negativos, como já se viu no cálculo da variância.
3.1. O método dos mínimos quadrados
O critério é encontrar os coeficientes a e b da reta de regressão que minimizem a soma dos quadrados dos desvios. (Lapponi, p. 346)
Características importantes:
1) A soma dos desvios verticais dos pontos em relação à reta é zero
2) A soma dos quadrados desses desvios é mínima (isto é, nenhuma outra reta daria menor soma de quadrados de tais desvios).
Simbolicamente, o valor que é minimizado é:
Onde:
yi = valor observado de y
yc = o valor calculado de y utilizando-se a equação de mínimos quadrados com o valor de x correspondente a yi.
Os
...