Centro Federal de Educação Tecnológica Celso Suckow da Fonseca
Por: Jessica Iaghi de Almeida • 7/3/2017 • Trabalho acadêmico • 2.639 Palavras (11 Páginas) • 475 Visualizações
[pic 1] CEFET/RJ
Centro Federal de Educação Tecnológica Celso Suckow da Fonseca
Relatório final
Planejamento de experimentos
Regressão linear múltipla
Planejamento de experimentos
Curso: Engenharia de Produção
Professora: Caroline Ponce
Componente: Fernanda Antunes
Jéssica Iaghi
Milleny Nunes
- Regressão linear múltipla
Vamos analisar a correlação entre o desemprego, horas médias anuais de trabalho, pessoas que trabalham meio período e pessoas autônomas nos países abaixo, afim de descobrirmos se há alguma correlação.
a. Primeiramente inserimos os dados:
> Pais<-c("australia","austria","belgium","canada","republicacheca","dinamarca","finlandia","franca","alemanha","grecia","ungria","irlanda","italia","japao","corea","luxemburgo","holanda","novazelandia","noruega","polonia","portugal","slovakia","spain","suecia","suica","uk","us")
> desemprego<-c(4.8,4.8,8.2,6.3,7.1,3.9,7.7,9.2,9.8,8.9,7.5,4.4,6.8,4.1,3.5,4.8,3.9,3.8,3.5,13.8,7.7,13.4,8.5,7.0,4.0,5.3,4.6)
> partime<-c(27.1,17.3,19.3,18.1,3.3,18.1,11.4,13.3,21.9,7.5,2.7,19.9,14.9,24.5,8.8,12.7,35.5,21.3,21.1,10.8,9.3,2.5,11.1,13.4,25.5,23.4,12.6)
> autoemprego<-c(13,13.6,14.7,9.1,16.2,8.9,12.9,9,12.2,36.3,12.8,16.5,26.7,13.8,32.8,6.4,11,17.7,8.5,24.4,24.1,12.6,17.9,10,11.2,13.2,7.4)
> hmediaanual<-c(1714,1659,1571,1738,1997,1584,1721,1564,1436,2052,1989,1640,1800,1784,2357,1604,1391,1787,1407,1985,1758,1749,1764,1583,1659,1669,1797)
b. Utilizamos data.frame para uma melhor visualização destes dados:
> data.frame(Pais,desemprego,partime,autoemprego,hmediaanual)
Pais desemprego partime autoemprego hmediaanual
1 australia 4.8 27.1 13.0 1714
2 austria 4.8 17.3 13.6 1659
3 belgium 8.2 19.3 14.7 1571
4 canada 6.3 18.1 9.1 1738
5 republicacheca 7.1 3.3 16.2 1997
6 dinamarca 3.9 18.1 8.9 1584
7 finlandia 7.7 11.4 12.9 1721
8 franca 9.2 13.3 9.0 1564
9 alemanha 9.8 21.9 12.2 1436
10 grecia 8.9 7.5 36.3 2052
11 ungria 7.5 2.7 12.8 1989
12 irlanda 4.4 19.9 16.5 1640
13 italia 6.8 14.9 26.7 1800
14 japao 4.1 24.5 13.8 1784
15 corea 3.5 8.8 32.8 2357
16 luxemburgo 4.8 12.7 6.4 1604
17 holanda 3.9 35.5 11.0 1391
18 novazelandia 3.8 21.3 17.7 1787
19 noruega 3.5 21.1 8.5 1407
20 polonia 13.8 10.8 24.4 1985
21 portugal 7.7 9.3 24.1 1758
22 slovakia 13.4 2.5 12.6 1749
23 spain 8.5 11.1 17.9 1764
24 suecia 7.0 13.4 10.0 1583
25 suica 4.0 25.5 11.2 1659
26 uk 5.3 23.4 13.2 1669
27 us 4.6 12.6 7.4 1797
c. Fizemos o modelo de regressão linear múltipla
> modelo<-lm(hmediaanual~desemprego+partime+autoemprego)
> summary(modelo)
Call:
lm(formula = hmediaanual ~ desemprego + partime + autoemprego)
Residuals:
Min 1Q Median 3Q Max
-201.11 -75.02 -27.63 93.12 188.25
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1871.654 123.137 15.200 1.73e-13 ***
desemprego -22.255 9.780 -2.276 0.032499 *
partime -15.374 3.575 -4.301 0.000266 ***
autoemprego 16.322 3.267 4.995 4.72e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 117.7 on 23 degrees of freedom
Multiple R-squared: 0.7249, Adjusted R-squared: 0.689
F-statistic: 20.2 on 3 and 23 DF, p-value: 1.223e-06
Com 5% de nível de significância, o p_valor é muito alto na maioria dos casos. Não rejeitamos H0, logo a maioria dos coeficientes podem ser 0, exceto o desemprego. Concluindo que nosso parâmetro significativo é o “desemprego”, podemos dizer que quando nossa variável Xi1 aumenta em uma unidade, nosso Y diminuirá em 22,255.
d. Utilizando a ANOVA
> anova(modelo)
Analysis of Variance Table
Response: hmediaanual
Df Sum Sq Mean Sq F value Pr(>F)
desemprego 1 25099 25099 1.8127 0.1913
partime 1 468507 468507 33.8361 6.303e-06 ***
autoemprego 1 345529 345529 24.9545 4.717e-05 ***
Residuals 23 318467 13846
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Mais uma vez, a variável “desemprego” é a maior.
e. Pelo intervalo de confiança:
> confint(modelo)
2.5 % 97.5 %
...