Linear Regression Scripts
Por: Laurí L. Rauber • 19/4/2022 • Exam • 1.814 Palavras (8 Páginas) • 175 Visualizações
Métodos 7
Lauri L. Rauber
04/09/2020
O arquivo JTRAIN2 contém dados sobre um experimento de treinamento profissional para um grupo de homens. O programa começaria em janeiro de 1976 e se estenderia até meados de 1977. O programa acabou em dezembro de 1977. A ideia é testar se a participação no programa de treinamento profissional teve um efeito no desemprego e rendimentos de 1978.
library(mfx)
## Loading required package: sandwich
## Loading required package: lmtest
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
## Loading required package: MASS
## Loading required package: betareg
library(readxl)
JTRAIN2 <- read_excel("C:/Users/Fernanda/OneDrive/Doutorado/PAD-520 - Métodos Quantitativos I/Bases de Dados/JTRAIN2.xlsx",
col_names = FALSE)
## New names:
## * `` -> ...1
## * `` -> ...2
## * `` -> ...3
## * `` -> ...4
## * `` -> ...5
## * ... and 14 more problems
train<-JTRAIN2$...1
age<-JTRAIN2$...2
educ<-JTRAIN2$...3
black<-JTRAIN2$...4
unem78<-JTRAIN2$...14
meses<-JTRAIN2$...19
unem74<-JTRAIN2$...12
unem75<-JTRAIN2$...13
hisp<-JTRAIN2$...5
married<-JTRAIN2$...6
- A variável train é o indicador de treinamento profissional. Quantos homens na amostra participaram do programa de treinamento profissional? Qual foi o maior número de meses acumulado por um participante do programa?
sum(JTRAIN2$...1)
## [1] 185
summary(meses*JTRAIN2$...1)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.000 0.000 0.000 7.688 15.000 24.000
A amostra conta com 445 homens entrevistados sendo que destes 185 aderiram ao programa de treinamento profissional. Entre esses 185 homens o maior tempo de permanência no treinamento foi de 24 meses
- Estabeleça uma regressão linear de treino nas seguintes variáveis: unem74, unem75, age, educ, black, hisp e married. Estas variáveis são significativas conjuntamente em nível de 5%?
reg1<- lm(train~ unem74+unem75+age+educ+black+hisp+married)
summary(reg1)
##
## Call:
## lm(formula = train ~ unem74 + unem75 + age + educ + black + hisp +
## married)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.6024 -0.4196 -0.3437 0.5537 0.7669
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.338022 0.189445 1.784 0.0751 .
## unem74 0.020880 0.077294 0.270 0.7872
## unem75 -0.095571 0.071902 -1.329 0.1845
## age 0.003206 0.003403 0.942 0.3467
## educ 0.012013 0.013342 0.900 0.3684
## black -0.081666 0.087732 -0.931 0.3524
## hisp -0.200017 0.116971 -1.710 0.0880 .
## married 0.037289 0.064404 0.579 0.5629
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.4917 on 437 degrees of freedom
## Multiple R-squared: 0.02238, Adjusted R-squared: 0.006722
## F-statistic: 1.429 on 7 and 437 DF, p-value: 0.1915
A regressão proposta não é significativa, pois o p-valor (0,19) rejeita a hipótese nula de que as variáveis conjuntamente são diferentes de zero. Assim o modelo não é adequado.
- Estime a versão Logit do modelo linear no item b. Calcule o teste de razão de verossimilhança para a significância conjunta de todas as variáveis. O que você conclui?
reg2<- glm(train~ unem74+unem75+age+educ+black+hisp+married,family = "binomial" (link = "logit"))
summary(reg2)
##
## Call:
## glm(formula = train ~ unem74 + unem75 + age + educ + black +
## hisp + married, family = binomial(link = "logit"))
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.3619 -1.0414 -0.9154 1.2703 1.6892
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -0.69175 0.78875 -0.877 0.380
## unem74 0.08185 0.31936 0.256 0.798
## unem75 -0.39392 0.29670 -1.328 0.184
## age 0.01343 0.01413 0.950 0.342
## educ 0.05145 0.05604 0.918 0.359
## black -0.33185 0.35965 -0.923 0.356
## hisp -0.86899 0.50297 -1.728 0.084 .
## married 0.15360 0.26566 0.578 0.563
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 604.20 on 444 degrees of freedom
## Residual deviance: 594.06 on 437 degrees of freedom
## AIC: 610.06
##
## Number of Fisher Scoring iterations: 4
...