TrabalhosGratuitos.com - Trabalhos, Monografias, Artigos, Exames, Resumos de livros, Dissertações
Pesquisar

Linear Regression Scripts

Por:   •  19/4/2022  •  Exam  •  1.814 Palavras (8 Páginas)  •  189 Visualizações

Página 1 de 8

Métodos 7

Lauri L. Rauber

04/09/2020

O arquivo JTRAIN2 contém dados sobre um experimento de treinamento profissional para um grupo de homens. O programa começaria em janeiro de 1976 e se estenderia até meados de 1977. O programa acabou em dezembro de 1977. A ideia é testar se a participação no programa de treinamento profissional teve um efeito no desemprego e rendimentos de 1978.

library(mfx)

## Loading required package: sandwich

## Loading required package: lmtest

## Loading required package: zoo

##
## Attaching package: 'zoo'

## The following objects are masked from 'package:base':
##
##     as.Date, as.Date.numeric

## Loading required package: MASS

## Loading required package: betareg

library(readxl)
JTRAIN2 <- read_excel("C:/Users/Fernanda/OneDrive/Doutorado/PAD-520 - Métodos Quantitativos I/Bases de Dados/JTRAIN2.xlsx",
    col_names = FALSE)

## New names:
## * `` -> ...1
## * `` -> ...2
## * `` -> ...3
## * `` -> ...4
## * `` -> ...5
## * ... and 14 more problems

train<-JTRAIN2$...1     
age<-JTRAIN2$...2       
educ<-JTRAIN2$...3       
black<-JTRAIN2$...4
unem78<-JTRAIN2$...14
meses<-JTRAIN2$...19
unem74<-JTRAIN2$...12
unem75<-JTRAIN2$...13 
hisp<-JTRAIN2$...5
married<-JTRAIN2$...6

  1. A variável train é o indicador de treinamento profissional. Quantos homens na amostra participaram do programa de treinamento profissional? Qual foi o maior número de meses acumulado por um participante do programa?

sum(JTRAIN2$...1)

## [1] 185

summary(meses*JTRAIN2$...1)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
##   0.000   0.000   0.000   7.688  15.000  24.000

A amostra conta com 445 homens entrevistados sendo que destes 185 aderiram ao programa de treinamento profissional. Entre esses 185 homens o maior tempo de permanência no treinamento foi de 24 meses

  1. Estabeleça uma regressão linear de treino nas seguintes variáveis: unem74, unem75, age, educ, black, hisp e married. Estas variáveis são significativas conjuntamente em nível de 5%?

reg1<- lm(train~ unem74+unem75+age+educ+black+hisp+married)
summary(reg1)

##
## Call:
## lm(formula = train ~ unem74 + unem75 + age + educ + black + hisp +
##     married)
##
## Residuals:
##     Min      1Q  Median      3Q     Max
## -0.6024 -0.4196 -0.3437  0.5537  0.7669
##
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)  
## (Intercept)  0.338022   0.189445   1.784   0.0751 .
## unem74       0.020880   0.077294   0.270   0.7872  
## unem75      -0.095571   0.071902  -1.329   0.1845  
## age          0.003206   0.003403   0.942   0.3467  
## educ         0.012013   0.013342   0.900   0.3684  
## black       -0.081666   0.087732  -0.931   0.3524  
## hisp        -0.200017   0.116971  -1.710   0.0880 .
## married      0.037289   0.064404   0.579   0.5629  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.4917 on 437 degrees of freedom
## Multiple R-squared:  0.02238,    Adjusted R-squared:  0.006722
## F-statistic: 1.429 on 7 and 437 DF,  p-value: 0.1915

A regressão proposta não é significativa, pois o p-valor (0,19) rejeita a hipótese nula de que as variáveis conjuntamente são diferentes de zero. Assim o modelo não é adequado.

  1. Estime a versão Logit do modelo linear no item b. Calcule o teste de razão de verossimilhança para a significância conjunta de todas as variáveis. O que você conclui?

reg2<- glm(train~ unem74+unem75+age+educ+black+hisp+married,family = "binomial" (link =  "logit"))
summary(reg2)

##
## Call:
## glm(formula = train ~ unem74 + unem75 + age + educ + black +
##     hisp + married, family = binomial(link = "logit"))
##
## Deviance Residuals:
##     Min       1Q   Median       3Q      Max  
## -1.3619  -1.0414  -0.9154   1.2703   1.6892  
##
## Coefficients:
##             Estimate Std. Error z value Pr(>|z|)  
## (Intercept) -0.69175    0.78875  -0.877    0.380  
## unem74       0.08185    0.31936   0.256    0.798  
## unem75      -0.39392    0.29670  -1.328    0.184  
## age          0.01343    0.01413   0.950    0.342  
## educ         0.05145    0.05604   0.918    0.359  
## black       -0.33185    0.35965  -0.923    0.356  
## hisp        -0.86899    0.50297  -1.728    0.084 .
## married      0.15360    0.26566   0.578    0.563  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
##     Null deviance: 604.20  on 444  degrees of freedom
## Residual deviance: 594.06  on 437  degrees of freedom
## AIC: 610.06
##
## Number of Fisher Scoring iterations: 4

...

Baixar como (para membros premium)  txt (9.2 Kb)   pdf (98.6 Kb)   docx (15.6 Kb)  
Continuar por mais 7 páginas »
Disponível apenas no TrabalhosGratuitos.com