Analise de Dados II Regressão Logística
Por: Cauê Borges • 6/4/2019 • Trabalho acadêmico • 1.462 Palavras (6 Páginas) • 158 Visualizações
Universidade Federal de Uberlândia
Anerzírio de Sousa Neto
11021ADM228
Luiz Sergio Marçal Dominguos
83216
Trabalho de Analise de Dados II
Regressão Logística
Uberlândia
2014
- Um resumo, com as suas palavras, do que é regressão logística e quais são suas características básicas. Qual a diferença da regressão logística e da regressão linear.
A regressão logística consiste em um modelo probabilístico que descreve a relação entre uma variável resposta Y (variável dependente) e uma ou mais variáveis explicativas X (variáveis independentes). Ela é utilizada quando a variável resposta é qualitativa, com dois resultados possíveis (Sim ou Não, por exemplo).
A regressão logística é semelhante à regressão linear, entretanto no modelo de regressão logística a variável resposta é binária, assumindo dois valores como 0 e 1 ("fracasso" e "sucesso").
B) Um exemplo, de um conjunto de dados, que possa ser aplicada a regressão logística simples.
Uma industria do ramo alimentício deseja lançar um novo refrigerante no mercado. É desejado que seus refrigerantes tenham certa necessidade que agrade ao gosto dos consumidores.
Para tanto foi feito um teste com 30 pessoas, a todas elas foi oferecida o refrigerante com uma quantidade especifica de açúcar, que variava entre 10 e 30mg/ml.
i) O gráfico de dispersão dos dados. .[pic 1]
ii) Uma tabela de frequência dos dados.
TABELA DE DISPERSÃO DE DADOS | |
Resultado | Mg de açúcar por ml de refrigerante |
1 | 23 |
0 | 19 |
0 | 16 |
1 | 20 |
1 | 22 |
1 | 26 |
1 | 21 |
0 | 22 |
0 | 11 |
1 | 27 |
0 | 19 |
1 | 22 |
0 | 19 |
1 | 27 |
0 | 10 |
0 | 15 |
1 | 21 |
1 | 29 |
1 | 30 |
0 | 11 |
0 | 19 |
1 | 20 |
1 | 23 |
1 | 19 |
0 | 17 |
0 | 19 |
0 | 16 |
1 | 21 |
0 | 15 |
1 | 28 |
iii) O gráfico da função logística. [pic 2]
iv) O gráfico da função logit. [pic 3]
[pic 4]
Obs: Elaboramos o gráfico da função Logit com e sem os pontos no gráfico, tem o mesmo sentido mas ficam com aparência diferente por causa dos intervalos necessários no gráfico.
v) Testar a significância dos coeficientes, utilizando o Teste de Wald e o Teste de Escore.
B0/DesvioB0 = -23.6562/10.512 = -2.2504 =98,75%
Portanto 98,75% > 5%, então rejeita-se H0
B1/DesvioB1= 1.1943/0.5292= -2.25 = 98.75%
Portanto 98,75% > 5%, então rejeita-se H0
Teste de escore
st=(sum((x)*(y-0.53)))/(sqrt(0.53*(1-0.53)*sum((x-20.23)^2)))
st=4.1383
vi) Descrever como, no programa R, você utilizou as matrizes e vetores, para encontrar os coeficientes e os desvios padrões desses coeficientes, utilizando a matriz de Fisher.
Para encontrarmos o desvio padrão, calculamos a Matriz de Fisher pela fórmula: I(β)=Xt.V.X
No programa R, criamos a Matriz X, sendo que a primeira coluna é preenchida com 1's e a segunda coluna com os valores de X.
Feito isso, criamos uma matriz V de (YxY), onde Y é o número de X que temos no exemplo. Preenchemos a matriz com 0. Somente na diagonal principal colocamos valores da fórmula já pré definida mi*(xi)*(1-pi(xi).
Após feitas as contas, encontramos uma diagonal quadrada que nos dá os valores das Variâncias e Covariâncias de β0 e β1. Após tirarmos as raízes quaradas, encontramos o Desvio Padrão.
vii) Conclusões que você pode tirar dos coeficientes e da função logística em relação ao modelo.
Concluímos então através das funções logística e logit, que o problema apresenta um limiar em aproximadamente 21 mg/ml açucar no refrigerante. Ou seja, com menos de 21mg/ml do de açucar no refrigerante, a probabilidade de aprovação do refrigerante é menor que 50 %. Já, acima disso, a probabilidade aumenta relativamente, sendo que com 24 mg/ml de açucar a aprovação sobe pra 99%
C) Estimar, no exemplo que você fez, a probabilidade de um ou dois eventos ocorrerem. O que podemos concluir dessa estimativa? O que as funções logística e logit podem dizer sobre o problema que você estudou no item b)?
...