Variaveis
Por: filipeprofano • 9/11/2015 • Relatório de pesquisa • 5.592 Palavras (23 Páginas) • 385 Visualizações
(Y) Produção de eletricidade (variável dependente)
(X1, X2, X3), as variáveis explicativas:
(X1) Importação de eletricidade
(X2) Exportação de eletricidade
(X3) Consumo de eletricidade
As medidas de Tendência Central são:
- Média: soma de todos os valores de uma dada amostra (correspondente neste caso à variável), a dividir pelo n (sendo n: números de casos possíveis).
- Moda: valor da variável que mais ocorre na distribuição (valor com maior frequência).
- estes valores não são verificados porque existem oscilações ao longo dos anos em causa, logo os números (valores) são todos diferentes (não quantificável).
- Mediana: valor que divide a distribuição em duas partes iguais (os dados têm que estar ordenados por ordem crescente ou decrescente) … se n for par, então soma-se os dois valores correspondentes e divide-se por dois (sendo n o valor de casos possíveis).
- Através do Excel, podemos dizer que as medianas são (depois dos valores devidamente ordenados):
Conclusões que podemos ter em conta:
Caracterização da Distribuição quanto à Simetria
(comparação das Medidas de Tendência Central):
Produção de Eletricidade: Média < Mediana
Logo, Distribuição enviesada à direita (Assimetria Negativa)
Importação de Eletricidade: Média > Mediana
Logo, Distribuição enviesada à esquerda (Assimetria Positiva)
Exportação de Eletricidade: Média > Mediana
Logo, Distribuição enviesada à esquerda (Assimetria Positiva)
Consumo de Eletricidade: Média < Mediana
Logo, Distribuição enviesada à direita (Assimetria Negativa)
Nota:
R-quadrado = 0,996498, este valor representa que 100% do modelo é explicado pelas variáveis explicativas … Y (Variável Dependente: Produção de Eletricidade)
p: verifica a significância das variáveis explicativas com uma confiança de 95%, tendo que ser esta inferior a 5%
rho: coeficiente de correlação
p (coeficiente de correlação) – parâmetro desconhecido (Estimação):
- o R estudado está associado a (p)
- com p diferente de zero: os testes permitem-nos dizer que as variáveis em estudo são significativas estatisticamente.
Logo, se:
- R = -1 (correlação linear negativa e perfeita)
- -1 < R < 0 (correlação linear negativa (mais forte quanto mais próxima de -1)
- R = 0 (correlação linear nula; as variáveis podem estar relacionadas por outro tipo de relação não linear)
- 0 < R < 1 (correlação linear positiva … mais forte quanto mais próxima de 1)
- R = 1 (correlação linear positiva e perfeita)
O resíduo é a melhor forma de abordar e quantificar o erro, sendo a variação entre os valores reais e os estimados
Diagrama de dispersão da variável dependente com a variável explicativa Consumo de Eletricidade
[pic 1]
Interpretação:
O diagrama de dispersão permite-nos dizer que não existe uma dispersão e oscilação significativa da variável explicativa Consumo de Eletricidade em relação à sua variável dependente (Produção de Eletricidade), porque os valores pelo que se observa são concentrados, centralizados e não aleatórios perante a reta de tendência definida pela Produção de Eletricidade.
Estimar o modelo de regressão linear múltipla:
A forma de estimar o modelo de regressão linear múltipla tem que ser a que reflita o fenómeno que se pretende modelar, este correlacionado com as variáveis explicativas
(relação entre três ou mais variáveis)
Y – Variável Dependente (Produção de Eletricidade Total)
X – Variáveis Explicativas:
X1 – Importação de Eletricidade
X2 – Exportação de Eletricidade
X3 – Consumo de Eletricidade
Método dos Mínimos Quadrados:
Modelo 3: Mínimos Quadrados (OLS), usando as observações 1991-2014 (T = 24)
Variável dependente: Produção de Eletricidade Total
| Coeficiente | Erro Padrão | rácio-t | valor p | |
const | 923,342 | 558,739 | 1,6525 | 0,11404 | |
Importação de Eletricidade | −1,07444 | 0,0710858 | -15,1147 | <0,00001 | *** |
Exportação de Eletricidade | 0,838382 | 0,0926462 | 9,0493 | <0,00001 | *** |
Consumo de Eletricidade | 1,0113 | 0,017011 | 59,4496 | <0,00001 | *** |
Média var. dependente | 37714,29 | D.P. var. dependente | 7396,912 | |
Soma resíd. Quadrados | 4406887 | E.P. da regressão | 469,4085 | |
R-quadrado | 0,996498 | R-quadrado ajustado | 0,995973 | |
F(3, 20) | 1897,064 | valor P(F) | 1,02e-24 | |
Log. da verosimilhança | −179,5020 | Critério de Akaike | 367,0041 | |
Critério de Schwarz | 371,7163 | Critério Hannan-Quinn | 368,2542 | |
Rho | 0,450363 | Durbin-Watson | 1,032805 |
Interpretar as estimativas obtidas quanto ao seu significado económico:
...