O TESTE DE COEFICIENTE CORRELAÇÃO
Por: Andréia Crislane • 3/7/2019 • Trabalho acadêmico • 976 Palavras (4 Páginas) • 217 Visualizações
- TESTE DE COEFICIENTE CORRELAÇÃO
Os testes de hipóteses aplicados nas análises de regressão e correlação buscam verifica a possibilidade de aceitação da hipótese de nulidade dos coeficientes populacionais inferidos. Como nos procedimentos tradicionais dos testes hipóteses, devem ser seguidos os cincos passos:
- Definição das hipóteses nula e alternativa:
[pic 1]
[pic 2]
4. Valor de t pode ser calculado usando:
[pic 3]
Onde:
n - numero de observações
k – numero de variáveis explicativas
Como sempre a hipótese nula será rejeitada se o valor calculado for maior que o tabelado pela distribuição t-Student para o nível de significância α:
[pic 4]
Para os dados do município de Picuí, o teste de hipótese de nulidade do coeficiente pode ser visto a seguir:
[pic 5]
Para α=5%, gl= 12-3, temos:
[pic 6]
Assim, rejeitamos .[pic 7]
Através da tabela 1 é possível verificar que o valor de F de 72,48801 é maior que Ftab (5.715). Assim, o modelo é aceito com 95% de confiança.
TABELA 1- ANOVA | |||||
| gl | SQ | MQ | F | F de significação |
Regressão | 2 | 2544,254 | 1272,126975 | 72,48801 | 2,82197E-06 |
Resíduo | 9 | 157,9453 | 17,54948233 | ||
Total | 11 | 2702,199 |
|
|
|
Fonte: elaboração própria.
- MODELO
O modelo de regressão linear múltipla é composto por duas ou mais variáveis explicativas. Algebricamente, é dado pela seguinte expressão:
[pic 8]
Onde:
a= é o intercepto
(i=1,..., n) são os coeficientes de regressão.[pic 9]
(i=1,..., k) são as variáveis explicativas.[pic 10]
Com base, nos dados fornecidos pela tabela 2 chegou-se ao seguinte modelo:
[pic 11]
Tabela 2 - interseção, variável x1 e variável x2
| Coeficientes | Erro padrão | Stat t | valor-P | 95% inferiores | 95% superiores |
Interseção | -16,9179546 | 7,727223572 | -2,189396281 | 0,056306 | -34,39814871 | 0,562239598 |
Variável X 1 | 0,030274334 | 0,021340785 | 1,418613888 | 0,189699 | -0,018001875 | 0,078550542 |
Variável X 2 | 0,0171757 | 0,002592969 | 6,623951342 | 9,66E-05 | 0,011309997 | 0,023041403 |
Fonte: elaboração própria.
- COEFICIENTE DE DETERMINAÇÃO E COEFICIENTE DE DETERMINAÇÃO AJUSTADO
Na tabela 3 é possível verificar que o valor de r² do coeficiente de determinação é igual 0,941549337, ou seja, 94,15% da variação nos custo de distribuição está relacionada linearmente com variações de vendas e números de pedidos. Em outras palavras, as duas variáveis independentes utilizadas no modelo linear ajudam a explicar cerca de 94,15% da variação nos custo de distribuição, ficando por explicar 5,85 das outras variações.
O R² ajustado não necessariamente aumenta com a adição de parâmetros no modelo. Na verdade se as variáveis explicativas são incluídas no modelo R² ajustado desse modelo excederá R² ajustado do modelo com p variáveis apenas se a estatística parcial F para testar a significância dos adicionais s coeficientes passar de 1. Consequentemente, um critério para a seleção de um modelo ótimo é escolher o modelo que tem o R² ajustado máximo. O valor expresso na tabela 3 para o R² ajustado é de 0,9285603, ou seja, próximo a 1.
TABELA 3- Estatística de regressão | |
R múltiplo | 0,970334652 |
R-Quadrado | 0,941549337 |
R-quadrado ajustado | 0,9285603 |
Erro padrão | 4,189210227 |
Observações | 12 |
Fonte: elaboração própria.
- INTERVALO DE CONFIANÇA.
Um intervalo de confiança é um intervalo de valores de coeficientes de regressão para um dado valor estimado do coeficiente e um dado nível de probabilidade. A interpretação do intervalo de confiança é que ele é um intervalo que acreditamos que incluirá o parâmetro verdadeiro com nível de confiança especificado. Em nível de 95% de confiança, com base nos valores encontrados na tabela 2, os intervalos de confiança são:
...