O Relatório de Estatística
Por: Fernando117 • 23/4/2019 • Relatório de pesquisa • 2.965 Palavras (12 Páginas) • 232 Visualizações
SUMÁRIO
1. RESUMO 1
2. INTRODUÇÃO 2
3. OBJETIVOS 3
3.1. Objetivo Geral 3
3.2. Objetivos Específicos 3
4. PARTE EXPERIMENTAL 4
5. RESULTADOS E DISCUSSÃO 5
6. CONCLUSÃO 6
7. REFERÊNCIAS BIBLIOGRÁFICAS 7
8. ANEXOS 8
- RESUMO
- INTRODUÇÃO
A regressão e a correlação são duas técnicas estreitamente relacionadas que envolvem uma forma de estimação. A análise de correlação dá um número que resume o grau de relacionamento entre duas variáveis; a análise de regressão tem como resultado uma equação matemática que descreve o relacionamento.
O objetivo do estudo correlacional é a determinação da força do relacionamento entre duas observações. O termo “correlação” significa literalmente “co-relacionamento”, pois indica até que ponto os valores de uma variável estão relacionados com os da outra. A CORRELAÇÃO mede a força, ou grau, de relacionamento entre duas variáveis; a REGRESSÃO dá uma equação que descreve o relacionamento em termos matemáticos.
A regressão linear simples constitui uma tentativa de estabelecer uma equação matemática linear (linha reta) que descreva o relacionamento entre duas variáveis. A finalidade de uma equação de regressão seria então estimar valores de uma variável, com base em valores conhecidos da outra. Na regressão, os valores y são preditos com base em valores dados ou conhecidos de x. a variável y é chamada de variável dependente, e a variável x de variável independente.
3. OBJETIVOS
3.1 OBJETIVOS GERAIS
Esse projeto visa analisar as características descritivas e a relação entre a idade de pessoas (variável dependente) de uma determinada amostra, com o peso, cintura e txpul (variáveis independentes) dessa mesma amostra.
3.2 OBJETIVOS ESPECÍFICOS
- Identificar de maneira efetiva a correlação entre as variáveis;
- Calcular corretamente as medidas descritivas
- Construir diagramas de dispersão
- Determinar o coeficiente de correlação de Pearson
- Associar os coeficientes encontrados com o grau de relação entre as variáveis
- Utilizar programas computacionais que facilite os cálculos, a fim de obter resultados mais precisos, como, por exemplo, o Excel
- Cálculo das medidas descritivas para a variável dependente e suas interpretações.
4.1 cálculos das medidas descritivas para a variável dependente idade.
- A nossa variável dependente é a idade, em anos. Dados:
58 22 32 31 28 46 41 56 20 54 17 73 52 25 29 17 41 52 32 20 20 29 18 26 33 55 53 28 28 37 40 33 26 53 36 3 4 42 18 44 20
- Organizando esses dados em rol, temos:
17 17 18 18 20 20 20 20 22 25 26 26 28 28 28 29 29 31 32 32 33 33 34 36 37 40 41 41 42 44 46 52 53 53 54 54 55 56 58 73
- Cálculo a média (Ẍ):
[pic 1]
[pic 2]
- Mediana (Med):
[pic 3]
[pic 4]
[pic 5]
- Moda: é o valor que aparece com maior frequência.
Nesse caso temos, Moda = 20.
- Variância (s):[pic 6]
[pic 7]
[pic 8]
197,75[pic 9]
- Desvio padrão (s):
[pic 10]
[pic 11]
[pic 12]
- Amplitude (A):
[pic 13]
[pic 14]
- Coeficiente de variação (CV):
[pic 15]
[pic 16]
[pic 17]
4.2 Interpretações
A média e a mediana medem a tendência central da amostra. Nesse caso, foi possível determinar que a idade média da amostra é de aproximadamente 34 anos. A variância é uma medida de dispersão que mostra a heterogeneidade dos dados, ou seja, mostra o quão distante os valores estão da média, como encontramos um valor alto de 197,75; definimos que há muitos valores distantes da média (34.125). O valor do desvio padrão nos informa também dispersão dos dados e no caso, as idades variam, em média, 14 anos da média. O coeficiente de variação investiga mais a fundo a heterogeneidade dos dados e geralmente é expresso em porcentagem, quanto maior o C.V mais heterogêneo são os dados. Como encontramos o C.V valendo 36,06% pode-se observar uma grande dispersão dos valores das idades.
- Construção de diagramas de dispersão e Coeficientes de correlação dos pares de variáveis
Por meio da formula abaixo e do programa computacional chamada excel foi possível obter o resultado de cada coeficiente de correlação do pares escolhidos, que mede o grau da correlação (e a direcção dessa correlação - se positiva ou negativa) entre duas variáveis de escala métrica. Sendo a variável dependente a Idade e as variáveis independentes o peso, cintura e txpul as escolhidas.
[pic 18]
Além disso, com o auxílio do mesmo programa foi possível determinar os diagramas de dispersão para cada par escolhidos, mencionados anteriormente. Os diagramas de dispersão ou gráficos de dispersão são representações de dados de duas (tipicamente) ou mais variáveis que são organizadas em um gráfico. O gráfico de dispersão utiliza coordenadas cartesianas para exibir valores de um conjunto de dados. Os dados são exibidos como uma coleção de pontos, cada um com o valor de uma variável determinando a posição no eixo horizontal e o valor da outra variável determinando a posição no eixo vertical. Segue abaixo os gráficos de dispersão.
As tabelas usadas no excel para chegar a esses resultados estão em anexo na pagina --- desse relatório
Diagrama de dispersão da variável dependente idade em relação com a variável independente peso.
[pic 19]
[pic 20]
Diagrama de dispersão da variável dependente idade em relação com a variável independente cintura.
[pic 21]
[pic 22]
Diagrama de dispersão da variável dependente idade em relação com a variável independente txpul.
[pic 23]
[pic 24]
- Aplicação do teste de hipótese sob o coeficiente de correlação de Pearson.
Analisando os gráficos de dispersão e os coeficientes de correlações, observa-se que a variável explicativa X1 (peso) é que apresentou uma correlação positiva desprezível com a variável Y (idade), pois se encontra entre 0 e 0,3, apresentando um coeficiente de 0,2855. Enquanto X2 (cintura) apresentou uma correlação de 0,43, sendo considerado um coeficiente positivo e fraco, visto que está entre 0,3 e 0,5. Por fim, X3 (txpul) apresentou coeficiente negativo e desprezível de -0,12, estando estre 0 e 0,3. Desse modo, percebe-se que nenhuma variável explicativa está bem relacionada com a variável idade.
...