A Inferência Estatística
Por: helena.bf. • 20/8/2017 • Artigo • 1.236 Palavras (5 Páginas) • 251 Visualizações
ESTATISTICA
CAP 1 – preliminares
Transformar dados em infos
Inferência pode ser dedutiva ou indutiva (por meio da qual se vai do específico ao geral).
A inferência estatística é uma das partes da Estatística: Esta é a parte da metodologia da Ciência que tem por objetivo a coleta, redução, análise e modelagem dos dados, a partir do que faz-se a inferência para uma população da qual os dados (a amostra) foram obtidos. Um aspecto importante da modelagem dos dados é fazer previsões, a partir das quais se podem tomar decisões.Na primeira parte deste livro estaremos interessados na redução, análise e interpretação dos dados.
AED= analise exploratória de dados- obter o maior numero de infos do dado, q indique modelos a serem utilizados para a analise confirmatória de dados
A diferença entre os dados e o modelo= resíduos
DADOS=MODELO+RESIDUO (D=M+R) M- parte suave/previsível R- parte aleatória
Cita alguns pacotes de programas de estatística para computador
Métodos gráficos: fins-(a)buscar padrões e relações;(b)confirmar (ou não) certas expectativas que se tinha sobre os dados;c)descobrir novos fenômenos;(d)confirmar (ou não) suposições feitas sobre os procedimentos estatísticos usados; e(e)apresentar resultados de modo mais rápido e fácil.
Capítulo 2 estudaremos como resumir os dados por meio de distribuições de freqüên-cias e como representá-los graficamente por meio de gráficos em barras, histogramas e ramo-e-folhas. No Capítulo 3 veremos as principais medidas numéricas resumidoras de um conjunto de dados: medidas de posição (ou localização) e medidas de dispersão(ou de variabilidade). A partir dessas medidas poderemos construir gráficos importantes,como o gráfico de quantis e o desenho esquemático (ou box plot )
CAP 2- analise de dados
Tipos de variáveis:
qualitativas= qualidades –> nominais= não existe ordenação / ordinal=existe uma ordem nos resultados
quantitativas= números resultantes de uma contagem ou mensuração -> discretas-resultam de uma contagem/ contínuas-cujos possíveis valores pertencem a um intervalo de números reais e que resultam de uma mensuração,como por exemplo estatura e peso de um indivíduo.
Para cada tipo de variável existem técnicas apropriadas para resumir as informações,donde a vantagem de usar uma tipologia de identificação.
variável dicotômica-só podem ocorrer duas realizações,usualmente chamadas sucesso e fracasso
Distribuição de frequências
maneira de se dispor um conjunto de realizações, para se ter uma idéia global sobre elas, ou seja, de sua distribuição.
A escolha dos intervalos é arbitrária e a familiaridade do pesquisador com os dados é que lhe indicará quantas e quais classes (intervalos) devem ser usadas. Entretanto,deve-se observar que, com um pequeno número de classes, perde-se informação, e comum número grande de classes, o objetivo de resumir os dados fica prejudicado. Estes dois extremos têm a ver, também, com o grau de suavidade da representação gráfica dos dados,a ser tratada a seguir, baseada nestas tabelas. Normalmente, sugere-se o uso de 5 a 15classes com a mesma amplitude.
Gráficos para variáveis qualitativas
gráficos em barras e de composição em setores (“pizza” ou retângulos)
gráficos para variáveis quantitativas
Além dos gráficos usados para as variáveis qualitativas, como ilustrado na Figura 2.4,podemos considerar um gráfico chamado gráfico de dispersão unidimensional, em que os valores são representados por pontos ao longo da reta (provida deuma escala). Valores repetidos são acompanhados por um número que indica as repetições.Outra possibilidade é considerar um gráfico em que os valores repetidos são “empilhados”,um em cima do outro. Pode-se também apresentar o ponto mais alto da pilha.
O histograma é um gráfico de barras contíguas, com as bases proporcionais aos inter-valos das classes e a área de cada retângulo proporcional à respectiva freqüência. Pode-seusar tanto a freqüência absoluta,ni, como a relativa,f i. Indiquemos a amplitude do i-ésimointervalo por ∆i. Para que a área do retângulo respectivo seja proporcional a fi, a sua alturadeve ser proporcional a fi / ∆i (ou a ni/ ∆i), que é chamadadensidade de frequência da i-ésima classe. Quanto mais dados tivermos em cada classe, mais alto deve ser o retângulo.Com essa convenção, a área total do histograma será igual a um.
Ramo-e-folhas
Um procedimento alternativo para resumir um conjunto de valores, com o objetivo de seobter uma idéia da forma de sua distribuição, é o ramo-e-folhas. Uma vantagem deste diagramasobre o histograma é que não perdemos (ou perdemos pouca) informação sobre os dados em si.
Não existe uma regra fixa para construir o ramo-e-folhas, mas a idéia básica é dividir cada observação em duas partes: a primeira (o ramo) é colocada à esquerda de uma linha vertical, a segunda (a folha) é colocada à direita.
A escolha do número de linhas do ramo-e-folhas é equivalente à escolha do número de classes de um histograma. Um número pequeno de linhas (ou de classes) enfatiza a parte M da relação
...