Tratamento Estatístico De Dados
Trabalho Escolar: Tratamento Estatístico De Dados. Pesquise 862.000+ trabalhos acadêmicosPor: yara171929 • 23/1/2014 • 1.541 Palavras (7 Páginas) • 2.587 Visualizações
TRATAMENTO ESTATÍSTICO DE DADOS
1 CONCEITO
Conforme Kazmier, (2007, p. 13), estatística refere-se ao “[...] conjunto de técnicas usadas na coleção, análise e interpretação de dados”. No que se refere à Administração, a estatística funciona como uma ferramenta no auxílio ao processo de tomada de decisão, através da compreensão de fontes de variação e da identificação de padrões e de relacionamentos nos dados pesquisados (KAZMIER, 2007).
2 DADOS
Segundo Anderson; Sweeney; Williams (2011), e Kazmier (2007),os dados constituem fatos e/ou números coletados através de pesquisa, analisados e sintetizados para a apresentação e interpretação. Os dados coletados em um estudo em particular compreendem o conjunto de dados deste estudo.
• Elementos: são as entidades a respeito das quais se coletam dados. Ex: fornecedores, clientes, concorrentes, etc...
• Variável: é uma característica dos elementos que nos interessa. Pode ser discreta (pontos isolados; processo de contagem) ou contínua (pode assumir qualquer valor, mesmo decimal, em um intervalo; processo de medição). Ex: número de anos no mercado das empresas concorrentes, tempo que o cliente é fiel à marca, etc...
• Dados: obtidos através da coleta de medidas de cada variável de cada elemento.
Escalas de medição: ordinal (3; sim; 6,7; ...) ; intervalar (de X a Y).
Dados podem ser qualitativos (rótulos, nomes) ou quantitativos (expressos por valores numéricos).
Podem ser de seção transversal (coletados no mesmo intervalo de tempo, ou aproximadamente), ou de série histórica (dados coletados ao longo de diversos períodos).
Os dados podem ser obtidos através de fontes existentes (dados secundários) ou por meio de estudos experimentais concebidos para esse fim (dados primários).
Erros na obtenção de dados: durante a obtenção de dados, podem ocorrer erros relacionados à omissão, erros de registro ou de inconsistência. É importante que antes de iniciar a análise, o pesquisador realize uma triagem no material coletado.
Uma vez preparados os dados, o pesquisador deve proceder a uma análise preliminar, por meio da análise básica de dados, incluindo a distribuição de frequência, as tabulações cruzadas e o teste de hipótese (MALHOTRA, 1999).
3 ESTATÍSTICA DESCRITIVA
Informações compostas por dados sintetizados e apresentados de forma fácil de ser compreendida, podendo ser tabulares, gráficos ou numéricos (ANDERSON; SWEENEY; WILLIAMS, 2011).
Para dados Qualitativos:Métodos Tabulares (Distribuição de Frequência; Distribuição de Frequência Relativa; Distribuição de Frequência Percentual; Tabulação Cruzada) e Métodos Gráficos (Gráfico em Barras; Gráfico em Pizza).
Para dados Quantitativos: Métodos Tabulares(Distribuição de Frequência; Distribuição de Frequência Relativa; Distribuição de Frequência Percentual; Distribuição de Frequência Cumulativa; Distribuição de Frequência Relativa Cumulativa; Distribuição de Frequência Percentual Cumulativa; Tabulação Cruzada) e Métodos Gráficos (Gráfico de Dispersão Unidimensional – Dot Plat; Histograma; Ogiva; Apresentação de Ramo e Folhas; Diagrama de Dispersão).
3.1 DISTRIBUIÇÃO DA FREQUÊNCIA
Malhotra (1999, p. 400) conceitua a distribuição de frequência como “uma distribuição matemática que tem por objetivo obter uma contagem do número de respostas associadas a diferentes valores de uma variável, e expressar essas contagens em termos de percentagens”. A distribuição de frequência considera uma variável de cada vez.
3.1.1 Estatísticas associadas a distribuições de frequência
Conforme Malhotra (1999, p.402) “as estatísticas mais comuns associadas à distribuição de frequência são as medidas de posição (média, moda e mediana), as medidas de dispersão (intervalo, intervalo interquartil, desvio padrão e coeficiente de variação) e as medidas de forma (assimetria e curtose)”.
3.1.1.1 Medidas de posição
“As medidas de posição são medidas estatísticas de tendência central que descrevem uma posição dentro de um conjunto de dados.” (MALHOTRA,1999, p. 402).
Média aritmética simples ou simplesmente médiaé a medida de tendência central mais usada, é calculada somando-se os valores de todas as observações e dividindo-se essa soma pelo número de observações. (BARBETTA, 1999).
Mediana é o valor que divide o conjunto de dados em duas partes tais que abaixo e acima da mediana encontram-se 50% das observações. O cálculo da mediana requer que os dados estejam ordenados. Se o número de observações for ímpar, a mediana é o valor central; se o número de observações for par, a mediana é a média dos dois valores centrais. (BARBETTA, 1999).
Moda é o valor que ocorre com maior frequência em uma série de dados. Um conjunto é bimodal quando a série possuir dois valores com a mesma frequência máxima; multimodal se mais de dois valores ocorrerem com a mesma frequência máxima. E quando nenhum valor é repetido o conjunto não tem moda. (MALHOTRA, 1999).
3.1.1.2 Medidas de Dispersão
Para Malhotra (1999, p.403) “as medidas de dispersão consistem em medidas estatísticas que demonstram a dispersão de uma distribuição”.
Intervalo mede a dispersão dos dados. É basicamente a diferença entre o maior e o menor valor na amostra. Como tal, é diretamente afetado pelos valores extremos. (MALHOTRA, 1999). É dado pelo seguinte cálculo: Intervalo= Xmáximo – Xmínimo.
Intervalo interquartil é o intervalo de uma distribuição que abrange os cinquenta por cento intermediários das observações. É a diferença entre o 75º e o 25º percentis. Para um conjunto de dados dispostos em ordem de grandeza o p-ésimo percentil é o valor que tem p por cento dos dados abaixo dele e (100-p) por cento dos dados acima dele. Se todos os pontos dos dados forem multiplicados por uma constante, o intervalo interquartil será multiplicado pela mesma constante. (MALHOTRA, 1999).
Desvio padrão e variância: o desvio padrão é a diferença entre a média e um valor observado.
Variância é uma medida estatística de dispersão dos dados em torno da média de um conjunto de dados, é o quadrado do desvio
...