ATPS De Estatistica
Trabalho Escolar: ATPS De Estatistica. Pesquise 862.000+ trabalhos acadêmicosPor: • 17/11/2014 • 2.548 Palavras (11 Páginas) • 738 Visualizações
Ambiente Virtual de Aprendizagem
Disciplina: Estatística
ATPS DE ESTATÍSTICA – ETAPAS 01 E 02
NOME: Cleberson Oliveira
NOME: Goyca Vichi
NOME: Marcos Vinicius Rodrigues
Anhanguera Educacional
2º ANO – 4º Semestre
ETAPA 01
INTRODUÇÃO
Nesta etapa do trabalho iremos estudar, estatística descritiva, população e amostra, séries, dados, gráficos e distribuição de frequência usando como base os dados da empresa vendo o mundo.
DISSERTAÇÃO DOS TEMAS ABORDADOS
A estatística descritiva é um ramo da estatística que aplica varias técnicas para descrever e sumarizar um conjunto de dados, sendo que seu objetivo e resumir as principais características fazendo uso de tabelas, gráficos e resumos numéricos, analisando e interpretando os dados afim de extrais informações a respeito de uma população.
Algumas atribuições da estatística descritiva são obtenção ou coleta de dados, podendo ser feita através de um questionário ou observação direta, organização dos dados e obtenção de algumas informações como médias, proporções dispersões. Os conceitos básicos da estatística são população que seria o conjunto de todos os elementos sendo eles pessoas ou objetivo que interessam ao estudo de um fenômeno coletivo segundo alguma característica.
Por impossibilidade de dados, muitas vezes acabamos com observações limitadas referente a uma determinada pesquisa da população, e essa parte da população em estudo denominamos amostra, que tem como significado subconjunto de elementos extraídos de uma população, ou seja, conjunto de todas as observações das características em estudo efetivamente recolhida. Para que tudo ocorra corretamente é necessário que a amostra possua as mesmas características básicas da população no que diz respeito aos que desejamos pesquisar, sempre pontuando que a amostra deve sempre obtida por processos adequados e a técnica para isso chamamos de amostragem, sendo ela dividida em três partes.
A primeira delas é amostragem casual simples, sendo somente recomendado se a população for homogênea em relação a variável de interesse, sendo atribuídos números aleatórios aos elementos da população, e assim, os integrantes da amostra são selecionados e todos os elementos da população tem a mesma probabilidade de pertencer a mesma amostra.
A segunda denominada por amostragem estratificada, que é bastante comum que a população alvo dessa pesquisa seja heterogênea em relação a variável de interesse, as populações se divide em um subpopulações que chamamos de extrator, sendo que entre os extratos passa existir heterogeneidade, mais também a homogeneidade, afirmando que cada elemento da população pode pertencer apenas a um extrato.
A terceira denominação por amostragem sistemática, que é um processo probabilístico não aleatório, onde o critério de probabilidade se estabelece através da primeira unidade amostral. Neste processo a unidade amostral são selecionadas a partir de um esquema rígido e preestabelecida de sistematização, tendo como propósito cobrir a população em toda sua extensão, a fim de obter um modelo sistemático simples e uniforme.
Um dos objetivos da estatística é sintetizar os valores que uma ou mais variáveis podem assumir, podendo apresentar esses valores em tabelas e gráficos.
As tabelas podem ser denominadas e utilizadas de várias maneiras, séries estatísticas que consiste na apresentação das informações em formas de tabela objetivando sintetizar os dados observados e tornando os mais compreensivos, sendo elas classificadas em: séries temporal, cronologia e evolutiva que é a série em que os dados são observados segundo a época de ocorrência o tempo é variável e o fato e o local fixo; série geográfica ou de localização que é a série em que os dados são observados segundo a localidade de ocorrência, o local varia e o tempo e o fato são fixos; Série específica, os dados são agrupados segundo a modalidade de ocorrência, fato variável, tempo e local fixos; séria mista que é uma combinação de duas ou mais três tipos de séries anteriores.
Outra forma de representação de valores e utilizar os gráficos que tem por objetivo apresentar de forma rápida os resultados obtidos, existem várias maneiras de se representar os dados estatístico, sendo elas: gráfico em colunas ou barras, onde os dados são representados através de retângulos na vertical e horizontal; gráfico de setor, representados em círculos através de setores, utilizado para verificação de porcentuais na amostra ou população; gráfico de linha que é utilizado para verificar o comportamento de um variável ao longo do tempo, representando anos, meses, semestres e entre outros; diagramas de dispersão que é utilizado para verificar possíveis relações entre variáveis quantitativas; histograma que é a representação gráfica de uma distribuição de frequência que se denomina por um arranjo de valores que uma ou mais variáveis tomam em uma amostra, o primeiro trabalho para construção de uma tabela de frequência é a escolha da classe que são intervalos da variação variável. As classes são representadas de várias formas, uma delas é limite de classe, que nada mais é que os extremos de cada classe, outra forma é a amplitude de um intervalo de classe, que é a medida do intervalo que define a classe; amplitude total da distribuição, que é a diferença entre o limite superior da última classe e o limite inferior da primeira classe; amplitude amostra, que é a diferença entre o valor máximo e o valor mínimo da amostra; Ponto médio, que é o ponto que divide o intervalo de classe em duas partes iguais; Frequência simples, que é o número de observações correspondentes a esta classe ou este valor.
A estatística se divide em quatro tipos de frequência, sendo elas;
• Frequência absoluta
• Frequência relativa
• Frequência absoluta acumulada
• Frequência relativa acumulada
Um outro método utilizado na estatística são os dados. Denominamos de dados absolutos os dados coletados diretamente da fonte sem nenhuma operação que não seja contagem, denominamos de dados relativos os dados obtidos através da combinação de dados absolutos ou relativos com uma determinada operação que permita sua comparação com outros dados do mesmo tipo e são expressos por meio de coeficientes que é a razão entre a quantidade de uma determinada ocorrência pelo número total de ocorrências. Índice é a razão entre duas grandezas, onde uma grandeza não está contida na outra. Porcentagem é a descrição dos elementos de um conjunto de dados de forma integrada em relação a um valor padronizado. Taxas que é um coeficiente multiplicado por um múltiplo de 10 com objetivo de padronizar e tomar um determinado coeficiente mais fácil de se multiplicar.
3. DADOS DA LÂMPADA A E B
3.1 TEMPO DE VIDA ÚTIL DE DUAS MARCAS DE LAMPADA DE 100 WATTS (EM HORAS)
LAMPADA DA MARCA A LAMPADA DA MARCA B
684 697 720 773 821 819 836 888 897 903
831 835 848 852 852 907 912 918 942 943
859 860 868 870 876 952 959 962 986 992
893 899 905 909 911 994 1004 1005 1007 1015
922 924 926 926 938 1016 1018 1020 1022 1034
939 943 946 954 971 1038 1072 1077 1077 1082
972 977 984 1005 1014 1096 1100 1113 1113 1116
1016 1041 1052 1080 1093 1153 1154 1174 1188 1230
4. DISTRIBUIÇÃO DE FREQUÊNCIA COM INTERVALOS DE CLASSE MARCA A
ROL
LAMPADA DA MARCA A
684 697 720 773 821
831 835 848 852 852
859 860 868 870 876
893 899 905 909 911
922 924 926 926 938
939 943 946 954 971
972 977 984 1005 1014
1016 1041 1052 1080 1093
DISTRIBUIÇÃO DE FREQUENCIAS
LAMPADA DA MARCA A
Classe horas / vida util fi Fi fr Fr Xi
1 680 Ⱶ 750 3 3 7,5% 7,5% 715
2 750 Ⱶ 820 1 4 2,5% 10,0% 785
3 820 Ⱶ 890 11 15 27,5% 37,5% 855
4 890 Ⱶ 960 14 29 35,0% 72,5% 925
5 960 Ⱶ 1030 7 36 17,5% 90,0% 995
6 1030 Ⱶ 1100 4 40 10,0% 100,0% 1065
∑ 40 100,0%
4.1 DISTRIBUIÇÃO DE FREQUÊNCIA COM INTERVALOS DE CLASSE MARCA B
ROL
LAMPADA DA MARCA B
819 836 888 897 903
907 912 918 942 943
952 959 962 986 992
994 1004 1005 1007 1015
1016 1018 1020 1022 1034
1038 1072 1077 1077 1082
1096 1100 1113 1113 1116
1153 1154 1174 1188 1230
DISTRIBUIÇÃO DE FREQUENCIA
LAMPADA DA MARCA B
Classe horas / vida util fi Fi fr Fr Xi
1 815 Ⱶ 885 2 2 5,0% 5,0% 850
2 885 Ⱶ 955 9 11 22,5% 27,5% 920
3 995 Ⱶ 1025 13 24 32,5% 60,0% 1010
4 1025 Ⱶ 1095 6 30 15,0% 75,0% 1060
5 1095 Ⱶ 1165 7 37 17,5% 92,5% 1130
6 1165 Ⱶ 1235 3 40 7,5% 100,0% 1200
∑ 40 100,0%
5. HISTOGRAMA E POLÍGONO DE FREQUÊNCIA MARCA A
5.1 HISTOGRAMA E POLÍGONO DE FREQUÊNCIA MARCA B
6. OGIVA MARCA A
6.1. OGIVA MARCA B
2- ETAPA 2
2.1 Medidas de Posição e Dispersão
Medidas de posição são dados que nos orientam em relação a posição da distribuição em relação ao eixo horizontal do gráfico da curva de frequência. A medidas de posição amostrais/populacionais mais importantes são as médias aritmética simples e ponderada, moda e mediana.
Utilizamos a média aritmética simples quando as ocorrências não se distinguem por peso e importância, caso contrário devemos utilizar uma média ponderada.
A moda representa valores que são repetidos, podendo ser unimodal – quando apenas um valor se repete – bimodal, trimodal e plurimodal quando vários valores se repetem. Quando na ausência de moda dizemos amodal.
As principais medidas de dispersão são: variância, desvio padrão e o coeficiente de variação. Para identificar uma variável de forma completa deve-se adicionar uma medida numérica que mostre a variabilidade ou dispersão de seus valores. O conhecimento da dispersão dos valores é uma medida chave na análise estatística de uma variável.
2.2 Desafio
A respeito do estudo da vida útil das lâmpadas da marca A e B, podemos afirmar que:
I – o tempo médio de vida útil das lâmpadas A e B são respectivamente: 894,65 horas e
1003,35 horas. R: Incorreto (0).
II – comumente, as lâmpadas da marca A duram 852 horas e da as marca B 1.077 horas;
R: Correto (1)
III – o tempo mediano de vida útil para a lâmpada da marca A é 910 horas e para a lâmpada B é 1.015,5 horas;
R: Incorreto (0). Para a mediana das marcas A e B temos:
IV – de todas as medidas de tendência central obtidas no estudo de caso em questão, a média é a que melhor representa o tempo de vida útil da lâmpada da marca B;
R: Correto (1). Exceto se houvesse dados discrepantes muito fora da curva.
V – a moda é a melhor medida representativa para a sequência de dados referentes à
lâmpada da marca B;
R: Incorreto (0). “A moda é a única medida de tendência central que pode ser usada para descrever dados no nível nominal de medição. Mas quando trabalhamos com dados quantitativos, raramente ela é utilizada.” (LARSON; FARBER; 2010, p.57).
VI – a sequência de dados referentes à lâmpada da marca A apresenta uma forte
concentração de dados em sua área central;
R: Correto(1).
VII – a lâmpada da marca B possui uma distribuição assimétrica positiva;
R: Correto (1). Apresenta uma distribuição assimétrica à direita (positivamente assimétrica) pois a média 1018 é maior que que a mediana 1003,46. (LARSON; FARBER; 2010, p.61-62)
VIII – 75% dos valores apresentados na tabela 1, para a lâmpada da marca A, possuem um tempo de vida útil menor do que 971 horas;
R: Incorreto(0). A tabela apresenta 29 dados (de 40) com valores abaixo de 971 horas o que representa percentualmente 72,5%.
IX – 25% dos valores apresentados na tabela 1, para a lâmpada da marca B, possuem um tempo de vida útil maior do que 1.000 horas;
R: Incorreto(0). A tabela apresenta 24 dados (de 40) com valores acima de 1000 horas o que representa percentualmente 60%.
X – os gráficos Box-Plot para os dados amostrais da lâmpada da marca A e marca B são:
R: Correto (1).
Medidas Lâmpada A Lâmpada B
1º quartil 855 947,5
Mínimo 684 819
Mediana 916,5 1015,5
Máximo 1093 1230
3º quartil 971 1089
3- ETAPA 3
3.1 Probabilidade
Quando nos referimos a probabilidade, estamos falando exatamente das chances de um evento ocorrer diante da incerteza. É buscar uma previsibilidade em meio a fenômenos físicos. Pode-se calcular a probabilidade a partir de uma frequência que determinado dado aparece em uma coleta de dados. Podemos também usar um experimento aleatório que pode ser repetido várias vezes sob as mesma condições.
Utilizamos a probabilidade na administração na solução de conflitos e na tomada de decisões, além de permitir a obtenção de informações possíveis com base nos dados disponíveis, possibilitando-nos equacionar riscos desnecessários.
3.2 Desafio
Com o intuito de reconhecer o trabalho e dedicação dos funcionários, a importadora “Vendomundo” realiza, semestralmente, eventos de confraternização para seus colaboradores e familiares. Nessa festa, além de boa comida, bebida e música, acontecem também campeonatos de Poker.
Antes de iniciar o campeonato, o Dealer (a pessoa que distribui as cartas durante uma mão ou jogada) embaralha as cartas no mínimo três vezes. Involuntariamente, ao embaralhar a 1ª vez, três delas caíram sobre a mesa, viradas para baixo.
Sobre essas três cartas, podemos afirmar que:
I – a probabilidade de a 1ª carta ser um às, a 2ª carta ser uma figura e a 3ª carta ser um número é de 1,30317%;
R: Correto.
P(E)= 0,0130317 = 1,30317%;
II – a probabilidade de todas as cartas serem um valete é de 4%;
R: Incorreto.
P(E) = 0,000181 = 0,0181%
III – a probabilidade de que pelo menos uma delas seja uma carta de copas é de 58,647%
R: Correto.
Nenhuma ser copa:
P(E) = 100% - 41,353% = 58,647%
IV – a probabilidade de a 3ª carta ser de 7 de paus, sabendo que a 1ª carta é um 8 de espadas e a 2ª carta um rei de ouros é de 5,60412%
R: Incorreto.
P(E) = 0,02 = 2%
4- ETAPA 4
4.1 Correlação e Regressão Lineares
Correlação é um conjunto de variáveis quantitativas distintas. Quando duas variáveis estão ligadas por uma relação estatística, dizemos que existe correlação entre elas. Se houver uma correlação entre as variáveis, poderemos ter uma função matemática que caracteriza esta relação, com a regressão seremos capazes de determinar os parâmetros desta função
O instrumento empregado para a medida da correlação linear é o coeficiente de correlação. Esse coeficiente deve indicar o grau de intensidade da correlação entre duas variáveis e, ainda, o sentido dessa correlação sendo positivo ou negativo.
Já a regressão linear é uma análise estatística em que se pode verificar a existência de uma relação funcional numa variável dependente com uma ou mais variáveis independentes. Podemos utilizar um diagrama de dispersão para se avaliar o comportamento dos valores dependentes em função da variável independente.
4.2 Desafio A
A empresa “Vendomundo” é responsável pela importação de 20% das marcas que uma determinada cadeia de lojas de desconto de roupas femininas comercializa. Ao longo de 25 anos, essa cadeia de lojas ampliou sua participação de mercado aumentando o número de pontos de suas lojas no Brasil. Nunca foi utilizado um método sistemático para a seleção desses pontos. A seleção de pontos era baseada, principalmente, no que era considerado um bom aluguel ou uma boa localização. Neste ano, com um planejamento estratégico para abrir diversas lojas novas, foi pedido ao diretor de projetos especiais e de planejamento um método de previsão de vendas semanais para todas as novas lojas. Os dados a seguir representam as vendas semanais (em milhares de reais) e a área da loja (em metros quadrados) para a amostra de 14 lojas da cadeia:
Tabela 2 – Seleção de pontos de lojas.
Loja Vendas Semanais (em milhares de R$)
X Área (m2)
Y
1
2
3
4
5
6
7
8
9
10
11
12
13
14 7.394
7.823
13.363
19.168
6.865
11.174
7.351
5.411
10.983
5.821
21.439
15.235
23.621
8.205 160
153
262
516
120
225
122
102
293
141
479
424
543
279
Diagrama de Dispersão
4.3 Desafio B
A respeito dos dados amostrais apresentados na tabela 2, podemos afirmar:
I – o coeficiente de correlação de Pearson para os dados amostrais apresentados na tabela 2 é dado por r= 0,9566;
R: Correto. O Coeficiente de correlação linear de Pearson é 0,9566.
II – equação de regressão de mínimos quadrados para os dados apresentados na tabela 2 é dada por: Yx = 1694,7042 + 36,6921 X ;
R: Correto.
Digite y' = 1694.7042 +
X1 300 (36.6921 x300 )
Y' = 12702.3342
III – a média prevista de vendas semanais para uma loja que tenha 300 metros quadrados de área será de aproximadamente 12.700 (milhares de R$).
R: Correto.
Digite y' = 1694.7042 +
X1 300 (36.6921 x300 )
Y' = 12702.3342
IV – se as vendas da loja 7 forem iguais a 5.343 (milhares de R$), a média prevista de vendas semanais será de aproximadamente 500 metros quadrados.
R: Incorreto. Para vendas de 5.343 milhares são necessários aproximadamente 100 m² (99,43m²)
Yx 1694,704236,6921 X
5343 = 1694,7042+36,6921X
X= 99,43
7 BIBLIOGRAFIA
CRESPO, Antônio Arnot. Estatística Fácil. 19ª ed. São Paulo: Saraiva, 2009
www.matematica.com.br
www.ebah.com.br
...