O Trabalho Estatística
Por: fabiocheron • 22/1/2022 • Trabalho acadêmico • 2.714 Palavras (11 Páginas) • 90 Visualizações
Trabalho - Stata
3)
[pic 1]
Começamos com o Box-Plot da variável salário (em quantidade de salários mínimos). É possível verificar pelo gráfico que há uma quantidade grande de outliers, ou seja, indivíduos que ganham muito acima da mediana. A mesma situação não se verificar no outro lado, onde não há outliers, talvez pelo motivo da diferença do 1° e 3° quartil serem consideravelmente baixas, ou seja, há pouco espaço para outliers na parte inferior.
[pic 2]
Em relação aos anos de educação, é possível verificar que a quantidade de outliers é bem menor que em relação a observação anterior. Há outliers bem no limite da banda de máximo e de mínimo. Além disso, há muito mais outliers inferiores do que superiores. Isso ocorre devido ao fato de que a amplitude interquartílica é bem estreita e a posição dos quartis é bastante elevada, entre 10 e 15 anos de estudos.
[pic 3]
O Box-Plot de anos de experiência não possui outliers, já que o máximo é bastante distante dos quartis. Isso ocorreu devido a elevada amplitude interquartílica e a grande variedade de experiências de trabalho diferentes dos indivíduos.
[pic 4]
Outro box-plot com os quartis bem baixos, devido provavelmente a uma elevada quantidade de indivíduos com pouco tempo de trabalho na instituição atual. Este fato, combinado com outra estreita amplitude interquartílica origina uma considerável quantidade de outliers na parte superior, indivíduos bastante fiéis a sua instituição.
[pic 5]
O último box-plot mostra outro número bem pequeno de outliers, um bem no limite do máximo e outro solitário mais acima. Outra vez vemos o box-plot na extremidade inferior, com os indivíduos bastante concentrados na quantidade de dependentes. Neste caso, porém, a amplitude média originou um ponto máximo elevado, que diminuiu a quantidade de outliers.
5)
[pic 6]
Com a tabela consolidada de informações acima podemos verificar analiticamente as informações que foram utilizadas para plotar os gráficos. O indicador N sinaliza o número de observações em cada variável. Como temos 526 indivíduos na amostra e todos responderam as questões, temos 526 observações para todas as variáveis.
A segunda coluna, min, mostra a menor resposta de todos os indivíduos, ignorando os outliers extremos retirados no tratamento. É possível verificar números bem baixos para todas as variáveis, menos para tempo de educação, mostrando que até quem menos estudou terminou ou quase terminou, no mínimo, o primário.
Na última coluna temos o contrário da anterior, max, que mostra o maior valor de cada variável da amostra tratada. Pode-se analisar que há nesta amostra indivíduos com bastante tempo de mercado (49 – exper) e também bastante tempo em uma só empresa (31- tenure). Em salários e tempo de educação, pode-se chegar a números bastante elevados, como respectivamente 20 e 18, mostrando uma grande amplitude para os números mínimos.
Comparando a média (mean) e a mediana (p50), apura-se que, apesar de distantes em algumas situações, não há diferenças consideráveis nas variáveis, com exceção do tempo de empresa, tenure, que é possui uma média quase duas vezes e meia maior que a mediana. Isso mostra que há muito indivíduos com pouco tempo de empresa, porém, no extremo contrário há alguns outliers com muito tempo de organização que acabam puxando a média muito para cima.
As coluna Sd mostra o desvio padrão das variáveis, enquanto a coluna cv padroniza o indicador anterior em relação à média, trazendo desta forma uma visualização mais fiel no geral. Verifica-se que neste caso, as variáveis que mais se destacam são tenure e numdep (número de dependentes), que possuem cv > 1, e são, portanto, as variáveis com a maior variabilidade nas respostas dos indivíduos.
Por fim, as colunas p25 e p75 apresentam os primeiros e terceiros quadrantes das variáveis. Subtraindo os dois, verifica-se em que seção do espaço amostral está grande parte das respostas dos indivíduos (50%), ou seja, ou está a “parte do retângulo” nos gráficos box-plot acima. O que apresenta maior amplitude interquadrática, como vimos anteriormente, é a variável exper (26-5 = 19 em absolutos). A variável com a menor amplitude interquadrática relativa é educ, ou anos de educação (14-12, 2 em absolutos e 1/6 da mediana), mostrando que há pouca variabilidade de respostas e que os tempos de estudo são bastante concentrados.
7)
Branco |
|
|
|
| Média | Desvio Padrão | p-valor |
Salário | 5,9192370 | 3,62260000 | 0,3888 |
Educação | 12,66314 | 2,607941 | 0,0450 |
Experiência | 16,94915 | 13,57927 | 0,7559 |
Tempo de Empresa | 5,021186 | 7,042152 | 0,7430 |
N° dependentes | 1,008475 | 1,21558 | 0,0876 |
|
|
|
|
Não branco |
|
|
|
| Média | Desvio Padrão | p-valor |
Salário | 5,4759260 | 3,15542500 | 0,3888 |
Educação | 11,88889 | 3,271758 | 0,0450 |
Experiência | 17,55556 | 13,48747 | 0,7559 |
Tempo de Empresa | 5,351852 | 6,791108 | 0,7430 |
N° dependentes | 1,314815 | 1,489891 | 0,0876 |
Para avaliar os resultados para cada variável, neste caso, creio que seja relevante realizar uma comparação individual para os brancos e não brancos em cada variável. Analisa-se que os brancos possuem, em média, maior educação e maior salário. Possuem, entretanto, menor tempo de empresa e menor experiência profissional que os não brancos. Por fim, a maior diferença entre eles está no número de dependentes, já que os não brancos possuem cerca de 30% a mais, sendo a variável com a maior diferença entre as duas amostras.
...