O TRABALHO DE CONCLUSÃO DE CURSO
Por: Tatiane Cavalcante • 25/7/2022 • Trabalho acadêmico • 1.807 Palavras (8 Páginas) • 102 Visualizações
TRABALHO DE CONCLUSÃO DE CURSO - TURMA 2021
ORIENTAÇÕES
[pic 1]
Prezados alunos e alunas,
Nesse documento estão apresentadas as informações necessárias para o desenvolvimento do seu Trabalho de Conclusão de Curso. O TCC nos cursos de especialização da PUC Minas Virtual é um trabalho interdisciplinar. Nosso propósito é consolidar os conhecimentos aprendidos no curso, dando ao aluno mais uma oportunidade de colocá-los em prática em um contexto de trabalho.
No TCC você deverá desenvolver um projeto de Ciência de Dados passando por várias etapas, desde a definição do problema até a comunicação dos resultados.
- contexto e problema a ser abordado no TCC deve ser escolhido pelo aluno. Dessa forma, espera-se que os conhecimentos possam ser aplicados em um projeto alinhado com os interesses do aluno, mas que seja um problema REAL e RELEVANTE para sua organização ou para a sociedade. Nesse ponto, é importante ressaltar que, mesmo tendo a possibilidade de escolha do tema, o aluno deverá observar cuidadosamente e cumprir o conjunto de requisitos e as restrições técnicas que fazem parte deste trabalho, descritos no item “Escopo do Trabalho”. Uma observação importante: o TCC que você está desenvolvendo é um trabalho de Ciência de Dados, e não um trabalho de BI ou de Inteligência Artificial. Tenha isso em mente ao pensar em seu tema.
Os itens que devem ser produzidos para o fechamento da disciplina são descritos no item “O que deve ser entregue”? que fica ao final deste documento.
O trabalho deve ser feito individualmente.
Em nosso modelo de especialização, não há a orientação acadêmica/metodológica através de um professor orientador. Você irá elaborar um relatório técnico utilizando o template disponibilizado no Canvas. Leia esse documento com muita atenção. Junto ao template e ao conjunto de TCCs de exemplos disponibilizados no Canvas, você terá todas as informações necessárias para desenvolver um excelente trabalho. Em caso de dúvidas sobre as regras ou procedimentos do TCC, o aluno deve enviar uma mensagem no Fórum de Discussões da disciplina. Desta forma, espera-se que este espaço sirva de orientação para todos os alunos, uma vez que todos terão acesso às perguntas realizadas pelos colegas e os esclarecimentos sobre elas.
ESCOPO DO TRABALHO
[pic 2]
O diagrama a seguir mostra as etapas do desenvolvimento do seu trabalho.
[pic 3]
1. Definição do Problema
No seu TCC, primeiramente você deverá escolher um PROBLEMA REAL de seu interesse em qualquer área: transporte, economia, consumo, educação, saúde, etc. Você tem liberdade para escolher o tema que achar mais interessante, mas é importante que esse seja um problema RELEVANTE para sua organização ou para a sociedade. É muito importante que nessa primeira etapa você defina muito bem a pergunta que o seu trabalho vai responder. O problema/pergunta que você deseja resolver através de dados precisa ficar muito claro para as pessoas que lerão o seu relatório. Uma dica é utilizar o método dos 5 W’s1: why (por que), who (quem), what (o quê), when (quando) e where (onde).
2. Coleta de Dados
A partir da clara definição do seu problema, você deve agora buscar os dados que ajudem a responder a sua pergunta. Como sugestão para obtenção de datasets, você pode buscar em sites
[pic 4]
- Para mais informações sobre o método dos 5 Ws leia o artigo do Medium “Afinal, como se desenvolve um projeto de Data Science?” e o “Remember de 5 W’s”. Vale também dar uma olhada no artigo “How to define your Machine Learning Problem”
2
como o Kaggle, o famoso repositório de dados da Universidade da Califórnia em Irvine (UCI), os dados abertos do governo federal (dados.gov.br) ou de governos de outros países (EUA – data.gov, Reino Unido – data.gov.uk). O artigo “Best Public Datasets for Machine Learning and Data Science” dá excelentes dicas de repositórios de dados.
Para o seu TCC, você deverá utilizar múltiplas fontes de dados. Ou seja, você deve usar mais de um dataset de fontes diferentes, integrando-os, se possível, em uma única fonte de dados. Esse dataset resultante deve ter no mínimo mil registros, sem utilização de oversampling. Recomendamos fortemente que você utilize técnicas de Recuperação de Informação para obter dados na Web e assim enriquecer sua coleta. Essa recuperação pode ser feita utilizando ferramentas como o KNIME, por exemplo, ou através da biblioteca Beautiful Soup do Python.
Observação 1: caso você queira utilizar dados da empresa onde você trabalha, sugerimos que você remova ou camufle qualquer dado que identifique pessoas ou organizações.
Observação 2: você pode coletar tweets para criar seu próprio dataset, mas apenas se estes tweets forem enriquecidos com outros dados ou se forem utilizados para enriquecer outros datasets.
Observação 3: alguns provedores de informação, podem prover datasets divididos de forma temporal (por ano, meses, etc…). Ao avaliar o seu trabalho, esses datasets serão considerados como um único dataset.
...