O BIG DATE NA PRÁTICA: RECONHECIMENTO DE AUTOMÓVEL
Por: mael66 • 10/12/2021 • Trabalho acadêmico • 1.849 Palavras (8 Páginas) • 109 Visualizações
UNIVERSIDADE DO VALE DO RIO DOS SINOS - UNISINOS
UNIDADE ACADÊMICA DE GRADUAÇÃO
CURSO DE ENGENHARIA DE PRODUÇÃO
ISMAEL DA COSTA BARCELLOS
BIG DATE NA PRÁTICA:
RECONHECIMENTO DE AUTOMÓVEL
SÃO LEOPOLDO, DEZEMBRO DE 2021
Ismael da Costa Barcellos
BIG DATE NA PRÁTICA:
Reconhecimento de automóvel
Trabalho apresentado para a disciplina de Métodos Heurístico em Sistemas Produtivos, pelo Curso de Engenharia de Produção da Universidade do Vale do Rio dos Sinos – UNISINOS, ministrada pelo(a) professor(a) Marcos Leandro Hoffmann Souza.
São Leopoldo, dezembro de 2021
SUMÁRIO
1 INTRODUÇÃO 3
2 OBJETO DE ESTUDO 4
3 COLETA DE DADOS 4
4 TRATAMENTO DOS DADOS 5
5 MODELAGEM DO MODELO PREDITIVO 7
6 ANÁLISE DOS RESULTADOS 9
7 CONCLUSÕES FINAIS 14
1 INTRODUÇÃO
Trabalho desenvolvido para compor a avalição do Grau B da disciplina de Métodos Heurístico para Sistemas Produtivos, com o intuito de apresentar os conhecimentos e habilidades desenvolvidos durante o curso do semestre. Consiste de um projeto de Big Data ponto-a-ponto, o seja, selecionar um problema e aplicar uma solução com as técnicas desenvolvidos em aula através da coleta, tratamento de dados e desenvolvimento de um modelo preditivo confiável com uma acurácia de 90% e uma taxa de acerto na matriz de confusão de aproximadamente 80% para todas as variáveis de saída do modelo.
Foi escolhido como objeto de estudo a coleta de dados, utilizando o aplicativo para celular Arduino Science Journal®, de quatro automóveis diferentes (Ford Ka 2011, Fiat UnoMille 2011, Chevrolet Corsa 2012 e Ford Fiesta 2013) percorrendo o mesmo itinerário com o mesmo condutor, afim de desenvolver um modelo que reconhecesse qual automóvel o condutor está conduzindo. Por fim foi alcançado um resultado satisfatório aplicando o algoritmo Decision Forest no qual atingiu um acurácia de 91%.
2 OBJETO DE ESTUDO
Para esse trabalho de disciplina foi escolhido a coleta de dados do deslocamento de quatro automóveis (Ford Ka 2011, Fiat UnoMille 2011, Chevrolet Corsa 2012 e Ford Fiesta 2013) em um mesmo percurso, de aproximadamente 4 km (figura 1), e com as mesmas condições climáticas, a saber, dia ensolarado no horário entre as 06 e 07 da manhã de um sábado.
[pic 1]
Figura 1- Percurso estudado
3 COLETA DE DADOS
Os dados foram coletados através do aplicativo para celular Arduino Science Journal® com o celular posicionado no piso do automóvel no lado do carona e sem o tapete. É importante ressaltar aonde foi posicionado o celular para a coleta dos dados pois em outra duas ocasiões, com o celular posicionado no banco do passageiro e outro no painel, os resultados no modelo preditivo foram inconclusivos pois o aplicativo não consegui coletar dados confiáveis para serem aplicados ao modelo. Outro aspecto importante a ressaltar são os sensores habilitados no aplicativo a saber:
- Acelerômetro linear - LinearAccelerometerSensor;
- Acelerômetro X - AccX;
- Acelerômetro Y - AccY;
- Acelerômetro Z - AccZ;
- Bússola - CompassSensor.
4 TRATAMENTO DOS DADOS
Após a coleta de dados através do aplicativo Arduino Science Journal®, os dados foram exportados em formato “csv”, e importado para o software R®, a fim de fazer um tratamento prévio dos dados, a importação foi feita utilizando o pacote “readr”. Em um segundo momento se preocupou-se em visualizar os dados, afim de poder determinar se todas as variáveis coletadas tinham o mesmo comportamento, através de histogramas para cada variável coletada de cada automóvel, para isso foi utilizado os pacotes “ggplot2” e “gridExtra”, conforme apresentados nos gráficos a seguir.
[pic 2]
Gráfico 1 – Dados coletados Ford Ka 2011
[pic 3]
Gráfico 2 – Dados coletados Fiat UnoMille 2011
[pic 4]
Gráfico 3 – Dados coletados Chevrolet Corsa 2012
[pic 5]
Gráfico 4 – Dados coletados Ford Fiesta 2013
Na visualização dos dados apresentou seis variáveis, sendo que a primeira variável foi acrescentada pelo aplicativo de coleta, a variável “timestamp”, sendo que a variável acrescida apresentou valores contínuos para as quatro coletas e por esse motivo foi descartada para ser aplicado no modelo preditivo. Após a variável “timestamp” ser descartada foi acrescentada uma coluna com a variável com o nome do automóvel no qual os dados foram coletados, no qual servira como variável de saída do modelo preditivo que se quer modelar.
Após feitas as manipulações básicas, foi criado um dataset consolidando os dados coletados para os quatro automóveis e em seguida foi exportado em um arquivo formato “csv” afim de ser utilizado para a modelagem do modelo preditivo utilizando a plataforma Microsoft Azure®.
5 MODELAGEM DO MODELO PREDITIVO
Com o arquivo consolidado exportado do software R® em formato “csv”, importou-se na plataforma Microsoft Azure®, afim de se modelar o modelo preditivo, no qual selecionou as colunas com as variáveis coletadas a saber:
- LinearAccelerometerSensor – dados coletados a partir do sensor acelerômetro linear.
- AccX - dados coletados a partir do sensor acelerômetro no eixo “X”.
- AccY - dados coletados a partir do sensor acelerômetro no eixo “Y”.
- AccZ - dados coletados a partir do sensor acelerômetro no eixo “Z”.
- CompassSensor - dados coletados a partir do sensor “Bússola”.
- Carro – variável separando os dados dos automóveis coletados.
Após os dados foram normalizados através da técnica MinMax, exceto a variável carro, por se uma string no qual o modelo se baseara para predizer qual automóvel está sendo guiado pelo condutor. Em seguido os dados foram separados em 80% treino e o restante para validação do modelo (Figura 2).
[pic 6]
Figura 2 – Configuração dos para treino
Após as etapas descritas, foi selecionados dois modelos preditivos no qual se submeteu os dados do estudo, por se tratar de um problema de classificação optou-se pelos modelos “Neural Network” e “Decision Forest” pois foi os modelos vistos em aula, no qual as configurações usadas foram as descritas na Figura 3.
...