Mineração de Dados dos Cadastros da Clínica-Escola da UFPI
Por: waldeque neto • 20/8/2017 • Trabalho acadêmico • 2.077 Palavras (9 Páginas) • 260 Visualizações
Mineração de Dados dos Cadastros da Clínica-Escola da UFPI
Marina dos R. Barros¹, Vinicius P. Machado¹
Curso de Bacharelado em Ciência da Computação – Universidade Federal do Piauí (UFPI) – Campus Ministro Petrônio Portela
Teresina, PI - Brasil
marinareis.mr@gmail.com, vinicius@ufpi.edu.br
Abstract. The UFPI currently has a school clinic installed in dental block is a program created by teachers for restoration and maintenance of oral health of children aged zero to 36 months and users of the Unified Health System (SUS). These actions are developed by undergraduate students in Dentistry, UFPI, under the supervision and guidance of dental teachers of the course. Since the program was installed have already been carried out 35,420 visits and 17,233 records are stored patients number which makes the location and storage of records, as well as conducting scientific research.
Due to the difficulties of location and storage of registered records is being created a system, which aims to carry out the records of school-clinic patients, and maintain these records stored in the database.
This study aims to develop data mining in the system, with the dental database clinical-school UFPI, in order to discover socio-economic and cultural patterns related to oral diseases of children. The platform will be used in this work is known as Weka. This platform contains a set of machine learning algorithms and pre-processing data tools. It is designed so that it can quickly try methods in the new set of flexible ways data, providing extensive support for the entire experimental data mining process, including the preparation of the input data, the learning rate statistically schemes, and display the input data and results of learning.
Resumo. A UFPI conta atualmente com uma clínica-escola instalada no bloco de Odontologia, é um programa criado por professores para recuperação e manutenção da saúde bucal de crianças na faixa etária de zero a 36 meses e usuárias do Sistema Único de Saúde (SUS). Essas ações são desenvolvidas por alunos de graduação em Odontologia da UFPI, sob a supervisão e orientação de professores do curso de odontologia. Desde que o programa foi instalado já foram realizados 35.420 atendimentos e existem 17.233 prontuários de pacientes armazenados, número que dificulta a localização e armazenamento das fichas, assim como a realização de pesquisas científicas.
Devido a essas dificuldades de localização e armazenamento das fichas cadastradas, está sendo criado um sistema, que tem como objetivos realizar os cadastros dos pacientes da clínica-escola, e manter esses cadastros armazenados no banco de dados.
O presente trabalho tem o intuito de desenvolver a Mineração de dados no sistema, tendo como base de dados odontológica a clínica-escola da UFPI, com objetivo de descobrir padrões socioeconômicos e culturais relacionados às doenças bucais das crianças. A plataforma que será utilizada neste trabalho é conhecida como Weka. Esta plataforma contém um conjunto de algoritmos de aprendizado de máquina e ferramentas de pré-processamento de dados. Ele é projetado para que possa rapidamente experimentar métodos existentes no novo conjunto de dados de maneiras flexíveis, fornecendo suporte extensivo para todo o processo de mineração de dados experimental, incluindo a preparação dos dados de entrada, a aprendizagem de avaliar esquemas estatisticamente, e visualizar os dados de entrada e o resultado do aprendizado.
1. Motivação / Objetivo
Com a realização de alguns estudos, pressupõe-se que na clínica-escola da UFPI, as doenças bucais mais frequentes ocorrem devido à falta de cuidados necessários dos pais e familiares com a saúde bucal das crianças, isto pode estar relacionado a problemas socioeconômicos ou culturais das famílias. Como, os pais podem ser de baixa renda, o local precário onde moram, os costumes e tradições das famílias. Essas causas interferem nos cuidados necessários. O que também nota-se é que essas doenças podem ser evitadas, se cada família ensinar à criança a importância da saúde bucal, assim reduziria a quantidade de crianças doentes.
O propósito deste trabalho é descobrir o perfil das doenças bucais encontradas e se há correlações entre elas. Descobrir também as causas, para tentar prevenir as crianças desses tipos de doenças bucais.
2. Referência
Data mining mais conhecido como Mineração de Dados, consiste em um processo de descoberta de conhecimento é uma atividade complexa para identificação de padrões, revelando novas informações com potencialidade de uso e compreensão [Fayyad et al. 1996]. A interpretação de um grande volume de dados pelo ser humano é uma tarefa impraticável, devendo-se recorrer a ferramentas de Data Mining. Na Figura 1 temos uma visão geral do processo de descoberta de conhecimento.
[pic 1]
Etapas do Processo de Data Mining:
- Conhecimento do Domínio: Entendimento do domínio da aplicação, considerando aspectos como os objetivos dessa aplicação e as fontes de dados das quais se pretende extrair conhecimento.
- Pré-Processamento: Realiza uma seleção de dados a partir dessas fontes, de acordo com os objetivos do processo.
- Extração de Padrões: Tem como objetivo encontrar correlações dos dados.
- Pós-Processamento: Avalia o conhecimento quanto a qualidade e/ou utilidade para que, em caso positivo, seja utilizado para apoio de algum processo de tomada de decisão.
Para Tzerpos (2001), embora o desenvolvimento e aprimoramento de algoritmos de Aprendizagem de Máquina tenha sido foco de muitos pesquisadores, poucos trabalhos são relacionados à interpretação dos clusters formados. Muitos pesquisadores se preocuparam com os demais problemas e não têm demonstrado atenção necessária ao problema específico de melhor compreendê-los.
Nos últimos anos, grandes empresas multinacionais perceberam o potencial escondido em suas bases de dados, e investiram pesadamente em processos de descoberta de conhecimentos. Esta atitude permitiu a muitas delas ter um retorno de investimento vultuoso, em vista das informações relevantes escondidas nos padrões existentes em suas bases de dados.
A ferramenta Weka contém uma coleção de algoritmos de Aprendizagem de Máquina e ferramentas de pré-processamento de dados, projetada para que possa experimentar rapidamente os métodos existentes em novos conjuntos de dados de forma flexível. Ainda fornece suporte para todo o processo de mineração de dados experimental, incluindo a preparação dos dados de entrada, avaliação de sistemas de aprendizagem estatística, visualizar os dados de entrada e o resultado da aprendizagem. Essas ferramentas são acessadas através de uma interface em comum, de modo que seus usuários podem comparar diferentes métodos e identificar aqueles que são mais adequadas para o problema em questão [Witten et al. 2011].
...