A MINERAÇÃO DE DADOS UTILIZANDO ÁLGEBRA LINEAR
Por: giovanaazevedo • 16/5/2019 • Trabalho acadêmico • 1.112 Palavras (5 Páginas) • 339 Visualizações
UNIVERSIDADE FEDERAL DE MINAS GERAIS [pic 1]
Instituto de Ciências Exatas
Cálculo Numérico
MINERAÇÃO DE DADOS UTILIZANDO ÁLGEBRA LINEAR
Giovana Azevedo Baeta da Costa
Matrícula: 2017015967
Belo Horizonte - 18/05/2018
Motivação e objetivo
O MESSIDOR, Métodos para Avaliar Segmentação e Técnicas de Indexação Dedicadas à Oftalmologia da Retina, é o assunto tratado neste trabalho e diz respeito a retinopatia diabética (RD), uma doença que afeta os pequenos vasos da retina, região do olho responsável pela formação das imagens enviadas ao cérebro. A retinopatia diabética é diretamente ligada ao tempo de duração da diabetes e ao descontrole da glicemia. Esses sistemas, baseados no processamento automático de imagens, consistem essencialmente em ferramentas para detectar e medir lesões comuns (como microaneurismas, exsudatos, hemorragias) e em técnicas de indexação e recuperação automatizadas aplicadas a bancos de dados de imagens.
Tendo em vista os inúmeros estudos já disponíveis, a questão principal é a avaliação com precisão e objetividade dos resultados obtidos até o momento, que está longe de ser resolvida devido à falta de um banco de dados amplo e adequado acessível à comunidade científica já que o tamanho dos bancos de dados disponíveis descritos na literatura é clinicamente inadequado para permitir esse tipo de avaliação.
Nesse contexto de imprecisão de resultados, dois métodos foram analisados e devem ser compreendidos:
- O método de Análise-Quantização de imagem que implementa algoritmos de segmentação para detectar e quantificar lesões elementares como microaneurismas, primeiro sinal não-ambíguo de Retinopatia Diabética, hemorragias e exsudatos cuja importância e localização são um bom marcador da gravidade da doença retiniana.
- O método para Recuperação Automatizada (a partir de um banco de dados de imagens anotadas) das imagens mais próximas da imagem da retina sob análise (imagem de solicitação). As imagens do banco de dados e a imagem da solicitação são indexadas pela definição de assinaturas.
A falta de banco de dados amplos, adequados e acessíveis é um problema de bastante relevância o que leva a uma motivação de fazer um trabalho a respeito dessa questão, podendo analisar os dados oferecidos de acordo com cada uma das variáveis a serem estudadas com o intuito de desenvolver a criação de grandes bancos de dados de imagens de retina e sua utilização para avaliar os vários algoritmos existentes.
Variáveis analisadas para a compreensão e elaboração do trabalho
- O resultado binário da avaliação de qualidade. 0 = qualidade ruim 1 = qualidade suficiente.
- O resultado binário da pré-triagem, onde 1 indica anormalidade retiniana grave e 0 sua falta.
- Os resultados da detecção de MA. Cada valor de recurso representa o número de MAs encontrados nos níveis de confiança alfa = 0.5 ,. . ., 1, respectivamente.
- Número de lesões com o diâmetro do ROI para compensar a imagem de diferentes tamanhos.
- Distância euclidiana do centro de a mácula e o centro do disco óptico para fornecer informações importantes sobre a condição do paciente. Este recurso também é normalizado com o diâmetro da ROI.
- O diâmetro do disco óptico.
- O resultado binário da classificação baseada em AM / FM.
- Etiqueta de classe. 1 = contém sinais de RD (Rótulo acumulativo para as classes 1, 2, 3 de Messidor), 0 = nenhum sinal de RD.
Metodologia
Para a realização deste trabalho foi escolhido um banco do “Machine Learning Repository” e o desenvolvimento de comandos no pacote estatístico R que gerassem uma saída com a relação de todos os alfas referentes a cada uma das variáveis disponíveis.
Foi gerado uma matriz que mostrava a disposição dos alfas das variáveis e analisando-a definimos os fatores mais relevantes. Estes são referentes às variáveis 15 (alfa = 6.6571277378), 16 (alfa = -6.1457241711),17 (alfa = 8.4147238641) e 18 (alfa = -6.3063102024). A partir dessas análises, percebi que a metodologia introduzida permeou cada uma das variáveis, revelando, de modo simples, as de maior importância para a noção sobre retinopatia diabética, seja para validar ou descartar a presença da doença.
...