Comparação de técnicas de aprendizagem automática para o Diagnóstico da Doença da Soja
Por: Lazaro Ñ Sou Eu • 8/8/2017 • Relatório de pesquisa • 1.061 Palavras (5 Páginas) • 245 Visualizações
4º ano
UNIVERSIDADE KATYAVALA BWILA
INSTITUTO SUPERIOR POLITÉCNICO
TRABALHO DE APRENDIZAGEM AUTOMATICA
[Comparação de técnicas de aprendizagem automática para o Diagnóstico da Doença da Soja]
Ciências da Computação
Período – Regular
O Docente
Dr. Lazaro Makili
____________________
Benguela, Novembro de 2016
UNIVERSIDADE KATYAVALA BWILA
INSTITUTO SUPERIOR POLITÉCNICO
TRABALHO DE INTERFACES INTELIGENTES
[Comparação de técnicas de aprendizagem automática para o Diagnóstico da Doença da Soja]
Elaborado por:
Fernando Sapalolo
Lázaro Lukombo
Ciências da Computação
Período – Regular
O Docente
Dr. Lazaro Makili
____________________
Benguela, Novembro de 2016
Índice
Introdução: 4
Breve descrição do problema de estudo: 4
Formulação do problema: 4
Pré processamento: 4
Data mining: 5
Medida de desempenho: 6
Treinando algoritmos 7
Conclusão 9
Introdução
Entre os principais factores que limitam a obtenção de altos rendimentos em soja estão as doenças. Aproximadamente 40 doenças causadas por fungos, bactérias e vírus já foram identificadas no mundo. Esse número continua aumentando com a expansão da soja para novas áreas e como conseqüência da monocultura. A importância econômica de cada doença varia de ano para ano e de região para região, dependendo das condições climáticas de cada safra. As perdas anuais de produção por doenças são estimadas em cerca de 15% a 20%, entretanto, algumas doenças podem ocasionar perdas de quase 100%. Actualmente , a ferrugem da soja causada por um fungo é a maior ameaça potencial, preocupando tanto a pesquisa quanto os produtores pelos prejuízos que causa na Ásia e África onde ocorre há anos.
FORMULAÇÃO DO PROBLEMA
O desenvolvimento deste trabalho visa fazer uma comparação experimental de dois algoritmos de aquisição de conhecimento no contexto do desenvolvimento de um sistema especialista para diagnóstico de doenças da soja, e saber qual deles faz a melhor classificação das instancias.
BASE DE DADOS
A base de dados “soybean” foi retirada no repositório do Weka. Existem 35 atributos categóricos e 683 instancias, alguns nominais e alguns ordenados. O valor “dna” significa que não se aplica. Os valores para atributos são codificados numericamente, com o primeiro valor codificado como "0", o segundo como “1”, e assim por diante e existem 19 classes.
PRÉ-PROCESSAMENTO
• Limpeza de dados
É comum a existência de valores desconhecidos (“missing values”) nos dados, no qual torna-se muito importante o tratamento destes valores. Na base de dados em estudo, se verificou que não existe “missing values”, achamos que não afectaria nos resultados requeridos com os algoritmos estudados . Abaixo encontra-se parte do output do Weka.
DATA MINING: CLASSIFICADORES BAYSIANOS e Aprendizagem Baseada Instancias (KNN)
Nesta fase se faz aprendizagem do classificador, com vista
ao objectivo pretendido (descrever ou predizer). Como já
foi dito ao inicio, pretende-se induzir dois classificadores com vista a saber por meio de comparação qual faz melhor a detenção de doenças na soja. É portanto aqui que definimos o nosso objectivo, o modelo e o algoritmo de aprendizagem.Uma vez pretendido o classificador que prediga com alta precisão a dentenção de doenças na soja, para tal iremos construir um modelo de classificação
supervisionada.
...