Árvore e Tabela de Decisão
Por: camila7lima • 13/5/2016 • Relatório de pesquisa • 571 Palavras (3 Páginas) • 517 Visualizações
Trabalho de Técnicas de Desenvolvimento de Projetos
Árvore e Tabela de Decisão
Introdução
Tanto árvore quanto tabela de decisão são técnicas de classificação que utilizam dados como base, bastante úteis para criar ou prever padrões. Veremos a seguir as características de cada um.
Tabela de Decisão
É uma ferramenta para descrever processos que define as ações executadas para cada combinação possível de valores resultantes de condições atreladas.
Em outras palavras, é um método usado para visualizar todas as ações que um processo possui, sempre se baseando no conjunto dos valores de cada atributo/condição que o processo possui.
Sua utilização é mais adequada para regras de negócio que possuem muitas condições, simplificando a visibilidade e tomada de decisões. Esse método é versátil, uma vez que seja necessário adicionar uma nova condição, basta incluir uma nova linha ou coluna. Uma vez que as condições forem atendidas, as ações que estão relacionadas a elas serão executadas.
Para criar uma tabela de decisão, alguns pontos devem ser observados:
- Identificar todas as condições e identificar todos os valores possíveis para cada condição;
- Cada condição deve ser inserida numa coluna (Todas as condições na mesma linha);
- Cria uma nova linha para cada Regra, sempre preenchendo os valores de cada condição (coluna) até o fim da linha;
- Identificar e definir a ação/classe de cada Regra estabelecida e apontá-la.
Exemplo de tabela de decisão:
[pic 1]
Imagem retirado do livro “Análise Estruturada Moderna”, página 54
Árvore de Decisão
Árvore de decisão é um método composto por Nós (atributos), Ramos (Valores possíveis dos atributos) e Folhas (Classificação para uma combinação de valores dos atributos), usada para classificação de dados.
Podem ser Descritivas, quando descrevem padrões ocorridos no passado, ou podem ser Preditivas, quando predizem probabilidades de ocorrência de cada classe (situação).
Um exemplo de utilização de Árvore Descritiva é no diagnóstico de doenças, onde baseado em registros de sintomas de um antigo paciente, um médico cria a árvore descritiva, com o intuito de pesquisá-la quando outros pacientes apresentarem os sintomas da árvore e medicá-los.
Já um exemplo de uso para Árvores Preditivas seria análise de mercado, onde ela é usada para prever a probabilidade de um negócio ser lucrativo.
Para a criação de uma árvore bem desenvolvida, deve-se eleger o melhor atributo para ser o primeiro nó, e esta eleição se dá pelo cálculo de algumas variáveis:
- Entropia – É o nível de incerteza/dúvida. Ausência de Padrão.
- Ganho de Informação (GI) – É a quantidade de redução na incerteza.
- Razão de Ganho - Razão do GI de um conjunto pela Entropia do Universo.
- GINI – Outra unidade de medida, similar ao GI, que mede nível de impureza de um atributo com relação à classe.
Hoje em dia existem algoritmos de Indução. Vejamos alguns deles:
- ID3 – Foi o primeiro algoritmo para indução de árvores de decisão e se baseia em busca gulosa, sempre procurando o melhor atributo para CADA nó. Sua limitação é lidar apenas com atributos categóricos não ordinais, nem apresenta forma para tratar valores desconhecidos. Para a escolha do melhor atributo, utiliza o GI.
- C4.5 – Surgiu a partir do ID3, de forma que melhorou vários aspectos: trata atributos categóricos, ordinais e contínuos, bem como apresenta método de poda e lida com valores desconhecidos. Utiliza a Razão de Ganho para seleção dos atributos.
- CART – (Classification and Regression Trees) induz tanto árvores de classificação (atributos categóricos), como árvores de regressão (atributos ordinais). Sua principal virtude é a grande capacidade de pesquisa de dados, bem como a simplicidade de suas árvores.
...