Aprendizado Supervisionado
Por: Marco Moraes • 31/5/2016 • Relatório de pesquisa • 414 Palavras (2 Páginas) • 232 Visualizações
Aprendizado por reforço segundo Russell e Norvig (2010), é onde o agente aprende a partir de uma série de reforços. Por exemplo, a falta de um ponto no final da viagem dá ao agente táxi uma indicação de que fez algo errado. Dois pontos por uma vitória no final de um jogo de xadrez diz ao agente que ele fez a coisa certa.
Objetivo é premiar o agente sempre que ele tenha um bom desempenho e penaliza-lo sempre que fracasse.
Aprendizado Supervisionado Russell e Norvig (2010), no aprendizado supervisionado o agente observa alguns exemplos de entradas – pares de saídas e aprende uma função que mapeia entrada à saída. Por exemplo, no componente 1, as entradas são percepções e a saída são fornecidas por um professor, que diz “freia!” ou “vire à esquerda.” No componente 2, as entradas são imagens de uma câmera e as saídas novamente vem de um professor que diz “que é um ônibus.”, no componente 3, a teoria da travagem é um função dos estados de paragem em pés. Neste caso, o valor de saída está disponível diretamente a partir de percepções do agente (após o fato), o ambiente é o professor.
Aprendizado semi-supervisionado segundo Russell e Norvig (2010), é dado alguns exemplos rotulados e deve fazer o que pudermos de uma grande coleção de exemplos não marcados. Mesmo os rotulados em si não podem ser as verdades oraculares que nós esperamos. Imagine que você está tentando construir um sistema de adivinhar a idade de uma pessoa de uma foto. Você reunir alguns exemplos rotulados por tirando fotos de pessoas e pedindo sua idade. Isso é aprendizado supervisionado, mas na realidade, algumas das pessoas mentiram suas idades. Devido há ruído aleatório nos dados pelas idades falsas, as imprecisões são sistemáticas, e para descobri-las é um problema de aprendizado não supervisionado envolvendo imagens, idades auto-reportadas, e as verdadeiras idades (desconhecidas). Assim, tanto barulho e a falta de rótulo criam um contínuo entre aprendizado supervisionado e não supervisionado.
Aprendizado não-supervisionado segundo Russell e Norvig (2010), o agente aprende padrões na entrada, embora nenhum feedback explicito é fornecido.
Objetivo é descobrir padrões ou características nos dados de entrada, sem a ajuda de uma fonte.
Clustering segundo Russell e Norvig (2010), A tarefa mais comum de aprendizado não-supervisionado é o agrupamento: detecção de aglomeramento potencialmente úteis de exemplos de entrada. Por exemplo, um agente de táxi pode gradualmente desenvolver um conceito de “bons tráfegos” e “maus tráfegos” sem nunca ter sido dado exemplos rotulados de cada por um professor.
...