Trabalho de Inteligência Artificial
Por: Laura Campos • 12/11/2021 • Trabalho acadêmico • 2.047 Palavras (9 Páginas) • 127 Visualizações
PROVA INTELIGÊNCIA ARTIFICIAL
Aluna: Laura Letícia Araújo Oliveira Campos
Matrícula: 20170025411
- - (1 Ponto) Para cada um dos agentes a seguir, desenvolva uma descrição completando a tabela abaixo sobre o ambiente de tarefas de cada um.
- Robô jogador de futebol, joga na posição de atacante.
- Agente de compras na Internet, agente de uma loja virtual de móveis.
- Robô explorador de Marte.
Agente | Medida de desempenho | Ambiente | Atuadores | Sensores |
Futebol | Fazer gols sem quebrar as regras do futebol, cumprir as táticas planejadas e saber lidar com jogadas dos outros jogadores. | Campos de futebol, outros jogadores de futebol e árbitros. | Braços e pernas articulados. | Detector de proximidade, sensores digitalizadores de imagem para o reconhecimento da bola e de outros jogadores. |
Internet | Vender o produto requisitado pelo cliente e obter o feedback positivo dos clientes em relação ao atendimento. | Site da loja. | Exibição de produtos disponíveis, atentimento aos pedidos com filtros dos clientes. | Filtragem de especificações dos produtos, reconhecimento de produtos que possuem um perfil propenso a realizar a compra. |
Marte | Reconhecimento, coleta e exploração do terreno marciano. | Planeta Marte. | Braços e pernas articulados, gancho para coleta de materiais e visores para o reconhecimento de imagens. | Detectores de proximidade, fotossensíveis, infravermelho, temperatura e dispositivos de captura de imagens. |
- - (1 Ponto) Diferencie os 4 tipos de aprendizado de máquina. Para tanto, escolha uma base de dados do Kaggle e explique como aplicar os 4 métodos nessa mesma base.
- Supervisionado: esse tipo de aprendizagem de máquina se baseia na previsão de uma variável dependente a partir de uma lista de variáveis independentes. As variáveis independentes serão: PH, Hardness, Solids, Chloramines, Sulfate, Conductivity, Organic_carbon, Trihalomethanes e Turbidity. Já a variável dependente é Potability.
Essa técnica de aprendizagem pode ser feita por algoritmos de classificação ou por algoritmos de regressão.
Classificação: a classificação dos dados pode ser feita utilizando o atributo alvo “Potability”, no qual será determinado se a água é potável ou não. Para isso, os valores das instâncias desse atributo são discretos, onde 0 representa “não potável” e 1 representa “potável”. Nesse algoritmo, a base de dados é dividida de modo que, em uma parte é realizado o treinamento e na outra, a classificação.
Regressão: para aplicar o método de regressão na base de dados adotada, será necessário realizar a transformação do atributo alvo para um valor contínuo. Nesse caso, a variável “Potability” assumirá valores contínuos em uma escala de 0 a 100, que representará em porcentagem, o quão potável a água é.
- Não-supervisionado: esse método é utilizado para encontrar uma representação mais informativa dos dados presentes na base escolhida. Para o caso da identificação da potabilidade da água, será realizado um clustering de acordo com as semelhanças presentes entre as instâncias dos atributos, isto é, um agrupamento, que determinará se a água é potável ou não. Por exemplo, pode-se dizer que um conjunto de PH alto, turbidez baixa e baixa presença de sólidos indique que a água é potável, logo, o algoritmo agrupará esses atributos, transformando-os em um cluster. Será assumido que o atributo alvo será 1 quando forem identificados similaridades entre as entradas de uma nova amostra com o cluster já existente. Nesse tipo de abordagem os atributos não possuem rótulos.
- Semi-supervisionado: esse método pode ser considerado como uma junção dos dois métodos citados anteriormente. Para a identificação da potabilidade de água, alguns atributos possuirão rótulos definidos e outros não. Os que não possuem rótulos definidos serão agrupados por similaridades.
- Reforço: esse método é baseado em um sistema de recompensa, com a obtenção de feedbacks de resposta. No caso da análise da potabilidade da água, o algoritmo irá absorver os atributos de entrada e indicar um atributo alvo, neste caso se a água é potável ou não. Caso a tentativa resulte em um feedback positivo, ou seja, caso o algoritmo tenha indicado um atributo alvo correto a partir das variáveis de entrada, as métricas utilizadas para esta determinação serão assumidas como corretas, e serão utilizadas como uma base para as próximas tentativas do algoritmo.
A base de dados selecionada para a resolução das seguintes questões foi “Drinking_Water_Probability”, disponível em: https://www.kaggle.com/artimule/drinking-water-probability.
- - (2,5 Pontos) Em um Jupyter Notebook (link do collab ou arquivo) analise a base de dados selecionada na questão anterior (no contexto SUPERVISIONADO) e calcule a matriz de correlação entre os atributos de entrada e o atributo-alvo. Selecione quais atributos continuariam em sua base, definindo um limiar de correlação e explicando sua escolha. Além disso, aplique o método de PCA e mostre os 5 e 10 componentes principais.
- Link do Colab:
https://colab.research.google.com/drive/1Gzckl1Qhvw9wTKmsfWrGBknLjQCNCY1b?usp=sharing
[pic 1]
Figura 1 - Matriz de Correlação
A matriz obtida a partir da base de dados escolhida se baseia no Coeficiente de Pearson, que mede o grau da correlação entre duas variáveis de escala métrica. Quanto maior for o valor absoluto do coeficiente, mais forte é a relação entre as variáveis. Como mostrado na matriz, quando um atributo é comparado com ele mesmo é indicado o valor absoluto 1, indicando uma relação linear perfeita entre as variáveis. Quando é indicado o valor 0, ou valores próximos a isso, é indicado que não há correlação entre os atributos verificados.
...