Resumo DeepXplore na Informática
Por: Silvio Quincozes • 27/9/2018 • Abstract • 640 Palavras (3 Páginas) • 180 Visualizações
DeepXplore: Automated Whitebox Testing of Deep
Learning Systems
(Resumo)
Silvio E. Quincozes
Computing Institute
Fluminense Federal University
Niteroi,´ Brazil
fsequincozesg@gmail.com
- RESUMO DA PROPOSTA DEEPXPLORE
Os sistemas de aprendizagem profunda, do ingles,ˆ Deep Learning (DL) sao˜ essenciaisˆ para aplicac¸oes˜ de seguranc¸a e protec¸ao,˜ incluindo carros autonomosˆ e detecc¸ao˜ de mal-ware, onde e´ imprescind´ıvel a exatidao˜ e a previsibilidade do comportamento de um sistema para entradas espec´ıficas. Diferentemente dos programas convencionais, as decisoes˜ a serem tomadas por algoritmos DL sao˜ baseadas em um conjunto de variaveis´ heterogeneasˆ. Atualmente, as tecnicas´ de testes existentes sao˜ fortementes dependente de dados rotulados manualmente. Com isso, comportamentos erroneosˆ para entradas raras nao˜ sao˜ detectados. Os autores propoe˜ (projetam, implementam e avaliam) uma nova tecnica´ chamada DeepXplore. Segundo os autores, o DeepXplore consiste na primeira estrutura de testes de caixa branca para o teste sistematico´ de sistemas DL no mundo real. A seguir o fun-cionamento da proposta sera´ brevemente descrito.
A. Funcionamento
Primeiramente, a cobertura de um conjuntos de entradas e´ medida atraves´ de uma tecnica´ definida pelos autores, a qual e´ chamada de Cobertura de Neuroniosˆ. A principal finalidade dessa tecnica´ consiste em identificar as partes de um sistemas LD que sao˜ abrangidas por tais entradas. A cobertura de neuroneosˆ de um conjunto entradas de um teste e´ definida pela a razao˜ entre o numero´ de neuroniosˆ ativados exclusivos para todas as entradas de teste e o numero´ total de neuroniosˆ na rede neural profunda, do ingles,ˆ Deep Neural Network (DNN). Um neuronioˆ deve ser ativado se sua sa´ıda for maior que um limiar preestabelecido. A cobertura de neuroniosˆ dos sistemas DL tem a funcionalidade analoga a` cobertura de codigo´ em sistemas tradicionais, onde entradas de teste provocam a explorac¸ao˜ de diferentes fluxos. Contudo, contrario´ aos softwares tradicionais, a maior parte das regras e´ definida por meio de algoritmos de aprendizados. Portanto, a cobertura tradicional nao˜ e´ suficiente.
Em seguida, a verificac¸ao˜ manual e´ substitu´ıda pela definic¸ao˜ de ”oraculos”´. Um oraculo´ consiste em um sistema DL com funcionalidade similar, tal como implementado pelos ve´ıculos autonomosˆ da GM, Google e Tesla. Com isso, e´
utilizado o conceito de referenciaˆ cruzada, onde a decisao˜ de diferentes DLs e´ comparada, possibilitando a identificac¸ao˜ de conflitos de decisao˜.
Por fim, os autores demonstram que o processo de encontrar entradas para sistemas DL que ocasionam altos numeros´ de comportamentos at´ıpicos e alta cobertura de neuroniosˆ pode ser representado como um problema de otimizac¸ao˜ conjunta e, portanto, pode ser resolvido com tecnicas´ de busca baseadas em gradientes. O metodo´ do gradiente e´ um algoritmo de otimizac¸ao˜ iterativa que tem a finalidade de encontrar o m´ınimo de uma func¸ao˜.
...