RECONHECIMENTO DE PADRÕES PARA IDENTIFICAÇÃO DE ORIENTAÇÃO DE IMAGEM
Por: Israel Soares • 30/7/2020 • Artigo • 3.201 Palavras (13 Páginas) • 154 Visualizações
RECONHECIMENTO DE PADRÕES PARA IDENTIFICAÇÃO DA ORIENTAÇÃO DE IMAGENS[1]*
Israel Xavier Soares[2]**
Prof. Dr. Marcelo Suetake (Orientador)[3]***
RESUMO
A motivação deste artigo se dá devido ao aumento do uso de imagens na forma digital, que são muitas vezes capturadas em condição diferente de como são utilizadas posteriormente.
Com isso, é abordada a identificação da orientação de imagens digitais, definindo um método global, que permite a identificação por meio de diferentes categorias, comumente encontradas nas imagens, em cascata em ordem intuitiva.
Para o teste são sugeridas duas categorias, vistas entre as mais comuns nos conteúdos das imagens digitais atualmente, sendo elas o rosto e o céu. São estabelecidos e testados dois métodos diferentes para a detecção das características que indicam a orientação para cada uma das categorias sugeridas.
Primeiramente é identificada a presença do rosto, por meio da estrutura de detecção de objetos Viola-Jones. Em seguida é identificada a presença do céu, utilizando uma rede neural artificial do tipo peceptron com uma camada.
Palavras-chave: Orientação de imagens, Viola-Jones, Perceptron.
- INTRODUÇÂO
O uso de equipamentos digitais para tirar fotos e gravar vídeos mudou não apenas o modo como as imagens são capturadas, mas também como são armazenadas e consumidas.
Principalmente para imagens obtidas com o uso de smartphones, a percepção da orientação em que tais estão sendo capturadas não é sempre observada no momento da aquisição, seja pela simetria física dos próprios dispositivos e o imediatismo da ação ao capturar uma ocasião inédita, seja pela maneira como o aparelho opera quanto à rotação da tela, alterando a orientação da captura.
Quando o usuário consome o conteúdo porém, é esperado que o mesmo se apresente orientado para cima, em relação àquele que capturou, vendo como se estivesse no momento em que a imagem retratada ocorreu. Portanto, ao acessar um álbum virtual, ou compartilhar arquivos de mídia na internet e redes sociais, é conveniente que o conteúdo esteja orientado corretamente.
A identificação da orientação de uma imagem é uma tarefa complicada, pois existem diversas condições pertinentes à contextualização dos elementos na imagem, e que servem como indicadores da orientação desejada por quem registrou o momento [1].
Este artigo aborda o problema usando um método de rotação das imagens e identificação de padrões, seguindo uma cascata de categorias em ordem determinada intuitivamente, segundo seu conteúdo. A imagem inicial é analisada em relação à primeira categoria e, no caso de não coincidir com o padrão esperado de seus elementos, é girada em 90° no sentido anti-horário. O processo é realizado até que se encontrem as características desejadas ou até que a imagem volte em sua posição inicial, seguindo neste caso para analise com base na categoria subsequente.
No presente, levam-se em consideração dois contextos com o objetivo de identificar em qual sentido a imagem está orientada, sendo estes imagens que contenham rostos e imagens que apresentam céu em seu horizonte. A identificação é feita primordialmente pela orientação do rosto e, na ausência de pessoas, é seguida pela identificação da posição do céu no horizonte, assumindo que tais condições sejam as de maior relevância e suficientes para constatar a eficácia do método usado [2]. Imagens que não se encaixam em nenhuma das categorias são classificadas como não identificadas e, portanto, a adição de novas classes no processo em cascata tende ao aumento da porcentagem de acertos.
Para a classificação das imagens com rostos, a abordagem escolhida para identificar sua orientação se baseia em uma busca geral em todo o campo da imagem original. Para esta busca geral e identificação das características do rosto, o método utilizado no presente faz uso da estrutura de detecção de objetos Viola-Jones [3].
Já para a classificação das imagens com céu, a característica procurada é a presença de céu. O céu é predominantemente encontrado na metade superior da imagem, e se torna conveniente utilizarmos os valores RGB que representam as cores em diferentes quadrantes da imagem para identificação. A concentração de pixels predominantemente azuis na parte superior da imagem supõe a presença de céu e orientação para cima [4]. Para classificar a imagem é utilizado uma rede neural artificial do tipo peceptron com uma camada.
É apresentado em detalhe na Seção 2 o método utilizado para a classificação do conteúdo e da orientação da imagem. Na Seção 3 são apresentados os dados sobre a escolha e definição do banco de imagens utilizado para treinar e validar o método apresentado. Os resultados são apresentados na Seção 4, seguidos da conclusão e observações finais na Seção 5.
- METODO PROPOSTO
No correr da cascata, como visto na Figura 1, para cada categoria predefinida, tenta-se identificar a presença ou não das características procuradas por até quatro vezes, girando a imagem 90° no sentido anti-horário a cada iteração (imagem em sua posição inicial, girada -90°, -180° e -270°). Ao obter um resultado positivo a posição atual é identificada e determina a orientação original da imagem, terminando o processo e exibindo o resultado. Se um resultado positivo não for encontrado ao final da checagem de todas as categorias a imagem é classificada como não identificada. Este método não prevê a múltipla checagem entre os resultados de cada categoria, uma vez que consideramos que o cascateamento das características deve ser feito de maneira intuitiva quanto às características de maior importância para identificar a orientação da imagem.
Figura 1 - Fluxograma do método proposto para identificação da orientação de imagens.
Fonte: Feito pelo autor deste artigo.
Da mesma maneira que o olhar humano utiliza o contexto de figuras conhecidas e suas posições e orientações no espaço, o computador precisa de referencias, ou seja, é necessário traduzir nosso julgamento de maneira que discriminemos o que procurar na imagem e como esperamos encontrar [1]. Para o presente trabalho, consideramos duas categorias relevantes: imagens que contenham rostos e imagens que apresentam céu em seu horizonte.
...