O Animação de Avatar
Por: lfasousa • 18/9/2018 • Monografia • 4.201 Palavras (17 Páginas) • 142 Visualizações
INTRODUÇÃO
O desenvolvimento de personagens virtuais, desde a modelagem tridimensional à animação, é uma tarefa árdua que necessita de muito recurso computacional e tempo para se obter um resultado de qualidade. Esses personagens, também conhecidos como “avatares”, são utilizados em diversas áreas, como as de produção visual e de jogos digitais, com a aproximação de características físicas humanas. Buscando facilitar a captura e interpretação dos dados de expressões faciais, foi desenvolvido um sistema para captura de dados em três dimensões e animação de um avatar, especialmente pelo uso do sensor Kinect, da Microsoft, e da técnica de BlendShape, para dar forma às expressões faciais. Este trabalho implementa um método para a captura de expressões faciais e animação de um avatar, utilizando técnicas e ferramentas diversas. Entre elas, estão: o mapeamento de expressões por meio da captura de dados pelo sensor; o rastreamento de face para a identificar dados relevantes; o alinhamento de nuvem de pontos para a organizar os objetos no espaço; o uso de modelos faciais para reproduzir a face, aproximando-se das expressões; e o uso de um algoritmo otimizador para minimizar a distância euclidiana das aproximações, por meio de métodos iterativos. Para validar esse método, foram realizados testes com um grupo de voluntários. Os dados foram armazenados, analisados e submetidos como entrada para o sistema, resultando em um vídeo que, ao final, foi analisado. Com isso, examinou-se a sincronia da animação, o alinhamento dos objetos e a aproximação das expressões representadas pelos voluntários. Como conclusão, apresentamos as últimas considerações e finalizamos o trabalho com uma discussão sobre as dificuldades encontradas, bem como as melhorias que podem ser realizadas e os trabalhos futuros a serem desenvolvidos.
UTILIZAÇÕES
A animação de avatar é uma área rica para desenvolvimento e está em uma fase de crescimento acelerado. Ela conta com o interesse de diversos setores, a exemplo da indústria cinematográfica, com produções que empregam essa tecnologia. Nos novos filmes da franquia Planeta dos Macacos, por exemplo, a captura de movimentos foi muito aclamada com a utilização de tecnologias de marcadores na face e no corpo, bem como a construção digital dos personagens.
A captura de movimentos também é empregada na simulação de resultados na medicina, em cirurgias plásticas e reconstruções faciais, o que melhora a comunicação entre o médico e paciente, auxiliando no planejamento cirúrgico e na avaliação de resultados, permitindo que o paciente observe os vários ângulos das simulações e consiga obter um melhor resultado no tratamento.
Na área de jogos digitais, a utilização da captura de expressões e movimentos é voltada também para modelagem de avatares e interação com o usuário em meios de entretenimento, possibilitando maior interação do usuário com o desenvolvimento do seu personagem, tornando esse processo mais lúdico e interessante, e também possibilitando maior customização dos dados do jogo com os próprios aspectos físicos do jogador, sem a necessidade do preenchimento de fichas longas e demoradas.
CUSTO
Os métodos para a aquisição de dados, rastreamento do movimento, otimização e a combinação destes para gerar a animação final, requerem um gasto monetário elevado, além de um alto custo operacional. Todavia, com o desenvolvimento de novas tecnologias focadas na captura de movimentos, utilizando sensores, e a criação de dispositivos mais inclusivos, como o Kinect, o custo tende a ser reduzido e ainda se mantêm um alto grau de realismo.
KINECT
O Kinect foi desenvolvido pela empresa Microsoft tendo como principal objetivo fazer as pessoas interagirem com jogos. Sua utilização se tornou viável devido à sua popularização, ao seu baixo custo e ao uso de drivers e bibliotecas abertas para o desenvolvimento em diversas linguagens e ambientes. Com a facilidade na integração e mapeamento dos dados obtidos pelo Kinect, é possível utilizar técnicas já existentes, como o BlendShape, para animar um avatar.
O Kinect trouxe uma revolução para a área de jogos, pois com ele não havia mais a necessidade do uso de controles, tendo o usuário a capacidade interagir com os jogos somente pela captura de seus movimentos e comandos de voz, criando-se assim um novo ambiente para o desenvolvimento de jogos que utilizam essas atividades.
O hardware do Kinect é composto de:
- Sensor RGB (Red, Green, Blue), que captura os dados de entrada em duas dimensões, com a resolução de 640x480 pixels;
- Sensor de profundidade (infravermelho), que permite o escaneamento do ambiente em três dimensões, utilizando o conjunto projetor/receptor de raios infravermelhos;
- Microfones embutidos para captura de áudio;
- Eixo motorizado para modificar verticalmente a posição do sensor.
O princípio básico do funcionamento do Kinect é a captura das imagens do ambiente a uma taxa de 30 frames por segundo (fps), ao mesmo tempo em que um mapa de profundidades é construído analisando-se o padrão de luz emitido pelo sensor infravermelho, medindo-se o tempo necessário para a luz ser refletida. A profundidade é calculada pelos princípios de foco e posição. Pelo primeiro, o que está mais distante no espaço fica mais desfocado. Pelo segundo, com a análise da cena em outro ângulo, é possível detectar a distância projetando-se a luz em um local e a observando em outro, também conhecido como paralaxe.
Unindo-se o mapa de profundidade e a imagem capturada pela câmera RGB, a nuvem de pontos é registrada e disponibilizada para o uso. Na elaboração deste trabalho, a captura de áudio não foi utilizada.
BLENDSHAPE
O BlendShape é uma técnica que utiliza um conjunto de nuvens de pontos armazenadas como uma malha de referências de expressões, cada referência é parametrizada por meio de transformações de vértices no espaço. Como resultado, quando modificamos seus parâmetros, áreas das regiões do rosto são afetadas, mapeando diferentes expressões faciais.
Cada expressão facial se torna um peso, comumente variando de zero a um, que, quando aplicada por suas combinações a um modelo base, resulta em uma expressão final. É um método custoso e requer o conhecimento prévio das expressões que podem ser utilizadas.
É muito empregada na animação, pois o animador tem grande controle sobre o efeito de cada expressão facial. Calculando os pesos para cada expressão facial utilizada no BlendShape, foi possível alterar o avatar aproximando a expressão facial capturada pelo sensor.
...