Projeto em analise forense de voz

Por: adelinocpp • 16/6/2015 • Projeto de pesquisa • 3.826 Palavras (16 Páginas) • 530 Visualizações

Página 1 de 16

UNIVERSIDADE FEDERAL DE MINAS GERAIS

ESCOLA DE ENGENHARIA

PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA

PLANO DE CURSO DE DOUTORADO

Identificação Forense a partir de Registros Acústico: Abordagem Semi Supervisionada com Características Robustas em Elementos de Voz e Fala

Linha de Pesquisa Escolhida: Inteligência

Computacional.

NOME: Adelino Pinheiro Silva

—————————————————

ORIENTADOR: Maurílio Nunes Vieira

—————————————————

CO-ORIENTADOR: Hani Camille Yehia.

—————————————————

Belo Horizonte, 01 de novembro

2014

Resumo (mais contextual e mais cientifico)

Historicamente a identificação humana por registros de voz iniciou-se na primeira metade do século XX com advento das gravações em fita cassete e das ferramentas de análise como o espectrograma, que expõe os fenômenos transitórios inerentes da fala humana. Juntamente com a análise do espectrografia surgiu a ideia da impressão visual da voz (voiceprint) e suas comparações para verificação de locutor, inclusive forenses, que logo foram consideradas controversas pois não eram capazes de distinguir satisfatoriamente locutores (YOUNG & CAMPBELL 1967; BROEDERS, 2001, p. D2-59).

Na pratica policial e forense, a identificação humana por registros de acústicos consiste no confronto de características de dois registros de áudio, com objetivo de associar as falas de um registro a um indivíduo conhecido. O registro dito questionado (ou motivo) é um registro de autoria total ou parcialmente desconhecida, oriundo de gravação ambiente ou interceptação telefônica, sem controle de qualidade, e no caso criminal serve como informação para associar um indivíduo ou grupo a um fato típico. O registro padrão, fornecido espontaneamente por indivíduo suspeito da autoria das falas presentes no registro questionado, é coletado em ambiente controlado por profissional treinado utilizando procedimento operacional padronizado.

Em regra, os registros questionado e padrão não possuem similaridade de informação, texto ou ambiente, e em muitos casos o fornecedor do registro padrão não deseja ser vinculado ao registro questionado. A indicação do indivíduo que fornece o material sonoro padrão muitas vezes é realizada por serviço de inteligência ou testemunha, e resulta (na maioria dos casos) na comparação de indivíduos que possuem vozes perceptualmente parecidas, onde buscam-se de evidências que deem suporte a hipótese dos registros, questionado e padrão, serem ou não do mesmo indivíduo.

Atualmente identificação forense de locutor pode ser dividida em três abordagens distintas conforme enumeradas por De Figueiredo (1994, p. 15) e Broeders (2001, p. D2-60): a primeira denominada perceptiva^[1], é realizada por foneticista treinado para realizar análise fonética e extrair uma variedade de parâmetros fonéticos, linguísticos e acústicos incluindo classificação da qualidade de voz; a segunda, no presente texto denominada semi supervisionada, realiza análise de parâmetros da voz e fala como formantes de vogais, taxa de articulação e estimação de medidas anatômicas entre outras medidas extraídas analiticamente por profissionais ou através de ferramentas automáticas; e a terceira, completamente automática, verifica os locutores pelo calculo da taxa de verossimilhança de parâmetros espectrais. Todas abordagem utilizam de uma base de dados e como suporte, em especial na verificação automática, a base de dados gera o modelo de falante de fundo universal (UBM-Universal Background Model).

A verificação automática de locutor é amplamente difundida para senhas de acesso de sistemas de segurança ou em dispositivos com reconhecimento por voz, entretanto Campbell (2009) apresenta que a identificação automática de locutor necessita de atenção devido a sensibilidade dos sistemas automáticos a diferentes fatores inerentes aos registros questionado e padrão, entre elas a contemporaneidade das gravações, canal de gravação/transmissão, condições emocionais e ambientais onde encontra-se o falante. Trabalhos recentes (BHATTACHARJEE 2012 e WU 2013) também incluem o idioma como fator sensível nas técnicas que utilizam como suporte a verossimilhança (e outras métricas) de parâmetros espectrais.

Em outra direção, a verificação de locutor realizada exclusivamente pelo especialista, utiliza como suporte evidências da voz e da fala como parâmetros de comparação. O exame, realizado por nativos do idioma (BROEDERS, 2001, p. D2-59), é demorado (algumas semanas) e são necessárias várias ocorrências de cada evidência para dar suporte ao resultado, a confiabilidade é questionável (MORRISON, 2014, p. 255), a performance não é quantificada, possui pouca repetibilidade e muita subjetividade, pois dois especialistas podem chegar a mesma conclusão com evidências e argumentações diferentes (DE FIGUEIREDO 1994 p. 17 e MORRISON 2014).

Diante deste cenário, a linha de pesquisa proposta busca investigar a extração de características de forma robusta, confiável e objetiva com agregando a expertise do profissional aos sistemas automáticos de extração de características acústicas (SCHWARTZ 2011 e GREENBERG 2011, e HAUTAMÄKI 2013). Tais técnicas procuram conjugar os aspectos robustos presentes na verificação automática e na verificação por especialista, melhorando a confiabilidade e a repetibilidade e reduzindo fatores subjetivos inerentes aos profissionais, aumentando a eficiência do procedimento de identificação forense por voz. e reduzir a possibilidade de falsos positivos e contornar objetivamente casos em que profissionais de utilizam má fé em afirmações falsas, calando-se ou negando a verdade na emissão de resultados parciais em relatórios técnico-científicos de casos forenses, fato que confunde o sistema judicial e mina a credibilidade dos profissionais sérios e imparciais.

...

Baixar como (para membros premium) txt (27.7 Kb) pdf (217.1 Kb) docx (29.4 Kb)

Continuar por mais 15 páginas »

Disponível apenas no TrabalhosGratuitos.com

Ler documento completo Salvar