A Classificação De Pulsação Usando MLP E Técnicas De Floresta Aleatória
Por: Dyuliano Magalhaes • 27/5/2023 • Ensaio • 2.235 Palavras (9 Páginas) • 86 Visualizações
Classificação de pulsação usando MLP e técnicas de floresta aleatória
CAL Ortiz1 e J. Nadal1
Resumo— Este trabalho tem como objetivo apresentar um método para classificação de batimentos cardíacos baseado nas técnicas multi- layer perceptron (MLP) e random forest (RF) aplicadas à primeira diferença de sinais de ECG. A partir do banco de dados de arritmias do MIT-BIH, cada segmento P-QRS anotado foi extraído, filtrado em passa-
baixa e a diferença de primeira ordem foi usada como entrada para as redes neurais. O MLP e o Random Forest foram utilizados para obter um
modelo de classificação dos batimentos cardíacos. Os resultados foram comparados com outros algoritmos existentes na literatura, e o modelo desenvolvido produziu bons resultados e notou melhorias ao utilizar a primeira diferença.
Palavras-chave— Heartbeat Classification, Multi Layer Percep tron, Floresta Aleatória, Processamento de Sinal.
O eletrocardiograma (ECG) vem sendo utilizado para a avaliação não invasiva da atividade bioelétrica do coração há mais de 100 anos. Em unidades de terapia intensiva, é amplamente utilizado para monitoração contínua dos pacientes, seja pela freqüência cardíaca instan- tânea ou pela detecção automática de arritmias potencialmente fatais [1, 2, 3, 4, 5]. O ECG é composto por cinco padrões de onda que se repetem batimento a batimento e representam o ciclo cardíaco. Essas ondas são denominadas P, Q, R, S e T (Fig.1).
Dezenas de algoritmos automáticos de monitoramento de arritmia baseados em ECG estão sendo propostos nos últimos cinquenta anos.
Embora os monitores automáticos tenham se mostrado úteis para prevenir o monitoramento humano contínuo e tenham ajudado a salvar inúmeras vidas, eles também são responsáveis por ruídos evitáveis em UTI, devido a falsos alarmes. Assim, a investigação de classificadores mais precisos ainda está em andamento em um grande número de grupos de pesquisa ao redor do mundo. Para padronizar a avaliação dos métodos de classificação e a comparação do desempenho entre algoritmos, foi estabelecido um padrão AAMI/ANSI [7] que recomenda agrupar as classes de batimentos cardíacos do MIT-BIH em cinco grupos: (1) Batimentos não ectópicos ou normais (N ); (2) Batimentos ectópicos supraventriculares (S); (3) Batimentos Ventriculares Ectópicos (V); (4) Batidas de Fusão (F); e (5) Batidas Desconhecidas (Q). Cada grupo contém um ou mais tipos de batimentos cardíacos, conforme demonstrado na (Tabela 1).
A primeira derivada dos dados de ECG é amplamente usada em algoritmos de detecção complexos de QRS para melhorar a relação sinal-ruído; no entanto, as amostras de dados originais são usadas para a classificação. Este estudo visa testar a aplicabilidade da primeira derivada para fins de classificação. Para tanto, duas topologias de redes neurais foram empregadas: Multi-Layer Perceptron (MLP) devido a sua ampla aplicação na seleção e classificação de padrões e Random Forest (RF) para verificar os benefícios da flexibilidade, redução do overfitting e sua aplicabilidade na classificação dos batimentos cardíacos.
II MATERIAIS E MÉTODOS
Este banco de dados [8] é formado por 48 registros de 30 minutos de ECG ambulatorial de 47 pacientes diferentes, tomados em duas derivações e armazenados digitalmente em 360 amostras por segundo. Apenas a primeira derivação (eletrodo DII modificado torácico) foi analisada. Os arquivos de dados foram organizados em quatro grupos (Tabela 2), para a abordagem de validação cruzada k-fold com k = 4. Esses arquivos também foram agrupados conforme determinado pelo padrão AAMI [7], para fins de comparação. Foi utilizada a derivação DII, que representa a derivação bipolar torácica, registrando 24h de registros de ECG. Apesar de conter 24 h de dados de ECG, com mais de
107.000 batimentos cardíacos, o banco de dados possui um pequeno número de casos em classes não normais, exigindo o uso parcimonioso desses dados
para avaliação da classificação. Portanto, foi adotado o uso da validação cruzada k-fold. Essa abordagem usa três dos quatro conjuntos de dados para
desenvolvimento e validação de classificação, enquanto o quarto conjunto de dados foi reservado para testes independentes. Assim, após quatro treinamentos de classificação diferentes, cada um preservando um conjunto de dados diferente 3, o desempenho da classificação pode ser avaliado com o banco de dados completo. Cada um dos quatro datasets de treinamento foi dividido em dois subconjuntos, onde 70% dos dados foram reservados para treinamento (training dataset) e 30% para validação (validation dataset), como usualmente adotado na literatura.
B. Pré-processamento
Um segmento de 110 amostras contendo a onda P e o complexo QRS foi extraído de cada batimento cardíaco anotado do banco de dados e a primeira diferença foi calculada (fig.
2). Como mostrado, a primeira diferença atinge uma onda proeminente na localização do QRS e resolve o problema da linha de base em cada sinal de ECG.
Após o pré-processamento, os segmentos de sinal foram agrupados em quatro tabelas diferentes, conforme os grupos apresentados na Tabela 3, um heartbeat por coluna, seguido da classe correspondente conforme a Tabela 1. Para garantir a qualidade dos sinais, reduzir ruídos e efeitos de artefatos nos sinais, também foi aplicado um filtro de média móvel passa baixa para cada segmento de dados.
Depois disso, a informação de cerca de 300 ms foi retida em torno do pico R, que foi representado por 72 amostras antes do pico R e 37 amostras após o pico R. A posição do pico R foi retirada do arquivo de anotação do banco de
dados MIT BIH. Devido ao desequilíbrio na base de dados no número de batimentos em cada aula, o que poderia afetar o treinamento do classificador,
foram verificadas duas formas diferentes de resultados: uma para a base
desbalanceada e outra para a balanceada. Para executar o banco de dados balanceado, os dados de cada batida foram amostrados para 10.000 amostras
em cada tipo.
C.Classificadores
Duas topologias de classificadores foram testadas: MLP e RF. Os resultados desses classificadores foram validados usando Precisão (individual e macro), Especificidade e Sensibilidade. No final, a alta precisão e os melhores resultados na matriz de confusão foram usados para determinar o melhor classificador. Os classificadores implementados, MLP e RF, seguiram as estruturas acima: MLP: Randomstate = 1, max iter = 200, Hiden layer size: 100, Activation: 'relu'(retified
...