Série de Fourier e a matriz de Moore-Penrose: interação para a regressão de dados de um sinal de eletrocardiograma
Por: Larissa Teixeira • 11/4/2018 • Artigo • 1.867 Palavras (8 Páginas) • 238 Visualizações
Série de Fourier e a matriz de Moore-Penrose: interação para a regressão de dados de um sinal de eletrocardiograma
Larissa R. Teixeira*1, Igor S. Peretta†1 e Ana Maria A. Bertone‡2 1FEELT - Universidade Federal de Uberlândia
2FAMAT - Universidade Federal de Uberlândia
Palavras-chave: Regressão algébrica. Pseudoinversa. Série de Fourier.
Resumo
Nas últimas décadas, a pseudoinversa de Moore-Penrose encontrou uma ampla gama de aplicações em muitas áreas da ciência e tornou-se uma ferramenta útil para, entre outras aplicações, a análise de dados. Da combinação da pseudoinversa com a aproximação de uma função por séries de Fourier, surge uma abordagem algébrica para uma aproximação dos dados obtidos de um de eletrocardiograma. Simulações no software livre Octave foram testadas por três medidas de acurácia, mostrando a eficiência da interação das metodologias analítica e algébrica.
Introdução
Historicamente, Legendre [1] e Gauss [2] publicaram as primeiras formas de regressão utilizando o método de mínimos quadrados. Visava-se com estas técnicas, determinar, a partir de observações astronômicas, as órbitas de corpos celestes. O termo regressão, cunhado neste contexto, se refere a desenvolver relações de dependência entre variáveis, ou modelos, que possam descrever um fenômeno observável.
Tradicionalmente, os métodos de regressão para aproximação e ajuste de curvas são desenvolvidos na área de modelamento estatístico. A literatura é vasta sobre o assunto e muitas das técnicas, tanto lineares quanto não- lineares, já são consagradas. Uma das técnicas de aproximação de sinais mais conhecidas e importantes nas engenharias é a aproximação por séries de Fourier [3, 4].
O objetivo deste trabalho é o de apresentar-se como prova de conceito sobre o uso de álgebra linear em regres- sões de dados. O estudo de caso apresentado é o da aproximação por um truncamento de uma ordem escolhida n da série Fourier de um ciclo de batimento cardíaco, retirado de um sinal de eletrocardiograma original, cujos coe- ficientes da truncamento foram estimados a partir da solução de um sistema de equações lineares, com auxílio da pseudoinversa de Moore-Penrose.
Simulações numéricas no software livre Octave [9] são apresentadas utilizando três métricas de acurácia: a soma dos quadrados dos resíduos (SQres), o clássico coeficiente de determinação da regressão dos mínimos quadrados (R2) e a qualidade de ajuste (QA) com respeito à raiz quadrada do erro médio normalizado. Como resultado da regressão, todas as métricas apresentam altos graus de acurácia com ordens baixa de truncamento, demonstrando assim a eficiência da abordagem proposta.
Fundamentação Teórica da interação da Série de Fourier e a matriz de Moore-Penrose
Neste estudo são combinadas duas teorias clássicas da matemática: a teoria das inversas generalizadas e a teoria da aproximação de Fourier, em particular das séries de Fourier. Ou seja, são combinadas uma ferramenta algébrica, mas especificamente da álgebra linear [6], e uma outra analítica, envolvendo conceitos de espaços funci- onais e bases funcionais ortogonais.
Com respeito à ferramenta da álgebra, vamos considerar o sistema linear Aβ y, em que A é uma matriz
é compatível, podemos ter tanto uma única solução e, como consequência, a matriz A é inversível; ou que possa existir infinitos vetores β que safisfazem o sistema linear Aβ y. Desse conjunto solução, é preferida a escolha
*larissa.teixeira@ufu.br
†iperetta@ufu.br
‡amabertone@ufu.br
daquele que tenha a menor norma euclidiana, ou seja, o desejo é o de resolver o problema de minimização
β min β , C solução de Aβ y (1)
em que é a norma euclidiana de m. Moore [7] e Penrose [8] mostraram que o problema de minimização (1) tem uma única solução obtida através da aplicação da pseudoinversa da matriz A, denominada A+, sendo portanto
utilizadas para a abordagem de regressão apresentada neste trabalho.
A outra ferramenta analítica é dada pela teoria das séries de Fourier [3], cujo nome vem das contribuições na teoria da aproximação do matemático francês Joseph Fourier. O teorema de Fourier afirma que, dada uma função
f (t) = a0 + Σ∞ a cos ( n π t ) + Σ∞ b sin ( n π t ) , (2)
em que os coeficientes, conhecidos como coeficientes de Fourier, são dados por
a0 = 1 J L f (t)dt, an = 1 J L f (t) cos ( nπt ) dt e bn = 1 J L f (t) sin ( nπt ) dt.
Pk(t) = a0 + a cos ( π t ) + . . . + a cos ( k π t ) + b sin ( π t ) + . . . + b sin ( k π t ) . (3)
Computacionalmente, o cálculo dos coeficientes de Fourier pode ser realizado de diversas formas, como no auxílio de integrais numéricas ou de algoritmos clássicos [5]. Neste estudo é proposto o cálculo dos coeficientes de
k
Considerando um conjunto de dados {(ti, yi)}m= , em que m representa a quantidade total de dados coletados, se
constrói a matriz A de ordem m × ( + 1) = i ( ), em que i são os truncamentos
i 1
2k f f
de f de ordem i 0, . . . k. Considerando o vetor βf ao, a1, b1, . . . , an, bn T e y y1, y2, . . . , ym T , obtém-se o
sistema linear
Aβf y, (4)
que é um sistema linear compatível. Assim, utilizando a inversa generalizada de Moore-Penrose, obtemos a única solução de menor norma euclidiana do sistema (4) e, consequentemente, do problema de otimização (1) dada por βf A y. O erro proveniente do truncamento é analisado na próxima seção, na qual simulações no Octave são desenvolvidas.
Prova de conceito e simulações no Octave
As simulações deste estudo foram feitas no software livre Octave com o uso de um sinal de eletrocardiograma (ECG) disponibilizado
...