A Mineração de Dados Como Apoio ao Controle Externo
Por: Ana Caroline Gomes • 8/5/2022 • Artigo • 4.303 Palavras (18 Páginas) • 105 Visualizações
[pic 1][pic 2]DOUTRINA
A Mineração de Dados como apoio ao Controle Externo
Remis Balaniuk Introdução
[pic 3]
Remis Balaniuk é servidor do Tribunal de Contas da União. Graduado em Ciência da Computação pela Universidade de Brasília (UnB), mestre em Ciência da Computação pela Universidade Federal do Rio Grande do Sul (UFRGS), doutor em Informática pelo Institut National Polytechnique de Grenoble (INPG- França) e pós-doutor em Computação pela Stanford University (EUA) e pelo Institut National pour la Recherche en Informatique et Automatique (INRIA - França).
Um aspecto importante do contexto atual da administração federal é o uso extensivo de sistemas informatizados estruturadores, como o Sistema Integrado de Administração Financeira do Governo Federal (SIAFI), o Sistema de Administração de Serviços Gerais (SIASG) e o Sistema Integrado de Administração de Recursos Humanos (SIAPE), entre outros. Esses sistemas registram e controlam o funcionamento cotidiano da máquina administrativa de forma centralizada. Suas bases de dados, que já contém dados históricos de mais de uma década em alguns casos, constituem fontes inestimáveis de informação. O acesso típico a esses dados é feito por meio dos próprios sistemas que os mantém. Nesses sistemas são propostas consultas pontuais e relatórios, mas análises mais elaboradas e abrangentes não são oferecidas.
Diversas iniciativas pontuais vêm sendo feitas no sentido de explorar essas grandes bases de dados do governo, mas primordialmente buscando dar mais transparência às contas do governo, como, por exemplo, o Portal Transparência da Controladoria-Geral da União, CGU1, que reúne informações sobre o uso do dinheiro público pelo Governo Federal, o Siga Brasil do Senado Federal2 com informações sobre as leis e o Contas Abertas3, que busca disponibilizar para a sociedade as execuções orçamentária, financeira e contábil da União, dos Estados, do Distrito Federal e dos Municípios. Algumas iniciativas voltadas ao uso corporativo têm buscado facilitar o acesso e o uso dos dados de sistemas estruturadores para fins de controle, como, por exemplo, o datawarehouse* (DW) Síntese do TCU com dados dos sistemas SIAFI e SIASG, e os DW-SIAPE e Compras do Ministério do Planejamento, Orçamento e Gestão (MP).
Entretanto, a existência e a disponibilidade de grandes volumes de dados de interesse para o controle não garantem que se consiga extrair desses dados os indícios e provas relativas aos atos ilícitos
jan/ abr 2010 [ 77
[pic 4][pic 5]DOUTRINA
cometidos contra o erário. Uma vez os dados de interesse estando acessíveis, o problema central que se impõe aos analistas e auditores é como lidar com a complexidade, diversidade e o gigantesco volume das informações ali contidas. Somente alguns poucos especialistas, profundos conhecedores das regras de negócio de um segmento da máquina administrativa e simultaneamente profundos conhecedores da estrutura da base de dados que registrou os atos analisados, são capazes de propor e realizar consultas analíticas que evidenciem uma hipótese específica sendo analisada.
Para viabilizar o uso sistemático dessas bases de dados pelos órgãos de controle é imprescindível que se comece pela definição de uma metodologia que possa estruturar o processo de análise de grandes volumes de dados levando em consideração as necessidades específicas da área de controle.
Em Tecnologia da Informação (TI), esse esforço de sistematização da análise de grandes bases de dados pertence à área conhecida como “Extração de Conhecimento” (também conhecida como processo KDD, do inglês Knowledge-Discovery in Databases). O KDD lida com a extração de informações de bases de dados, descobrindo relacionamentos de interesse que não são observados diretamente pelo especialista no assunto, bem como auxiliando na validação de conhecimento extraído. Um passo importante do KDD é a chamado “Mineração de Dados” (Data Mining), que é o processo de explorar grandes quantidades de dados à procura de padrões consistentes, como regras de associação ou sequências temporais, buscando detectar relacionamentos entre variáveis. Uma sistemática bem definida de extração de conhecimento requer um processo de trabalho claro e bem documentado, que possa ser repetido e refinado diversas vezes. Em muitos casos, os resultados obtidos numa primeira iteração de um processo de extração de conhecimento não valem o esforço despendido. Entretanto, iterações sucessivas levam ao conhecimento aprofundado dos negócios e bases analisadas e podem se transformar numa ferramenta poderosa de análise.
Os órgãos de controle têm uma missão continuada de fiscalizar a administração pública. Uma auditoria ou fiscalização em um órgão específico não é um esforço isolado, mas um evento de uma série de
atos de controle lidando com o mesmo negócio e as mesmas bases de dados. O uso de metodologias que permitam uma evolução no tempo nessas séries de atos de controle, reutilizando e refinando o conhecimento adquirido em atos anteriores, podem levar a ações muito mais eficazes. Essas mesmas metodologias permitiriam também o acompanhamento direto das decisões e orientações desses órgãos de controle, dirigidas a essas unidades jurisdicionadas, através da simples re-análise das mesmas fontes de dados depois de decorrido um intervalo de tempo. Utilizando os mesmos critérios de extração de dados, as mesmas análises e as mesmas ferramentas utilizadas na iteração de mineração que embasou decisões e orientações a serem acompanhadas, seria possível acompanhar as mudanças ocorridas e refletidas nos dados.
Oportunidades
O TCU detém um vasto conhecimento de negócio, na sua maioria tácito e desestruturado, advindo primordialmente da experiência prática de seus analistas e auditores. Esse conhecimento de negócio é mal distribuído e pouco compartilhado dentro da instituição. A adoção de uma metodologia adequada de extração de conhecimento em nível institucional induz um processo de formalização e compartilhamento do conhecimento de negócio, uma vez que esse conhecimento é a matéria-prima da elaboração das análises feitas via mineração de dados. Da mesma forma, a mineração permite a validação na prática desse conhecimento ao confrontá-lo com fatos refletidos nas bases de dados, levando ao aprimoramento do conhecimento institucional.
...