TrabalhosGratuitos.com - Trabalhos, Monografias, Artigos, Exames, Resumos de livros, Dissertações
Pesquisar

TÉCNICAS E MÉTODOS PARA PRESERVAÇÃO DE PRIVACIDADE NA MINERAÇÃO DE DADOS

Por:   •  9/8/2017  •  Trabalho acadêmico  •  2.532 Palavras (11 Páginas)  •  231 Visualizações

Página 1 de 11

UNIVERSIDADE FEEVALE

 

FREDI DILAN DA SILVA

TÉCNICAS E MÉTODOS PARA PRESERVAÇÃO DE PRIVACIDADE NA MINERAÇÃO DE DADOS

Anteprojeto de Trabalho de Conclusão

Novo Hamburgo

2014


FREDI DILAN DA SILVA

 

TÉCNICAS E MÉTODOS PARA PRESERVAÇÃO DE PRIVACIDADE NA MINERAÇÃO DE DADOS

Anteprojeto de Trabalho de Conclusão de Curso, apresentado como requisito parcial

à obtenção do grau de Bacharel em

Sistemas de Informação pela

Universidade Feevale

Orientador: Me. Daniel Dalalana Bertoglio

Novo Hamburgo

2014


RESUMO

Com o crescimento do volume de dados e por consequência do estudo de técnicas para extração de conhecimento a partir desses, a preocupação com a segurança das informações vem sendo tratada com peso equivalente a tal avanço. A extração de conhecimento através da mineração de dados passa pelo cuidado de trabalhar com dados considerados sensíveis, definição relacionada principalmente a datasets que possuem informações sobre indivíduos. Este projeto está vinculado à área da Segurança da Informação e apresenta a proposta de um estudo teórico e pratico em relação às técnicas e métodos para preservação de privacidade na mineração de dados, também conhecido como PPDM (Privacy Preserving Data Mining). Essa proposta visa garantir a privacidade de informações confidenciais (ou sensíveis ou sigilosas) e a preservação da identidade de indivíduos no processo de mineração. O processo de validação e avaliação se dará através do levantamento de métricas que serão utilizadas para comparação dessas técnicas, as mesmas serão aplicadas em um cenário específico a fim de identificar a mais eficaz com base na geração de um quadro de comparação com essas métricas e as justificativas de sua eficiência. A validação das técnicas permitirá a certificação da garantia na segurança da privacidade de informações confidenciais, assim como a excelência na mineração dos dados e na transformação destes em conhecimento.

Palavras-chave: Privacy Preserving Data Mining. Data Mining. Knowledge Discovery in Database. Segurança da Informação. Descoberta De Conhecimento Em Base De Dados.


SUMÁRIO

MOTIVAÇÃO ...........................................................................................................................5

OBJETIVOS ..............................................................................................................................9

METODOLOGIA ....................................................................................................................10

CRONOGRAMA ....................................................................................................................12

BIBLIOGRAFIA  ....................................................................................................................13

 


 MOTIVAÇÃO

Estamos inseridos em uma “era” de mudanças, onde o mundo transforma-se a cada segundo. Com certeza sofremos um impacto significativo diante dessas mudanças, decorrentes da globalização e do avanço tecnológico. É possível notar este impacto em diversos setores, em especial no processo de mineração dos dados e na transformação destes em conhecimento. Segundo Dilly (1999), estima-se que a quantidade de informação no mundo dobra a cada 20 meses e que o tamanho e a quantidade dos bancos de dados crescem com velocidade ainda maior. O explosivo crescimento do volume de dados tem gerado uma urgente necessidade de novas técnicas e ferramentas capazes de transformar, de forma inteligente e automática, terabytes de dados em informações significativas e em conhecimento. Essas informações, de grande valia para o planejamento, gestão e tomadas de decisão, estão, na verdade, implícitas e/ou escondidas sob uma montanha de dados, e não podem ser descobertas ou, no mínimo, facilmente identificadas utilizando-se sistemas convencionais de gerenciamento de banco de dados.

Essa técnica mencionada anteriormente é denominada KDD (Knowledge Discovery in Database - Descoberta de Conhecimento em Base de Dados), esse, usa ferramentas de software utilizadas pelo usuário que geralmente não sabe especificamente o que quer, porém está procurando por padrões determinados ou linhas de ação. Navegar através de grandes quantidades de dados para produzir relacionamentos de conteúdo está vinculado a este processo. Possibilita prever costumes e comportamentos (por exemplo, carrinho de compras de lojas, quando lhe recomendam um produto que outros usuários com o mesmo gosto também compraram), permitindo que as áreas de negócio sejam mais proativas e com decisões baseadas em conhecimento (FAYYAD ET AL. 1996B).

Empresas que visam garantir seu crescimento e obtenção de vantagens competitivas no mercado estão extremamente preocupadas com seu capital intelectual, uma vez que o conhecimento é de suma importância para o desenvolvimento econômico de uma organização. O uso de uma ferramenta de KDD tem como objetivo facilitar e agilizar a obtenção deste conhecimento. Deste modo, ao pensar em integrar tecnologia de informação (TI) e aprendizado para gestão do conhecimento organizacional, um ponto que ganha destaque imediato dentre os demais existentes é à descoberta do conhecimento em bases de dados que, talvez seja o tópico de maior relevância prática no contexto da atual gestão estratégica do conhecimento. A tecnologia é algo que se desenvolve predominantemente nas empresas por meio de conhecimentos acumulados e pelas suas manifestações físicas decorrentes (Chiavenato, 1987).

Para Han e Kamber (2000), a técnica de KDD é um processo de identificação de padrões de dados válidos, não triviais, potencialmente úteis e compreensíveis. É utilizado para descrever todo o processo de extração de conhecimentos dos dados, e possui varias etapas interligadas conforme apresentado na ‘Figura1’:

[pic 1]

  • Limpeza dos dados: para remover ruídos e dados irrelevantes;
  • Integração dos dados: onde fontes de dados múltiplos podem ser combinadas;
  • Seleção dos dados: onde dados relevantes para a análise são recuperados do banco de dados;
  • Transformação dos dados: onde os dados são transformados ou consolidados no formato apropriado para mineração;
  • Mineração de dados: é um processo onde métodos inteligentes são utilizados a fim de extrair padrões de dados;
  • Avaliação e representação do conhecimento: onde técnicas de visualização e representação de conhecimento são utilizadas para apresentar o conhecimento extraído para o usuário.

Alguns autores consideram KDD e Mineração de Dados como processos distintos (Fayyad et alii, 1996). Entretanto, em algumas bibliografias, o termo mineração de dados (Data Mining) tornou-se mais popular que o KDD e é utilizado quando se refere ao processo de identificação de padrões a partir de grandes quantidades de dados armazenados em bancos de dados ou outro tipo de banco de armazenamento (Han e Kamber, 2000).

...

Baixar como (para membros premium)  txt (19.1 Kb)   pdf (193.2 Kb)   docx (505.6 Kb)  
Continuar por mais 10 páginas »
Disponível apenas no TrabalhosGratuitos.com