Data Warehouse
Por: vianeiss • 22/6/2015 • Trabalho acadêmico • 1.422 Palavras (6 Páginas) • 537 Visualizações
[pic 1]
UNIVERSIDADE DO SUL DE SANTA CATARINA
DATA WAREHOUSE
Tubarão
2012
SUMÁRIO
1 INTRODUÇÃO
2 DATA WAREHOUSE
2.1 ETAPAS DO PROJETO DE UM DW
3 FERRAMENTA OLAP
3.1 CARACTERÍSTICAS
3.2 OPERAÇÕES OLAP
4 EXPERIMENTO
5 CONCLUSÃO
REFERÊNCIAS
1 INTRODUÇÃO
Neste trabalho, temos por objetivo estudar o desenvolvimento de um Data Warehouse. Nele, estudaremos o que é um Data Warehouse, as etapas do seu desenvolvimento, suas aplicações e as ferramentas utilizadas no seu desenvolvimento e suas características. Veremos também a descrição de um problema e sua solução através de um Data Warehouse.
2 DATA WAREHOUSE
Segundo W. H. Inmon (1997), um DW é uma coleção de dados orientada por assuntos, integrada, variante no tempo e não volátil, que tem por objetivo dar suporte aos processos de tomada de decisão.
Um DW é orientado por assuntos de interesse da empresa como por exemplo, produto, cliente, vendedor, etc. Ao contrário de um sistema operacional, que está organizado de acordo com as áreas funcionais da empresa. Os dados que alimentam o DW são trazidos das bases de dados dos sistemas operacionais que a empresa utiliza e são padronizados, ou seja, são tratados antes de serem incluídos no DW. Por exemplo, a empresa pode ter 2 sistemas, onde em um deles é tratado sexo como M/F e no outro Masc/Fem. Nesse caso, os dados são convertidos para o padrão utilizado no DW antes de sua inclusão. Nesse caso, se o DW utiliza M/F, os dados Masc/Fem serão devidamente convertidos antes de serem cadastrados no DW. Os dados contidos em um DW não são voláteis, ou seja, não permitem alterações pelo usuário, apenas consultas, pois estes apenas refletem as informações constantes no ambiente operacional.
2.1 ETAPAS DO PROJETO DE UM DW
O desenvolvimento de um DW constitui-se de nove etapas, sendo elas: Planejamento, levantamento de necessidades, modelagem dimensional, projeto físico do banco de dados, projeto ETL, desenvolvimento de aplicações, validação e teste, treinamento, implantação.
Vejamos as descrições de cada etapa:
- Planejamento: Onde é definido o escopo do projeto, grau de redundância dos dados, tipos de usuário que terão acesso, ambiente, relatórios, consultas, freqüência de atualização dos dados, necessidades de informações gerenciais e arquitetura tecnológica que será utilizada, com a definição das ferramentes e SGBD.
- Levantamento das necessidades: É feita a identificação do modelo dimensional e do modelo relacionado com as fontes das informações e análise da qualidade e integridade dos dados da fonte.
- Modelagem dimensional: É analisado o volume bruto dos dados para obtenção de informações consolidadas. São feitos os cálculos e estimativas de cargas, definido os fatos, dimensões, atributos e níveis de granularidade.
- Projeto físico do BD: É realizado o desenho físico das estruturas do modelo dimensional, estimado o tamanho da base de dados e criado a base de dados, com as tabelas fato e dimensão, relacionamentos, índices, atributos, campos chaves, restrições e implantação de regras.
- Projeto ETL: É feita a definição dos processos de extração, transformação e carga da base operacional para o modelo dimensional. Também são definidos os tratamentos que serão utilizados como filtros, integração e conversão de dados.
- Desenvolvimento de aplicações: São desenvolvidas as aplicações para ETL e para as consultas gerenciais.
- Validação e teste: São realizados a maior quantidade de testes possíveis para verificar o volume de dados e de processamento necessários. Nesta fase, o sistema é liberado a um grupo restrito de usuários e após análise, o sistema é implantado em ambiente produtivo.
- Treinamento: É feito o treinamento para os usuários do sistema nas ferramentas e no modelo dimensional criado.
- Implantação: O sistema é implantado e deve ser feito um rigoroso acompanhamento do uso das aplicações a fim de se verificar se há necessidade de alguma correção.
3 FERRAMENTA OLAP
A sigla OLAP vem de On-Line Analytical Processing. Representa um conjunto de tecnologias para suporte a análise e consultas ad hoc. Sistemas deste tipo ajudam analistas e executivos a colherem informações sobre a empresa através de comparações, visões personalizadas, históricos e projeção de dados em vários cenários do tipo “e se...”. Sistemas OLAP são usados em ambiente multi usuário, com arquitetura cliente-servidor e oferecem respostas rápidas e precisas às consultas executadas por analistas, independentemente do tamanho e complexidade do banco de dados.
3.1 CARACTERÍSTICAS
A principal característica dos sistemas OLAP é permitir uma visão conceitual multi-dimensional dos dados de uma empresa, que é muito mais útil do que a visão tabular usada nos sistemas de processamento de transação. Ela é mais natural, fácil e intuitiva e permite a visão em diferentes perspectivas dos negócios da empresa.
Outras importantes características dos sistemas OLAP são:
- Análise de tendências. É capaz de ajudar os usuários a tomar decisões sobre o futuro, permitir construção de cenários “e se...” a partir de suposições e fórmulas.
- Busca automática. Quando necessário, a ferramenta OLAP deve ser capaz de buscar dados de detalhes.
- Dimensionalidade genérica
- Operação trans-dimensional
- Possibilidade de ver dados de diferentes pontos de vista
Uma arquitetura OLAP possui três componentes principais: modelo de negócios para análises interativas, implementado em linguagem gráfica que permite diversas visões e níveis de detalhes dos dados; motor OLAP para processar consultas; mecanismos para armazenar os dados a serem analisados;
...