Atps banco de dados
Por: schultz01 • 22/4/2015 • Relatório de pesquisa • 1.424 Palavras (6 Páginas) • 300 Visualizações
•Etapa 4
•Banco de Dados Distribuídos
O sistema de banco de dados distribuídos é feito em uma relação de nós onde cada nó um pode participar de transações que ocorrem e acessam dados em um ou mais nós. No modelo do sistema de banco de dados distribuído, o banco de dados em si é armazenado em diversos computadores que são chamados de nós. A comunicação entre um computador e o outro ocorre através de alguns meios que, por exemplo, são: redes de alta velocidade, redes sem fio ou ate mesmo linhas telefônicas.
A diferença entre sistemas de banco de dados centralizados e distribuídos, como o próprio nome já diz, no sistema centralizado todos os dados são armazenados em um só lugar e já no distribuído os dados ficam em vários locais e esta distribuição é o motivo de muitas preocupações e dificuldades.
Em um banco de dados distribuído há diversos enfoques para o armazenamento de dados, pois pode haver replicação, fragmentação e replicação e fragmentação. Na replicação o sistema faz replicas das tabelas e dos dados e cada replica é armazenada em cada nó que está ligado ao banco de dados. Na fragmentação ocorre um processo onde a tabela é dividida em vários segmentos e cada um desses segmentos é armazenado em um nó diferente. E na replicação e fragmentação a tabela é fragmentada em vários segmentos e o sistema cria varias replicas de cada segmento.
A parte de consulta em banco de dados distribuídos é mais fácil do que a parte de atualização, porque na parte de atualização é preciso certificar que cada replica ou fragmento seja atualizado após a atualização de alguma outra replica ou fragmento, e essa atualização deve ser feita em todas as replicas existente no sistema, não pode haver exceção.
Um problema em bases centralizadas na parte de consulta é a quantidade de acesso ao disco para atingir o resultado, já em bases distribuídas os problemas aumentam, pois alem da quantidade de acesso tem que se preocupar também com a transmissão dos dados pela rede, algo que pode ajudar na velocidade da consulta em uma base distribuída é fazer vários nós processar parte da consulta em paralelo.
As falhas que acontecem em um sistema distribuído são as mesmas que acontecem em um sistema centralizado, mas existem algumas a mais como, por exemplo, pode ocorrer falha de comunicação entro os nós, pode haver perde de mensagem e o particionamento da rede, esses problemas devem ser considerados no projeto de recuperação de uma base distribuída. E algumas vantagens de bases de dados distribuídos são: é mais econômico, tem melhor performance e maior disponibilidade.
•SGBDs que realizam replicação de dados.
•MySQL: a partir da versão 4.0 o MySQL faz a replicação de dados, ele permite um tipo de replicação conhecida como Master-Slave, onde se tem um servidor como o Master e um ou mais servidores como Slave. As replicas para os servidores Slaves acontecem de modo que o servidor Master grava logs binários de alteração em cada um desses servidores, assim qualquer alteração no Master é replicada também nos Slaves. A ferramenta que se utiliza para fazer replicação é a ObjectMMRS.
•SQL Server 2014: a replicação de dados feita pelo SQL Server 2014 acontece através da ferramenta chamada Linked Servers. O Linked Servers é uma ferramenta que faz conexões segurar entre um ou mais servidores. Administradores de bancos do SQL Server usam freqüentemente essa ferramenta para fazer consultas em outros servidores e bancos de dados distribuídos.
• Oracle: desde a versão 7.3 do Oracle é possível fazer replicação de dados. Hoje a ferramenta mais usado no Oracle para fazer replicação de dados é o Oracle GoldenGate, que é um produto que promove a integração em tempo real dos dados entre os sistemas heterogêneos de origem e de destino. No inicio o Oracle, assim como o MySQL utilizava o ObjectMMRS, mas após 2009 começou a usar o GoldenGate que se mostrou mais eficiente para a plataforma.
•Data Warehouse e Data Mining
A Data Warehouse trata-se de um sistema muito grande de informações históricas de decisão que são muito difíceis de serem armazenadas utilizando os meios tradicionais de armazenamento. Como a Data Warehouse armazena as informações “mais importantes” pode conseguir, com os tratamentos certos, descobrir tendências empresariais importantes.
Podemos dizer que uma Data Warehouse pode ser: orientada por temas, integrada, variado no tempo e não volátil. Dissemos que a Data Warehouse é orientada por temas porque nela armazena-se informações sobre determinados temas específicos importante para melhor o negocio da empresa. Uma Data Warehouse é integrada quando se faz uma transformação nos dados em que há
...