Sistemas Distribuídos - Atividade Avaliativa Tolerância a Falhas
Por: wypr • 6/2/2019 • Exam • 846 Palavras (4 Páginas) • 295 Visualizações
Sistemas Distribuídos - Atividade Avaliativa
Tolerância a falhas
1ª)
Disponibilidade: Quando um sistema está pronto para ser executado imediatamente. Em outras palavras, um sistema que possui disponibilidade é aquele que dado um instante de tempo qualquer, ele estará disponível para ser usado.
Confiabilidade: Quando o sistema tem a propriedade de continuar sua execução sem o risco de ocorrer falhas, ele é considerado confiável. Diferente da disponibilidade, um sistema possui confiabilidade se em dado intervalo de tempo o mesmo não apresente falhas.
Segurança: Quando um sistema possui a característica de segurança. ou seja, se por algum motivo o sistema parar de funcionar, é garantido que nada desastroso ocorrerá. Um bom exemplo de sistema seguro são as naves espaciais, já que toda falha é extremamente crítica e pode por em risco a vida de pessoas.
Capacidade de manutenção: Quando um sistema consegue recuperar facilmente de uma falha qualquer. Pode-se dizer que sempre que um sistema possui alta capacidade de manutenção, consequentemente ele também possuirá disponibilidade, já que sempre irá se recuperar de falhas e manter-se ativo.
2ª)
Falha Transiente: São aquelas que ocorrem somente uma vez e depois desaparecem. Ou seja, quando repetida a operação que ocorreu a falha, ela não apresentará problemas.
Falha intermitente: São aquelas que não possuem um padrão para acontecer, hora está funcionando normalmente, hora está com problemas. Um exemplo comum desse tipo de falha, são cabos com mal contato.
Falha permanente: São aquelas em que o defeito persiste e é necessário uma troca de equipamento para manutenção.
Falha por queda: O servidor para de funcionar, mas estava funcionando normalmente até a parada.
Falha por omissão: O servidor não consegue responder as requisições que chegam. Neste tipo de falha, pode ocorrer de duas maneiras, o servidor não consegue enviar mensagens ou ele não consegue receber as mensagens.
Falha de temporização: A resposta do servidor se encontra fora do intervalo de tempo.
Falha de resposta: O servidor sempre responde com respostas incorretas.
Falha arbitrária: O servidor começa a produzir respostas arbitrárias em momentos arbitrários.
3ª) Utilizando de replicação de processos, pode-se obter proteção contra falhas de processo.
Grupos simples são aqueles em que todos possuem a mesma “patente”, em outras palavras, todos estão no mesmo nível. Neste tipo de grupo, a principal vantagem é que nenhum ponto de falha único existe. Por outro lado, as tomadas de decisões são mais complexas;
Já em grupos hierárquicos, temos que alguns processos são do nível baixo (operários) e temos também processos de nível superior (coordenadores), que neste caso, atribuem atividades aos operários. Temos praticamente um cenário inverso ao do grupo simples, já que se o processo coordenador cai, todos os operários ficam sem “trabalho” e caso ele esteja ativo, todas as tomadas de decisões são simples.
4ª) O principal objetivo é que todos os processos que não apresentam falhas entrem em um acordo e mantenham esse acordo durante um número finito de etapas.
Basicamente o objetivo é conseguir um voto majoritário entre um grupo de processos não faltosos, independentemente de haver também processos faltosos em seu meio. Se houver k processos faltosos, o algoritmo deve garantir que mesmo com os votos dos processos
faltosos junto com o voto dos processos corretos que, por sua vez, foram enganados pelos faltosos, ainda corresponda ao voto majoritário dos processos não faltosos.
5ª)
...