A alta disponibilidade é possível graças à tolerância a falhas e redundância. A tolerância a falhas é definida como um recurso que, em caso de falha de um componente, desencadeia outro procedimento de backup ou componente para assumir. Isso significa pouco ou nenhum serviço de perda.
A tolerância a falhas é normalmente estabelecida com alguma combinação de software e hardware. Essencialmente, ela garante que o serviço está disponível para os usuários em todos os momentos.
Ao implantar um sistema de alta disponibilidade, parte da criação de uma alta tolerância a falhas é identificar e expulsar pontos únicos de falha (SPOF). O SPOF é um componente do sistema que, quando falha, perturba todo o sistema, tornando-o pouco confiável ou não disponível.
A redundância serve essencialmente como um backup, além de contribuir para a disponibilidade geral do sistema. Ela pode ser passiva ou ativa.
Redundância ativa
Envolve dois sistemas de processamento exatamente iguais, mas apenas uma saída é usada para que não haja redundância no ponto final. Ambos os componentes são igualmente potentes, assim, se um dispositivo falhar, não há alteração nas capacidades de um dispositivo para outro.
Redundância passiva
Permite que um dispositivo processe a ação e o outro permaneça inativo. O segundo dispositivo fica pronto para ser utilizado em caso de falha. Isso requer um componente de comutação, que pode mudar o canal de entrada e de saída durante o processamento de uma falha.
A redundância atenua os SPOFs, fornecendo uma segurança a mais se um único componente de hardware falhar. Sem redundância, uma única falha de hardware pode ser fatal para uma máquina.