O CUSTO DA INDISPONIBILIDADE DOS DATA CENTERS E O FATOR HUMANO

ICOR Brasil
13 de abr. de 2020
3 min de leitura

Autores: José Roberto da Silva e Luis V. R. Dória, ambos Diretores da

Top Tier Infrastructure e Instrutores do ICOR no Brasil. Certificados como especialistas pelo US D.O.E (United States Department of Energy) como DCEP e como instrutores para as Certificações CEFA, CET, CEM, CEE e CEA pelo ICOR.

A escalada da dependência de tecnologias no dia a dia das empresas e das pessoas leva a uma crescente necessidade de disponibilidade dos Data Centers que abrigam equipamentos e sistemas, assim como de comunicação para transmissão de dados e voz. A resiliência dos Ambientes de Missão Crítica torna-se de fundamental importância para os negócios neste cenário.

Missão Crítica refere-se a qualquer elemento do sistema (componentes, equipamentos, pessoal, processos, procedimentos, software, etc.) que é essencial para a operação dos negócios ou para uma organização. Falha ou interrupção de elementos de Missão Crítica irá resultar em sério impacto sobre as operações de negócios ou em uma organização e pode até mesmo causar turbulência social e catástrofes. Portanto, é extremamente crítico para a organização, evitar falhas de Missão Crítica, assim o objetivo de todo Data Center é evitar uma interrupção de sua atividade (ou ”Outage”) e os efeitos e custos decorrentes.

Mas quanto custa a inatividade do meu ambiente? Os fatores de contribuição de custo afetam os Data Centers e organizações de forma distinta, pois dependem do seu tamanho, segmento de mercado e do horário e duração da ocorrência, mas são sempre muito relevantes, podendo significar até a extinção de uma organização. Em estudos realizados pelo instituto independente de pesquisas Ponemon Institute LLC, baseados em 63 Data Centers com amostras representativas de organizações de diferentes setores mercado, que experimentaram pelo menos uma interrupção não planejada, total ou parcial, do Data Center, apontam que o custo médio de uma interrupção aumentou de forma constante de US$ 505.502 em 2010 para US$ 740.357 em janeiro de 2016, ou uma variação líquida de 38%. Se mantida a curva de crescimento das três primeiras pesquisas, podemos considerar que passarão de US$ 1 Milhão daqui a 4 anos. O custo máximo de interrupção dentre os ambientes pesquisados já atingiam a cifra de US$ 2.5 Milhões em 2016!

É certo que os custos aumentarão. E o que pode ser feito para reduzir a velocidade do crescimento? Precisamos, primeiramente, entender a raiz dos problemas que levam ao outage do Data Center. Eles são classificados em dois grandes grupos: as falhas de equipamentos e os erros humanos. É importante ressaltar que uma indisponibilidade causada por desastres naturais ou agentes externos (ex: sabotagem, terrorismo e cybercrime), somente afetará o negócio em si se não houver um plano de BC/DR (Business Continuity/Distarer Recovery), o que seria classificado como "erro humano" nesta metodologia de análise de causa raiz. Um erro de projeto ou de execução também receberia a mesma classificação. A evolução tecnológica dos componentes de equipamentos e os projetos redundantes fizeram com que, ao longo do tempo, a parcela de "falha de equipamento" se reduzisse como causa de outage de Data Center e, por consequência, fizesse sobressair a componente dos "erros humanos", que chegou a 24% das causas, perdendo apenas para as falhas em UPS, com 25% do total em 2016.

Assim, as organizações líderes, em diferentes segmentos de mercado, em Data Centers corporativos ou de provedores de serviços, têm dado foco em atuar nas falhas atribuídas a erros humanos e na maturidade dos processos que envolvem as várias áreas de Operação e Manutenção desses ambientes de missão crítica, fator que hoje, diferencia a disponibilidade e eficácia dos Data Centers.

Essa tarefa não é simples na medida que envolve diferentes áreas das organizações e afetam dezenas de processos que iremos abordar nos próximos artigos, tais como: Preparação e Respostas a Emergências; Análise de Causa Raiz, Respostas Pós-evento; Processos de Operação e Manutenção MOP/SOP/EOP; Treinamento e Capacitação de Equipes; Gestão de Manutenção em Facilities; Gestão de Mudanças, Riscos e Impactos no Data Center; Seleção e Gestão de Vendors de Facilities; Gestão do Site; Operação, Eficiência e Coordenação do Site; Preparação para Auditorias e Certificações de um Data Center.

José Roberto da Silva, CET CEM CEA Luís V. R. Dória, CET CEM CEA Diretores da Top Tier Infrastructure

O CUSTO DA INDISPONIBILIDADE DOS DATA CENTERS E O FATOR HUMANO

Posts recentes

Comentários