Causas de downtime em data centers
Marcelo Barboza, da Clarity Treinamentos
Antes de mais nada, vamos definir downtime: é o tempo em que os serviços providos pelo data center ficam interrompidos. Podemos interromper os seus serviços, basicamente, por paradas planejadas ou não planejadas. Paradas planejadas são usualmente realizadas durantes serviços de atualização ou manutenção de equipamentos, componentes, hardware ou software. Aqui vamos nos ater às paradas não planejadas, que são as mais temidas e as que causam mais impacto e, portanto, ocasionam mais prejuízos à empresa.
Qual será a principal causa de downtime em data centers, então? Segundo estudo publicado, em 2016, pelo Ponemon Institute, “Cost of Data Center Outages”, a principal causa raiz de downtime tem sido a falha do sistema UPS. Ou seja, falha no sistema que deveria justamente manter o fornecimento elétrico aos serviços de TI de maneira contínua, ininterrupta e com qualidade. Cerca de 25% de todas as paradas são causadas por esse motivo, de acordo com esse estudo, que contou com a participação de 63 data centers norte-americanos.
E qual é o segundo lugar? Pasmem, a segunda colocação ficou com o crime cibernético, com 22%. Um aumento de 11 vezes desde o primeiro estudo, de 2010, quando ele representava apenas 2% das causas de downtime em data centers. Foi o motivo que apresentou o maior crescimento dentre as sete principais causas identificadas no estudo (UPS, cibercrime, erro humano, climatização, clima, gerador, equipamento de TI). Empatado com o cibercrime, temos o erro humano, também com 22%.
Em último lugar, temos as falhas em equipamentos de TI, com apenas 4% das causas de downtime em data centers. Mas aí que vem a surpresa: embora os equipamentos de TI representem apenas 4% dos erros, eles são responsáveis pelos maiores prejuízos quando falham. Em média, os defeitos nos equipamentos de TI provocam prejuízos na ordem de US$ 995 mil, seguido de perto pelo cibercrime (US$ 981 mil) – nos sistemas UPS esse valor chega a US$ 709 mil. O erro humano causa perdas médias na ordem de US$ 489 mil.
Qual será o custo por minuto de um data center parado de forma não planejada? O número varia bastante, desde US$ 926 até US$ 17,2 mil por minuto. O custo médio de downtime aumentou 38% entre 2010 e 2016, enquanto o custo máximo reportado cresceu 81% no mesmo período.
Finalmente, os três segmentos de mercado que apresentam os maiores custos por decorrência de downtime são os serviços financeiros, comunicações e saúde.
Como podemos diminuir todo esse downtime em data centers? Existem diversas técnicas, que passam pela implantação de níveis de redundância, escolha de componentes de melhor qualidade, melhor localização do data center, treinamento do pessoal de operação, cumprimento de rigoroso plano de manutenção preventiva e preditiva, criação de uma documentação abrangente e precisa da instalação e dos processos.
Marcelo Barboza é formado no Mackenzie, atua no desenvolvimento e aplicação de cursos e consultoria em cabeamento estruturado e em projetos de telecomunicações em data centers. Instrutor oficial no Brasil para a Fluke Networks (certificação de cabos de cobre e fibra óptica), Panduit (instalação de cabeamento estruturado) e DCProfessional (fundamentos e eficiência energética de data centers). Certificado pela DCProfessional (Data Center Specialist – Design), pela BICSI (RCDD, DCDC e NTS) e pelo Uptime Institute (ATS).