Gestão de mudanças de engenharia do data center
Desenvolver, treinar e aplicar procedimentos formais de gerenciamento de mudanças reduz os riscos de falhas no data center e as possibilidades de erros humanos.
José Roberto da Silva e Luís V. R. Dória, diretores da Top Tier Infrastructure
O processo de gerenciamento ou gestão de mudanças (GMUD) é bem conhecido nas mais variadas organizações, mas quase sempre ocorre apenas em TI e sistemas, enquanto que nas áreas de engenharia (elétrica, mecânica, controle e segurança) do site o tema é desconhecido ou não aplicado. Qualquer trabalho em equipamentos críticos, ou em torno deles e em seus sistemas de suporte, requer precauções especiais e coordenação com as partes interessadas afetadas (clientes / grupos de TI) para assegurar que os resultados pretendidos sejam alcançados, sem quaisquer consequências indesejadas ou inesperadas.
Todas as mudanças estão sujeitas a um planejamento aprofundado, a avaliação de impacto e a um processo de aprovação, com o objetivo de minimizar a probabilidade de problemas pós-execução.
É muito importante que se tenha um método consistente para monitorar a qualidade e o desempenho do processo de gerenciamento de mudanças e apenas permitir que a mudança ocorra após um processo formal de revisão e aprovação. Alguns dos elementos para um processo de controle de mudanças bem-sucedido, incluem: condução de revisões dos procedimentos de trabalho por pares; reuniões dos responsáveis das áreas; rastreamento, atribuição, mitigação e comunicação de riscos; avaliação de possíveis impactos e controle; aprovações; vistorias prévias no local do trabalho; planejamento das janelas de serviços; e supervisão de fornecedores/contratados.
O gerenciamento inadequado desse processo pode resultar em falhas, como uma manobra de válvula errada, ou uma comutação de alimentação incorreta, que podem causar erro no processo, terminando em acidente e/ou paralisação (outage) do site.
O principal mecanismo para controlar e gerenciar mudanças na área de instalações de missão crítica é o MOP – Método de Procedimento. Ele é, essencialmente, uma lista de verificação detalhada, passo a passo, de cada etapa de uma tarefa específica, como uma atividade de manutenção preventiva ou corretiva. Não é somente uma ferramenta importante para controlar a atividade de trabalho, mas é parte de um processo maior de gerenciamento de mudanças.
Riscos para a segurança e disponibilidade do sistema precisam ser identificados, documentados e comunicados no MOP. As atividades de mudança planejadas precisam ser comunicadas claramente aos indivíduos apropriados, de maneira oportuna, para que ninguém seja pego de surpresa pela mudança ou por qualquer problema que possa ocorrer quando a mudança for feita.
Por fim, como os fornecedores OEM e os provedores de serviços terceirizados, geralmente, estão envolvidos nesses procedimentos é importante que eles sejam cuidadosamente gerenciados e supervisionados. Neste caso, a orientação ao fornecedor deve ser no sentido que os técnicos designados para a mudança estejam habilitados e familiarizados com as instalações e suas regras de trabalho, com os procedimentos de segurança do trabalho, bem como com o processo de supervisão e os MOPs envolvidos na mudança.
Em resumo, um programa de gerenciamento de mudanças que inclua todos esses itens minimizará a ocorrência de erros que resultariam em tempo de inatividade, retrabalho e em custos associados. Desenvolver, treinar e aplicar procedimentos formais reduz enormemente os riscos de falhas do site e as possibilidades de erros humanos.