Los Pilares del Monitoreo

Por julio 16, 2018

A pesar de parecer simple, medir el desempeño y la disponibilidad de aplicaciones nunca fue una tarea sencilla. Algunos de los motivos son: desconocer el legado, un equipo de desarrollo siempre centrado en entregar nuevas funcionalidades, un equipo de seguimiento de la producción centrado en solucionar los problemas críticos del día, múltiples tecnologías involucradas, infraestructura compuesta por una cantidad gigantesca de componentes, etc. En este contexto, existen tres pilares importantes que deben considerarse: el monitoreo preventivo, proactivo y analítico.

El monitoreo preventivo trata sobre el seguimiento y monitoreo realizados durante las fases de pruebas y de garantía de calidad del software, que normalmente se producen antes que la aplicación entre en producción. Integración con herramientas de prueba de carga y herramientas de desarrollo, entre otros, son esenciales para comprender cómo se comporta la aplicación. Contar con un benchmark sobre la salud de la aplicación es una garantía de que cumplirán con los requisitos mínimos de desempeño de producción.

El monitoreo proactivo se basa en identificar anomalías en el entorno antes de impactar en la experiencia final del usuario. Al utilizar información clave como algoritmos de desvío de comportamiento, es posible comprender cuándo el entorno se está dirigiendo a un problema. Si el problema sucede de manera repentina y no es posible anticiparlo, la identificación quirúrgica de la causa de raíz es fundamental para recuperar rápidamente y atenuar las pérdidas. En este punto la cobertura de monitoreo tiene un impacto importante, ya que un componente no monitoreado puede ser justamente el responsable del problema.

No solo eso, a través de una plataforma de Analytics con todos estos datos de operación recopilados, el equipo de operaciones puede generar insumos estratégicos y obtener insights de negocio que ayudarán a producir ingresos y evitar desperdicios. Por ejemplo, ¿cuál es el valor de comprender que todos los clientes de la región sudeste que utilizan iPhone tienen problemas para finalizar la compra de su producto?

Delta Airlines llegó a tener pérdidas por U$ 150 millones durante una interrupción de servicio el 8 de agosto de 2016. En 2017, otro caso de indisponibilidad fue el de Amazon AWS que impactó en muchas empresas que confiaban su operación al gran proveedor de servicios de TI. Imagine cuánto dinero se ahorraría si se hubiera señalado e identificado el problema previamente. En esta cuenta no deben considerarse solo las indisponibilidades, sino también el costo de no saber dónde está el problema, lo que normalmente genera un “war room” llena de especialistas. Ellos podrían estar produciendo mejoras y lanzando nuevos productos, pero están allí tratando de solucionar un caso que debería haberse identificado semanas antes, durante la fase de desarrollo o QA, incluso antes de haber pasado a producción. Invertir en un centro de monitoreo (personal y herramientas) es como comprar un seguro y justificar el costo de implementación, mantenimiento y crecimiento de estos equipos.

En la Fábrica de Software Moderna, el equipo de operaciones es protagonista y  facilitador de mejoras en todas las fases de la cadena de desarrollo de TI, aporta datos críticos para la toma de decisiones e incluso funciona como seguro y garantía de que todo el esfuerzo y dedicación no serán en vano. Conozca cómo podemos ayudarlo a impulsar la disciplina de monitoreo mediante insights técnicos que facilitarán su proceso de troubleshooting. CA APM y CA AXA pueden darle una nueva visión sobre su negocio. ¿Desea leer más sobre la disciplina? Sugiero leer este otro artículo en el cual cito cómo potenciar el monitoreo.

Escrito por Luiz Eduardo Freire Emmerich
Sr Consultant, Presales na CA Technologies
LinkedIn: @luizemmerich