¿Qué es la administración de incidentes en TI?

Descarga el PDF

¿Qué es la administración de incidentes en TI?

Actualmente, los complejos entornos de las Tecnologías de Información (TI) con las que cuentan las empresas pueden ser susceptibles a una falla y causar un incidente de alto impacto. Cualquier mala configuración de segundos, o la omisión de un sólo parámetro, puede llevar rápidamente a un problema de caída del sistema o servicios y causar daños a la reputación, clientes insatisfechos, pérdidas financieras, responsabilidades legales y la reorganización completa. Saber de qué se trata una correcta administración de incidentes ayuda a paliar estos conflictos.

Lo primero es tener un buen equipo de gestión, que puede ser similar a un grupo de bomberos que sale corriendo contra tiempo para estabilizar una crisis de alta prioridad.

Decidir si el incidente fue causado por un código de aplicación, la configuración, el sistema operativo o la incompatibilidad de la infraestructura puede ser muy difícil. Esto se complica aún más por el corto periodo de tiempo disponible para la solución.

Para hacer frente a esta cuestión, la mayoría de las organizaciones montan un escenario de “cuarto de guerra”, con un equipo de administración de incidencias, compuesto por miembros clave de desarrollo, soporte de producto y operaciones de TI.

Este grupo analiza la información y la configuración del entorno tecnológico, que comparan con otros para prevenir o investigar que tipo de incidentes, ya sea ambiental o humano, origina el problema.

Cuando hay un cuadro real de especialistas, la administración de incidentes es mejor, pues al centrar los esfuerzos en la investigación, se puede identificar rápidamente si hubo cambios de configuración, un fallo humano o ambiental, o cualquier otro impacto que sea la causa raíz del conflicto.

ADMINISTRACIÓN DE INCIDENTES, EN MANOS DE LOS EXPERTOS

Ya sea a nivel externo o interno, un equipo de expertos debe ofrecer una respuesta rápida sobre los incidentes para evitar pérdidas a la empresa, y dar a conocer paso a paso el proceso utilizado para reparar el problema. Con ello, el personal puede usar la información antes visualizada para mejorar el software de gestión e identificar áreas de cambio que a futuro puedan desencadenar nuevamente un conflicto de la misma índole.

Cuando se producen incidentes de alto impacto, una carrera contra el tiempo inicia para averiguar qué pasó y conseguir una solución. Los equipos están bajo una presión significativa para identificar la causa y evitar que todo se salga de control.

Ya se trate de un fallo de hardware o de software, las políticas formales de administración de incidentes pueden permitir a las organizaciones reducir al mínimo el tiempo de inactividad, optimizar el rendimiento, reducir los costos de soporte y maximizar el retorno de sus inversiones en tecnología. Pero, con el fin de lograr una gestión exitosa de incidentes de TI, las empresas deben definir e implementar flujos de trabajo estandarizados y actividades para identificar, registrar y clasificar los problemas.

Además, debe haber la manutención de los equipos específicos de TI, realizar un monitoreo y seguimiento del incidente, una vez que está siendo manejada la situación. Se debe facilitar la comunicación entre el propietario de apoyo y el usuario final afectado.

Muchos expertos de la industria creen que la información es un componente crucial de la administración de incidentes. Por ejemplo, con el fin de detectar los problemas en curso dentro de su infraestructura, las empresas deben analizar periódicamente el número de sucesos totales por gravedad y/o categoría, el número de problemas resueltos, el de incidentes que requieren atención inmediata, y otra métricas vitales. Además, los indicadores de rendimiento, como el tiempo medio para restaurar la operación también deben ser informados, para determinar si se están siguiendo los procedimientos con eficiencia.

Muchos confunden la administración de incidentes en TI con la administración de problemas, que son a la vez parte de la operación. Es importante recordar la diferencia, pues la primera aborda el manejo de las cuestiones individuales, mientras que la segunda se centra en el manejo de los problemas recurrentes. De ahí que sea importante con contar con buenos equipos de expertos para reaccionar oportunamente.