¿Cómo establecer un proceso eficaz de gestión de incidencias informáticas?
Desde una salida de impresora bloqueada hasta una aplicación fuera de servicio, son muchos los incidentes, más o menos críticos, que experimenta su sistema informático. De ahí la importancia de implantar un proceso de gestión de incidencias.
Pero, ¿cómo asegurarse de que su procedimiento de gestión de incidentes es eficaz? ¿Qué etapas de resolución debe definir y cómo debe determinar las funciones de cada persona en su proceso? ¿Es posible ofrecer una solución satisfactoria para el usuario, de acuerdo con su SLA (Service Level Agreement), y en plazos razonables?
Para ayudarle a lograr una mayor eficacia y coherencia, Appvizer le explica en este artículo los principios y etapas del marco ITIL, y le recuerda las ventajas que puede obtener de este método de trabajo.
¿Qué es la gestión de incidentes informáticos?
La mayoría de los incidentes informáticos se gestionan de acuerdo con la norma de la Biblioteca de Infraestructuras de Tecnologías de la Información ( ITIL).
Pero, ¿qué es exactamente ITIL?
Proyecto desarrollado en los años 80 por la Oficina de Comercio del Gobierno Británico, ITIL es un conjunto de documentos que enumeran las mejores prácticas a aplicar en la gestión de los servicios de TI sobre una base amplia. El objetivo es proporcionar apoyo metodológico a los profesionales, con la intención de mejorar continuamente.
El proceso ITIL abarca varios temas (organización del sistema de información, gestión de la configuración, gestión del cambio, etc.), entre ellos la gestión de incidentes, que se especifica del siguiente modo:
Un incidente se define como cualquier acontecimiento que no forma parte del funcionamiento normal de un servicio y que causa o puede causar una interrupción o una reducción de la calidad de este servicio.
💡 Esta definición abarca diferentes tipos de incidentes:
- incidentes de software o de aplicación. Ejemplos:
- error de programa que ralentiza al usuario,
- ralentización de la aplicación, etc.
- incidentes de hardware. Ejemplos
- salida de impresora bloqueada
- disco duro casi lleno, etc.
- Solicitudes de servicio. Ejemplos
- olvido de contraseña,
- solicitud de documentación específica, etc.
Gestión de incidentes VS gestión de problemas
La gestión de incidentes suele confundirse con la gestión de problemas. Sin embargo, implican procedimientos diferentes.
Según ITIL, la gestión de problemas se utiliza para :
Minimizar el impacto negativo en las actividades de la empresa de los incidentes y problemas causados por errores en la infraestructura informática, y evitar la repetición de incidentes inducidos por estos errores.
➡️ En otras palabras, la gestión de problemas es más proactiva, mientras que la gestión de incidentes es más reactiva.
Sin embargo, los dos procesos funcionan en paralelo, y la gestión de problemas opera a través de la identificación de incidentes recurrentes.
¿Por qué es importante la gestión de incidentes?
Un proceso estandarizado para gestionar tus incidencias genera numerosos beneficios para tu empresa 🤩 :
- reduce el impacto, a veces crítico, de las incidencias en la empresa y el negocio con mayor rapidez;
- simplifica enormemente el procedimiento evitando, por ejemplo, correos electrónicos de ida y vuelta ;
- Permite identificar los incidentes recurrentes, lo que permite desplegar el proceso de gestión de problemas mencionado anteriormente;
- Mejora la calidad de la base de conocimientos de la empresa mediante la creación de bases de datos para la gestión de incidentes;
- Proporciona transparencia dentro de la organización en cuanto a la resolución de incidentes;
- Aumenta la satisfacción de los usuarios y la productividad de todos en la empresa.
☝️ Tenga en cuenta que un proceso de gestión de incidencias va más allá de la simple resolución de un problema informático. Proporciona un soporte sólido a las funciones de negocio de la empresa, reduciendo el número de ralentizaciones o paradas en las actividades que repercutirían en el volumen de negocio.
Ejemplo de procedimiento de gestión de incidentes en 5 pasos
#1 Identificación y registro del incidente
Para empezar, hay que identificar el incidente, especificando :
- su nombre y número
- la identidad de la persona responsable
- la fecha en que se produjo el incidente
- y, sobre todo, sus características (naturaleza, gravedad e impacto en las operaciones).
Por ejemplo: una avería en un servidor que afecte a varios departamentos se considerará un incidente grave, mientras que un problema de conexión en un único puesto de trabajo se considerará menos crítico.
Corresponde al departamento responsable registrar estos datos en el dispositivo de su elección (programa informático, hoja de cálculo, formulario, etc.) y comunicarlo a los equipos de soporte encargados de tratarlo de acuerdo con el procedimiento.
#2 Clasificación y análisis del incidente
A continuación, el incidente se clasifica según el orden de prioridad definido previamente y específico de su organización, en función, por ejemplo, del impacto en la actividad y de la urgencia de la situación.
Por ejemplo, un fallo de la red podría clasificarse como incidente de "conectividad", con un nivel de gravedad "alto" si paraliza toda la empresa.
Al mismo tiempo, se realiza un análisis inicial para determinar las posibles causas del incidente. Para esta evaluación pueden utilizarse herramientas de diagnóstico o incluso la experiencia previa .
☝️ Tenga en cuenta que si se trata de una solicitud de servicio, debe seguir el procedimiento asociado.
#3 Investigación y diagnóstico de la incidencia
Se analiza toda la información relativa a la incidencia, con el objetivo de resolverla y ponerla de nuevo en servicio lo antes posible. Los equipos encargados de esta labor utilizan diversas metodologías, desde análisis de logs hasta pruebas en tiempo real.
👉 Por ejemplo: si se avería un servidor, el equipo consultará los registros de eventos en busca de errores críticos o utilizará herramientas de monitorización para comprobar el rendimiento del hardware.
Ten en cuenta que a veces el primer nivel de servicio es incapaz de resolver la incidencia: esto desencadena una escalada de incidencias, es decir, su resolución se traslada al siguiente nivel.
#4 Resolución de incidentes y vuelta al servicio
La resolución de incidentes adopta diversas formas:
- el incidente se repara inmediatamente Se ha resuelto y las operaciones se reanudan con normalidad;
- se ha encontrado una solución. La gestión de incidentes debe conducir al rápido restablecimiento de los servicios. Si el sistema no es perfecto, pero hace que la situación sea "aceptable", se respeta el proceso.
☝️ Tenga en cuenta que si se desconocen las causas subyacentes de un incidente, pero parecen tener el mismo origen, se recomienda iniciar un proceso de gestión de problemas. Recuerde que los flujos de gestión de incidentes y problemas a menudo se cruzan.
#5 Cerrar el incidente
Para cerrar correctamente un incidente, los equipos encargados del proceso llevan a cabo una serie de acciones:
- Se encargan de registrar todos los detalles de la incidencia y el tiempo empleado en ella. ☝️ Esta documentación sirve para crear un historial que puede consultarse para mejorar los protocolos en el futuro;
- informan al usuario de la resolución;
- Garantizan que todos los detalles de la solución sean claros y legibles.
Este nivel de detalle reduce el riesgo de conflicto entre las distintas partes interesadas.
Las partes interesadas en la gestión de incidentes
En la gestión de incidentes intervienen diferentes partes interesadas. Aunque difieren de una organización a otra, pueden identificarse algunas funciones básicas:
- El solicitante/usuario: notifica la incidencia, especificando claramente de qué se trata. El equipo técnico también puede recurrir a él al final del proceso para responder a las consultas.
- Los diferentes niveles de soporte: en función de su nivel, los equipos de soporte aportan las soluciones necesarias para resolver la incidencia y, en ocasiones, reasignan la incidencia no resuelta al nivel superior.
- El gestor de incidencias: vela por que la gestión de incidencias se realice correctamente, planifica el procedimiento y puede recomendar áreas de mejora.
- El propietario del proceso: dentro de la empresa, esta persona asume la responsabilidad del proceso de gestión de incidentes en general. También puede ser responsable de definir los KPI (Indicadores Clave de Rendimiento).
10 buenas prácticas para gestionar sus incidentes
Para estar mejor preparado para gestionar los incidentes informáticos y minimizar su impacto en las operaciones de tu organización, te recomendamos que sigas estas 10 mejores prácticas:
- ✅ Formar al personal. Asegúrate de que el equipo de soporte está bien formado en procedimientos y herramientas. El objetivo es garantizar un diagnóstico rápido y preciso.
- ✅ Establecer prioridades de forma eficaz. Establece criterios claros para priorizar de forma inteligente las incidencias en función de su gravedad o impacto en el negocio.
- ✅ Establecer una documentación rigurosa. Documente cada etapa de la resolución, desde el diagnóstico hasta la acción correctiva, para un seguimiento eficaz y un aprendizaje futuro.
- ✅ Comunicar con transparencia. Comuníquese de forma clara y periódica con las partes interesadas para mantenerlas informadas del estado del incidente y de las medidas adoptadas.
- ✅ Aplicar un proceso de validación. Antes de cerrar cualquier incidencia, valida la resolución con los usuarios. Esto confirma que sus problemas se han resuelto por completo.
- ✅ Realiza una revisión posterior al incidente. Lleva a cabo una revisión posterior al incidente. Servirá para identificar las causas raíz, así como las posibles áreas de mejora.
- ✅ Actualizar la base de conocimientos. Actualice periódicamente la base de conocimientos con información sobre la resolución de incidentes, de nuevo para ayudar a resolver incidentes similares en el futuro.
- ✅ Automatice las tareas repetitivas. Utilice la automatización para gestionar tareas rutinarias, como la clasificación de incidentes. El tiempo ahorrado permitirá al equipo centrarse en problemas más complejos.
- ✅ Piense en la "mejora continua". Realice auditorías periódicas de su procedimiento de gestión de incidencias, con el objetivo de identificar oportunidades de mejora.
- ✅ Utilice una herramienta de gestión de incidencias. Este es sin duda el consejo más importante. En efecto, invirtiendo en un sistema sólido de gestión de incidentes (ITSM en particular), usted rastrea y documenta todos los incidentes de forma centralizada.
Las herramientas adecuadas para la gestión de incidencias
Ya tiene una idea más clara del problema de la gestión de incidencias, pero quizá se pregunte cómo poner en práctica todas estas recomendaciones. ¿Ya se imagina aplicando su procedimiento de gestión de incidencias mediante una hoja de cálculo Excel o una herramienta tradicional de gestión de proyectos?
Afortunadamente, se han desarrollado programas informáticos específicos para ayudar a sus equipos en cada etapa del procedimiento de gestión de incidencias.
Para ayudarle, eche un vistazo a nuestra selección ✔️ :
- Jira. Desarrollada por Atlassian, la herramienta de gestión de tickets Jira estandariza el tratamiento de los tickets abiertos tras la notificación de un incidente.
😀 ¿Por qué Jira?- crear tickets con un nivel de información preciso (descripciones, nivel de gravedad, etc.) y seguir todos los procesos necesarios para gestionarlos ;
- clasifica y prioriza fácilmente los bugs, y asígnalos al empleado o departamento adecuado;
- integre sus tickets en un flujo de trabajo ya preparado o personalizable para adaptarlo a sus necesidades y procesos.
- NinjaOne. NinjaOne es una solución completa de gestión de activos de TI para pymes, ETI y grandes empresas.
😀 ¿Por qué NinjaOne?- Supervise de forma centralizada y proactiva toda su infraestructura de TI para detectar incidencias lo antes posible ;
- aplicar automáticamente los parches necesarios, de forma fiable, a todos sus puntos finales ;
- almacenar en la plataforma toda la documentación estandarizada y estructurada relativa a sus procesos.
- Octopus. Octopus es un ITSM (Information Technology Service Management), es decir, un software de gestión de servicios informáticos.
😀 ¿Por qué Octopus?- benefíciese de una herramienta desarrollada de acuerdo con las mejores prácticas ITIL: sus equipos podrán aplicarlas de forma natural sin necesidad de dominarlas a la perfección de antemano ;
- gestionar fácilmente las solicitudes de sus usuarios, ya se trate de incidencias o de peticiones de servicio;
- mejore la acción preventiva gracias a una base de datos que gestiona todos los aspectos de la configuración de sus sistemas de información.
- Splunk Enterprise Security. Splunk Enterprise Security es un SIEM (Security information and event management) diseñado para apoyarte en el refuerzo de la seguridad de los sistemas informáticos, y en la gestión de incidentes.
😀 ¿Por qué Splunk Enterprise Security?- benefíciate de una solución centrada en la analítica y, por tanto, en la agilización de las tareas relacionadas con la ciberseguridad ;
- obtener información en tiempo real a través de cuadros de mando y vistas personalizadas; ;
- detectar incidentes más rápidamente y tomar medidas preventivas.
¿Cuáles son los puntos clave de la gestión de incidentes informáticos?
La gestión de incidentes, estandarizada por ITIL, es un procedimiento que debe incorporarse a su sistema de información lo antes posible, ya que promete ofrecer una respuesta clara y rápida en caso de incidente.
Además, permite reducir progresivamente el número de incidentes al alimentar los procesos de gestión de problemas y, por tanto, las acciones preventivas.
Y la buena noticia es que todos ganan cuando se pone en práctica un método de trabajo de este tipo:
- Los equipos técnicos trabajan de forma más eficaz y transparente;
- los usuarios se ven menos afectados por los fallos y están más satisfechos con su producto;
- la empresa sufre menos pérdidas en caso de incidente crítico.
Por último, vale la pena recordar que una buena gestión de incidentes va de la mano del uso de herramientas pertinentes, que apoyen su proceso y ahorren un tiempo precioso a sus equipos.