search El medio de comunicación que reinventa la empresa

¿Cómo anonimizar - seudonimizar datos abiertos?

¿Cómo anonimizar - seudonimizar datos abiertos?

Por Jérôme Chagnoux

El 28 de octubre de 2024

Desde hace unos meses, sólo se oye hablar del RGPD, el Reglamento General de Protección de Datos de la Unión Europea. Todo el mundo le pregunta cómo va a cumplirlo su empresa... sin entender realmente de qué se trata. Los proveedores y los consultores son cada vez más ingeniosos a la hora de ofrecerle la posibilidad de participar en eventos sobre el tema... pero todo lo que hacen es rozar la superficie.

Cuando se trata de soluciones de seguridad informática, ya has implantado el cifrado y controlado cuidadosamente el acceso a tu sistema de información. Ahora se plantea la anonimización, que aparece una y otra vez en sus debates, junto con la seudonimización: ¿cómo hacerlo? ¿Cómo organizarla?

RESUMEN :

Una toma de conciencia tardía

Resulta sorprendente que hayamos esperado a la aparición de una restricción reglamentaria importante para volver a hacer hincapié en una disciplina que existe desde hace tanto tiempo.

Por tanto, es legítimo preguntarse "¿Por qué?

"¿Por qué hemos esperado tanto?" "¿Por qué no se ha hecho ya?


... tan obvio es para todos los clientes que no se debe "jugar" con su información personal.

Hay muchas explicaciones, pero al final sólo interesan a quienes viven en el pasado.

Así que veamos el panorama actual: las empresas comparten los datos de producción (los que necesitan para su actividad diaria) para satisfacer diversas necesidades:

  • Copiar toda la producción para que los desarrolladores y administradores puedan probar actualizaciones, parches y cambios de versión,

  • Aumentar la agilidad y la competitividad desarrollando nuevas funcionalidades y modelos analíticos en un entorno lo más parecido posible al de producción,

  • Analizar tendencias (consumo, comportamiento, investigación médica, etc.) compartiendo datos con consultores e investigadores para que puedan aplicar modelos estadísticos o de Machine Learning.

Como resultado, miles de millones de datos de clientes (por muy confidenciales que sean) salen desprotegidos de los entornos de producción.

El RGPD, un acelerador para la responsabilidad de todos los actores

Estudios recientes de analistas sobre la confidencialidad de los datos tienden a mostrar que las empresas no tienen forma de saber si los datos que salen de un entorno de producción se han visto comprometidos.

Creo que el "¿Por qué?" resulta obvio: a pesar de cualquier restricción reglamentaria, la persona cuyos datos personales se están utilizando sin saber si van a ser compartidos y comprometidos es usted, soy yo, son nuestros hijos...

La protección de la intimidad es un derecho fundamental garantizado por la Declaración Universal de los Derechos Humanos.

Todos debemos aplicar este mecanismo para garantizar que nuestros datos se utilicen con fines justificados y limitados.

Por ello, todos, como directores de empresa y responsables de sistemas informáticos, debemos aplicar este mecanismo para garantizar que nuestros datos se utilizan para fines justificados y limitados.

Identificar los medios de protección adecuados

El RGPD no es la respuesta a la pregunta "¿Por qué?", pero puede ser el principio de la respuesta a la pregunta "¿Cómo?".

En primer lugar, el marco reglamentario y, sobre todo, las sanciones económicas y otras multas asociadas al mismo, son una palanca para financiar la puesta en marcha del proyecto de anonimización.

Elaborar un registro de las operaciones de tratamiento de datos, tal como exige el RGPD, es una buena manera de determinar la ubicación exacta de los datos personales en el sistema de información... para poder identificar rápidamente lo que hay que anonimizar.

En segundo lugar, el Reglamento nos insta a pensar ante todo en la necesidad de tratar datos personales y aboga por el principio de minimización de los datos: "lo necesario en relación con los fines para los que se tratan".

Por ejemplo:

¿Es realmente necesario disponer de todos los datos de producción en los entornos de desarrollo, cualificación o formación? En última instancia, ¿no es demasiado costoso y arriesgado?


El muestreo de datos es una segunda respuesta: reducir la superficie de riesgo seleccionando (de forma inteligente) un conjunto representativo de datos, que luego pueden anonimizarse en función de las necesidades de la empresa.

El Reglamento también propone mecanismos simplificados, como la seudonimización, que consiste en sustituir los datos personales por un seudónimo, enmascarando de hecho el vínculo con el individuo original (siempre que el vínculo entre el seudónimo y el individuo no sea trivial o se conserve).

¿Cómo puede aplicarse la anonimización de datos?

Dicho esto, ninguna de estas vías orienta a las empresas sobre cómo deben organizarse. Este puede ser el nudo gordiano de la anonimización:

  • "¿Debo anonimizar aplicación por aplicación?".
  • "¿Qué hacer con las aplicaciones que comparten los datos personales de un mismo individuo?
  • "¿Qué estructura organizativa satisfará los requisitos de la empresa?
  • " "¿Perderé agilidad en la evolución del sistema de información?

Está claro que la organización es la piedra angular del proyecto de anonimización y determina su éxito.

Hay que implantar un "servicio de anonimización industrializado" capaz de responder a las necesidades de todos los equipos informáticos, que serán los más afectados:

  • tener la capacidad de abordar todas las tecnologías (respetando sus normas de licencia y soporte, por supuesto);

  • ofrecer un muestreo inteligente de alto rendimiento: no se limitan a buscar las primeras 1.000 líneas... buscan un conjunto representativo de datos en una fuente de datos y en repositorios subsidiarios (para garantizar la integridad referencial entre aplicaciones);

  • garantizar niveles de servicio de alto rendimiento: ofrecer anonimización a la carta o automatizada;

  • ofrecer una biblioteca de formatos completos de anonimización (sustitución aleatoria, borrado de datos, reescritura, etc.).

Este servicio de anonimización aportará cambios positivos en los métodos de trabajo de los equipos informáticos, con un impacto mínimo en su trabajo diario.

Elegir las herramientas adecuadas

Como se habrá dado cuenta, este tema no depende en última instancia de la tecnología. Pero, ¿qué pasa con las herramientas?

La bibliografía le ayudará a comprender los distintos algoritmos de anonimización, como "k-anonimato", "l-diversidad", "t-proximidad" o "confidencialidad diferencial", cuya eficacia y nivel de protección pueden juzgarse...

Tantas herramientas a disposición de los especialistas para aplicar la anonimización adecuada al conjunto de datos adecuado.

En cambio, me gustaría centrarme en una solución de anonimización industrial que garantice :

  • conectividad multi-fuente y multi-destino, para que se convierta en la herramienta central y unificadora de la empresa, garantizando una anonimización que respete la integridad referencial entre aplicaciones ;

  • un asistente, que permite construir flujos de trabajo de anonimización adaptados al conjunto de datos (descubrimiento de datos sensibles en la fuente, propuesta de algoritmos adecuados, previsualización de resultados, etc.)

  • la posibilidad de automatizar las cadenas de anonimización para garantizar niveles de servicio optimizados (tratamiento nocturno, actualización del conjunto de datos a petición, etc.);

  • facilidad de uso, para que el equipo encargado del servicio de anonimización pueda aumentar rápida y fácilmente sus competencias y capacidades.

Por supuesto, la solución debe garantizar que ella misma cumple las buenas prácticas del RGPD: cifrado, control de acceso a cuentas privilegiadas, supervisión... porque la infraestructura de anonimización estará en la encrucijada de los flujos de datos personales.


La iniciativa "Data Masking Factory " de Oracle cumple estos requisitos y se ha convertido en una solución agnóstica y de alto rendimiento para prestar servicios de anonimización.

Los datos personales no son cosa de risa

2018 es el año del cambio de paradigma: es la era de la toma de conciencia de que nuestros propios datos personales es lo que las empresas manejan con demasiada ligereza.

Cada uno, a su nivel, debe integrarse y entender que el juego con los datos se ha acabado.

El RGPD es un recordatorio de buenas prácticas, entre las que la anonimización desempeña un papel fundamental.

Más que un proyecto técnico, necesitamos una organización y unas herramientas eficaces para ofrecer a los usuarios empresariales un servicio de anonimización de alto rendimiento.

Artículo traducido del francés