Big Data

¿Qué es Data Masking?

Data Masking es un proceso de sustitución de información confidencial de bases de datos en desarrollo por información aparentemente real. Te contamos más.

Por Redacción España, el 21/12/2020

auto ¿Te ha gustado nuestro artículo? ¡Vota!

Data Masking o enmascaramiento de datos es un proceso cuyo objetivo principal es ocultar ciertos elementos de datos en una base específica.

En términos empresariales, uno de los principales motivos por los que se usa el Data Masking es para proteger datos previamente clasificados como sensibles o identificadores.

A grandes rasgos, el enmascaramiento de datos oscurece registros dentro de una base de datos. De esta forma, la información sensible es reemplazada por datos con la misma apariencia, pero con diferente contenido.

Al reemplazar los datos reales por otros de apariencia similar, este proceso promueve la protección de los datos de valor y garantiza que puedan usarse en entornos de desarrollo y pruebas.

Hoy en día, la variedad de de datos que se pueden proteger gracias al Data Masking es inmensa. Aun así, la mayoría corresponden al terreno comercial y empresarial:

  • Información de identificación personal.
  • Datos sensibles.
  • Tarjetas bancarias.
  • Propiedad intelectual.

Data Masking y datos sensibles

La protección de los datos en las grandes corporaciones es un requisito indispensable. Cada vez cuentan con un mayor número de información sensible relativa a sus clientes.

Los datos sensibles son aquellos que requieren de extrema protección frente a usuarios no autorizados, ya que albergan información de carácter privado.

La clasificación de datos sensibles difiere de un país a otro. Sin embargo, existe un conglomerado de datos que siempre será considerado sensible, por ejemplo, los números de una tarjeta de crédito/débito, los detalles del PIN, los códigos de seguridad y/o las coordenadas.

En principio, los datos sensibles se pueden desglosar en tres tipos principales: información personal, información de negocio e información clasificada.

  • Información personal. Datos mediante los cuales puede rastrearse a un individuo y cuya divulgación puede actuar en perjuicio del dueño. Por regla general, suele englobar: datos biométricos, información financiera, identificadores únicos (DNI o pasaporte), número de la seguridad social, etcétera.
  • Información de negocio. Datos que, si son robados o descubiertos por un ciberdelincuente, consumidor o competidor podrían afectar gravemente a la actividad de la empresa. Esta información suele enfocarse en: datos financieros, planes de adquisición, proveedores, información sobre los clientes, etcétera.
  • Información clasificada. Datos pertenecientes a un organismo de la Administración, por ejemplo, secretos confidenciales de Estado.

Tipos de Data Masking

Existen dos tipos básicos de data masking: estático o dinámico.

Data Masking Estático

El enmascaramiento de datos estático (SDM) toma como referencia los datos de producción de la base de datos original. Después, aplica transformaciones para desidentificar los registros y eliminar la información sensible.

En esta versión de Data Masking, los datos conservan el contexto y la integridad referencial coherente, por lo que se pueden utilizar en entornos de pruebas, análisis o soporte.

Data Masking Dinámico

El enmascaramiento dinámico de datos (DDM) tiene como objetivo reemplazar los datos confidenciales en tránsito, dejando los datos originales en reposo intactos y sin cambios.

Este proceso permite a los departamentos de IT proteger la información en tiempo real. Los datos no abandonan la base de datos de producción y, por tanto, hacen que sea menos susceptible a las amenazas.

El enmascaramiento dinámico de datos evita el acceso no autorizado a información confidencial permitiendo que los clientes especifiquen la cantidad de información confidencial que se debe revelar, con un impacto mínimo en la capa de aplicación.

Un ejemplo de método de enmascaramiento dinámico es el de las tarjetas de crédito en los sitios web. Se exponen los últimos cuatro dígitos de los campos designados y al resto se le agrega una cadena constante como prefijo en el formato de una tarjeta de crédito: XXXX-XXXX-XXXX-1234.

Funciones de Data Masking

  • Protege los datos en tiempo real en base a políticas y funciones específicas.
  • El DM es una solución versátil y no intrusiva para aplicaciones o bases de datos. Ofrece soportes a diversos entornos, tanto virtualizados como tradicionales, de Big Data y de Cloud Computing, pero también evita el acceso no autorizado a las aplicaciones personalizadas, aplicaciones empaquetadas, data warehouses y almacenes de datos operativos.
  • Es un proceso escalable y fácil de configurar. Admite muchas bases de datos en una sola instalación, restringe el acceso a herramientas, aplicaciones y entornos, definiendo una sola vez las políticas de enmascaramiento de datos.
  • Bloquea los datos en tiempo real. Los datos enmascarados se mantienen en aplicaciones complejas mediante la sincronización de valores de los datos en filas y tablas. Por tanto, los datos originales nunca se cambian ni se modifican.

Técnicas de Data Masking

Encriptación

La encriptación es un proceso de seguridad que consiste en un cambio de composición de los datos de un archivo gracias al uso de algoritmos. El objetivo es hacer que los datos se vuelvan incomprensibles en caso de que un tercero los intercepte.

Una vez encriptados, únicamente los usuarios autorizados pueden acceder a ellos a través una clave específica. Se trata de un Data Masking muy complejo y seguro.

Shuffling

Esta técnica de enmascaramiento utiliza los datos existentes y cambia los valores de una columna en un archivo, tabla o base de datos. Además, puede restringir qué valores mezclar según una condición de búsqueda o restricción. El conjunto de salida parece de datos auténticos, pero no revela ninguna información personal real.

Sustitución

Al igual que en el caso anterior, la sustitución imita el aspecto de los datos reales sin comprometer la información personal de ningún individuo, es decir, se ocultan los datos auténticos haciendo creer que son reales, protegiéndolos de los ciberdelincuentes

Anulación

Como su propio nombre indica, esta técnica inhabilita o elimina los datos en el momento en el que cualquier usuario no autorizado quiera acceder a ellos.

Varianza

Esta técnica de Data Masking modifica cada valor de una columna por un porcentaje aleatorio de su valor real. Únicamente es válida para conjuntos de datos numéricos.

TAGS:
Imagen del autor Redacción España

Equipo de redacción de B12 España: Marketing, Big Data, Inteligencia Artificial y Ventas.

Ponte en contacto con nosotros:

+34 916 629 534

madrid@agenciab12.com

Calle Alcalá, 21, 8ºD. 28014 - Madrid