Enmascarado de Texto No Estructurado en AWS S3
Datos en la Nube
Estamos viviendo en un mundo donde los datos son uno de los activos más valiosos. Y la industria de TI está desarrollando constantemente maneras de almacenar estos datos de la manera más conveniente.
Almacenar datos en la nube es una de las formas más populares de almacenar datos. Todos hemos escuchado y usamos plataformas como Amazon Web Services, Alibaba OSS, Minio, etc.
Sin embargo, si los datos tienden a almacenarse en la nube, los hackers estarán atacando estos almacenamientos. Los propietarios de las bases de datos pueden pensar que sus datos sensibles están completamente seguros allí. Vamos a discutir si esto es completamente cierto.
La seguridad es una responsabilidad compartida entre el proveedor de la nube y el cliente en la nube: AWS gestiona la seguridad de la nube y los clientes son responsables de gestionar la seguridad dentro de la nube.
Sin embargo, hay tipos de documentos que son difíciles de proteger ya que los datos dentro de ellos son solo texto plano cuando hablamos de textos no estructurados, archivos CSV, XML y JSON. DataSunrise te permite controlar el acceso a estos archivos y enmascarar su contenido si es necesario.
Posibilidades de Enmascarado
XML
XML ha encontrado una aplicación extremadamente amplia en numerosos y variados programas y dispositivos para manejar, estructurar, almacenar, transmitir y mostrar datos en línea. No es de extrañar que todo lo que guardamos en línea utilizando XML sea extremadamente vulnerable a fugas y hackeos.
A continuación puedes ver cómo se ve un archivo XML protegido por DataSunrise.
<people_test> <record> <id>1</id> <first_name>********</first_name> <last_name>*****</last_name> <email>[email protected]</email> <gender>Male</gender> <ip_address>181.236.58.217</ip_address> </record> <record> <id>2</id> <first_name>*******</first_name> <last_name>******</last_name> <email>[email protected]</email> <gender>Male</gender> <ip_address>201.187.144.70</ip_address> </record> <record> <id>3</id> <first_name>*******</first_name> <last_name>****</last_name> <email>[email protected]</email> <gender>Female</gender> <ip_address>113.21.227.26</ip_address> </record> </people_test>
Como puedes ver, hemos ocultado datos sensibles como nombres y apellidos. Usando XmlPath en DataSunrise en la forma tabular puedes especificar las etiquetas XML que se deben enmascarar. Para enmascarar todos los datos, deja el campo XmlPath vacío. Después de eso, puedes elegir el método de enmascarado y el valor de enmascaramiento.
JSON
JSON significa Notación de Objetos de JavaScript. Hoy en día es una forma muy popular de intercambiar datos entre un navegador y un servidor. Los datos intercambiados pueden ser solo texto. JSON también se puede usar para almacenar datos, pero en este caso los datos también se almacenan en forma de texto. Al enmascarar archivos JSON usando DataSunrise en el campo jsonPath en la forma tabular puedes especificar diferentes atributos cuyos valores ocultar. Si dejas el campo jsonPath en blanco, todos los valores serán enmascarados. Como puedes ver a continuación, hemos decidido enmascarar los valores de “first_name” y “last_name”.
[ { "id":1, "first_name":"masked", "last_name":"masked", "email":"[email protected]", "gender":"Male", "ip_address":"252.132.213.37", "date":"2019-08-24" }, { "id":2, "first_name":"masked", "last_name":" masked", "email":"[email protected]", "gender":"Female", "ip_address":"184.85.69.129", "date":"2019-07-23" }, { "id":3, "first_name":"masked", "last_name":"masked", "email":"[email protected]", "gender":"Female", "ip_address":"16.195.117.101", "date":"2020-03-13" } ]
CSV
CSV es un tipo especial de archivo con una extensión especial que guarda datos en un formato tabular. Una peculiaridad de los archivos CSV es que son texto plano. A continuación puedes ver cómo se ven los datos en un archivo CSV enmascarado. Como puedes ver, se ha enmascarado una gran cantidad de datos sensibles: identificaciones, apellidos, correos electrónicos y direcciones IP. Si enmascaras tu archivo CSV usando DataSunrise, necesitas especificar números de columna, luego elegir el método de enmascarado y el valor de enmascaramiento. En la imagen a continuación estamos enmascarando las columnas 1 (IDs), columna 3 (apellido), columna 4 (correos electrónicos) y columna 6 (direcciones IP).
id first_name last_name email gender ip_address * Gilfoyle ********* ***** Female ********** * Chilcotte ********* ***** Male ********** * Terrell ********* ***** Male ********** * Pearle ********* ***** Female ********** * Kits ********* ***** Male ********** * McAlpine ********* ***** Male **********
Texto No Estructurado
El texto no estructurado (datos) no tiene un modelo de datos predefinido o no está organizado de una manera predefinida. Los datos no estructurados suelen ser predominantemente de texto, pero pueden contener fechas, números y otros datos sensibles. Los datos no estructurados carecen de metadatos y no pueden ser indexados o mapeados fácilmente. A continuación se muestra un ejemplo de cómo DataSunrise puede enmascarar un texto no estructurado. Como puedes ver, se enmascaran los datos sensibles. Los datos a enmascarar se toman de los diccionarios integrados de DataSunrise (Lexicon).
Hallazgos del Procedimiento. El paciente, **************, es un hombre de ** años nacido el *. de octubre de ****. Tiene un pólipo sésil de * mm que se encontró en el colon ascendente y se eliminó por asa, sin cauterización. La dirección de ******* es ** *********. ************ *****. Su SSN es **********. Experimentó el pólipo después de salir de su azul ************ con un número de licencia de WDR-***. Pudimos controlar el sangrado. Se notó incidentalmente una diverticulosis moderada y hemorroides. Sangrado GI recurrente de etiología desconocida; hipotensión quizás secundaria a esto pero igualmente probable debido a polifarmacia. Informa haber experimentado hipotensión por primera vez mientras comía queso ***********.
Regla de Enmascarado de DataSunrise para AWS S3
Para enmascarar datos dinámicamente usando DataSunrise necesitas crear una instancia de base de datos, es decir, especificar qué base de datos deseas proteger. En la imagen a continuación puedes ver una lista de instancias de bases de datos. Una base de datos AWS S3 está en esa lista. Haz clic en Agregar Nuevo si deseas crear una nueva instancia de base de datos.
Para configurar una regla de enmascarado, necesitas ir a la sección de Enmascarado de la interfaz de usuario y seleccionar Agregar Regla
Especifica toda la información necesaria sobre una nueva regla en la ventana que aparece y desplázate hasta la parte inferior de la página.
En la sección Configuración de Enmascarado puedes elegir qué tipo de documento deseas enmascarar. Puede ser CSV, XML, JSON o texto no estructurado.
Luego, dependiendo de tus necesidades, marca el tipo de documento que deseas proteger en tu bucket S3. Este artículo te guiará a través de los 4 tipos de documentos disponibles y el primero son archivos CSV.
XML
En la imagen a continuación queremos proteger un archivo XML y marcamos este tipo de archivos. Después de eso, necesitas especificar el nombre completo del archivo en nuestro bucket S3 en el formato que se muestra a continuación.
CSV
En la imagen a continuación queremos proteger un archivo CSV y marcamos este tipo de archivos. Después de eso haz clic en “Agregar Archivo” y especifica un archivo CSV en nuestro bucket S3 que queremos proteger.
Ahora desplázate hacia abajo especifica el método de enmascarado y el valor de enmascarado (asterisco en la imagen). Después de eso haz clic en Guardar Regla para guardar y activar la nueva regla.
JSON
Si deseas proteger JSON, necesitas elegir esta opción y especificar el nombre completo del archivo en un formato mostrado a continuación. Haz clic en Guardar Regla para activar la regla.
Texto No Estructurado
Si deseas enmascarar un archivo de texto no estructurado, elige esta opción e ingresa el nombre completo del archivo en el formato que se muestra en la imagen a continuación y haz clic en Guardar Regla para guardar y activar la regla.
Conclusión
DataSunrise Database Security Suite es una herramienta muy poderosa para proteger tus datos tanto en el lugar como en la nube. Ahora tienes una oportunidad única de descargar tu versión de prueba de DataSunrise y ver cuánto puede hacer para proteger tus datos sensibles dentro de archivos XML, JSON, CSV y textos no estructurados.