Enmascarando Texto No Estructurado en AWS S3
Datos en la Nube
Vivimos en un mundo donde los datos son uno de los activos más valiosos. Y la industria de TI está desarrollando constantemente formas de almacenar estos datos de la manera más conveniente.
Almacenar datos en la nube es una de las formas más populares de almacenamiento de datos. Todos hemos escuchado y usamos plataformas como Amazon Web Services, Alibaba OSS, Minio, etc.
Sin embargo, si los datos tienden a almacenarse en la nube, los hackers atacarán estos almacenamientos. Los propietarios de bases de datos pueden pensar que sus datos sensibles están completamente seguros allí. Vamos a discutir si esto es completamente cierto.
La seguridad es una responsabilidad compartida entre el proveedor de la nube y el cliente: AWS administra la seguridad de la nube y los clientes son responsables de administrar la seguridad en la nube.
Sin embargo, hay tipos de documentos que son difíciles de proteger ya que los datos dentro son solo texto sin formato si hablamos de textos no estructurados, archivos CSV, XML y JSON. DataSunrise le permite controlar el acceso a estos archivos y enmascarar su contenido si es necesario.
Posibilidades de Enmascaramiento
XML
XML ha encontrado una aplicación extremadamente amplia en numerosos y varios programas y dispositivos para manejar, estructurar, almacenar, transmitir y mostrar datos en línea. No es de extrañar que todo lo que guardamos en línea utilizando XML sea extremadamente vulnerable a fugas y hackeos.
A continuación puede ver cómo se ve un archivo XML protegido por DataSunrise.
<people_test> <record> <id>1</id> <first_name>********</first_name> <last_name>*****</last_name> <email>tguess0@washington.edu</email> <gender>Male</gender> <ip_address>181.236.58.217</ip_address> </record> <record> <id>2</id> <first_name>*******</first_name> <last_name>******</last_name> <email>wculpan1@nature.com</email> <gender>Male</gender> <ip_address>201.187.144.70</ip_address> </record> <record> <id>3</id> <first_name>*******</first_name> <last_name>****</last_name> <email>klace2@etsy.com</email> <gender>Female</gender> <ip_address>113.21.227.26</ip_address> </record> </people_test>
Como puede ver, hemos ocultado datos sensibles como el nombre y el apellido. Utilizando XmlPath en DataSunrise en la forma tabular, puede especificar las etiquetas XML que se van a enmascarar. Para enmascarar todos los datos, deje el campo XmlPath vacío. Después de eso, puede elegir el método de enmascaramiento y el valor de enmascaramiento.
JSON
JSON significa Notación de Objetos JavaScript. Hoy en día es una forma muy popular de intercambiar datos entre un navegador y un servidor. Los datos intercambiados pueden ser solo texto. JSON también se puede usar para almacenar datos, pero en este caso los datos también se almacenan en forma de texto. Al enmascarar archivos JSON usando DataSunrise, en el campo jsonPath en la forma tabular, puede especificar diferentes atributos cuyos valores desea ocultar. Si deja el campo jsonPath en blanco, entonces todos los valores serán enmascarados. Como puede ver a continuación, hemos decidido enmascarar los valores de “first_name” y “last_name”.
[ { "id":1, "first_name":"masked", "last_name":"masked", "email":"lwankel0@time.com", "gender":"Male", "ip_address":"252.132.213.37", "date":"2019-08-24" }, { "id":2, "first_name":"masked", "last_name":" masked", "email":"jhenrych1@ucoz.com", "gender":"Female", "ip_address":"184.85.69.129", "date":"2019-07-23" }, { "id":3, "first_name":"masked", "last_name":"masked", "email":"aarthur2@google.fr", "gender":"Female", "ip_address":"16.195.117.101", "date":"2020-03-13" } ]
CSV
CSV es un tipo especial de archivo con una extensión especial que guarda los datos en un formato tabular. Una peculiaridad de los archivos CSV es que son texto sin formato. A continuación, puede ver cómo se ven los datos en un archivo CSV enmascarado. Como puede ver, muchos datos sensibles han sido enmascarados: IDs, apellidos, correos electrónicos y direcciones IP. Si enmascara su archivo CSV usando DataSunrise, debe especificar números de columna, luego elegir el método de enmascaramiento y el valor de enmascaramiento. En la imagen de abajo estamos enmascarando las columnas 1 (IDs), columnas 3 (apellido), columnas 4 (correos electrónicos) y columna 6 (direcciones IP).
id first_name last_name email gender ip_address * Gilfoyle ********* ***** Female ********** * Chilcotte ********* ***** Male ********** * Terrell ********* ***** Male ********** * Pearle ********* ***** Female ********** * Kits ********* ***** Male ********** * McAlpine ********* ***** Male **********
Texto No Estructurado
El texto no estructurado (datos) no tiene un modelo de datos predefinido o no está organizado de manera predefinida. Los datos no estructurados generalmente contienen mucho texto, pero pueden contener fechas, números y otros datos sensibles. Los datos no estructurados carecen de metadatos y no pueden ser indexados o mapeados fácilmente. A continuación se muestra un ejemplo de cómo DataSunrise puede enmascarar un texto no estructurado. Como puede ver, los datos sensibles están enmascarados. Los datos a enmascarar se toman de los diccionarios integrados de DataSunrise (Lexicoón).
Hallazgos del Procedimiento. El paciente, **************, es un hombre de ** años de edad nacido el 10 de octubre *, ****. Tiene un pólipo sésil de * mm que se encontró en el colon ascendente y se retiró con asa, sin cauterización. La dirección de ******* es ** *********. ************ *****. Su SSN es **********. Experimentó el pólipo después de salir de su auto azul ************ con una número de licencia de WDR-***. Pudimos controlar la hemorragia. Se observaron incidentalmente diverticulosis moderada y hemorroides. Sangrado gastrointestinal recurrente de etiología desconocida; hipotensión quizás secundaria a esto pero también probablemente secundaria a polifarmacia. Informa que experimentó hipotensión por primera vez mientras comía queso ***********.
Regla de Enmascaramiento de DataSunrise para AWS S3
Para enmascarar datos dinámicamente usando DataSunrise, necesita crear una instancia de base de datos, es decir, especificar qué base de datos desea proteger. En la siguiente imagen puede ver una lista de instancias de bases de datos. Una base de datos AWS S3 está en esa lista. Haga clic en “Agregar Nuevo” si desea crear una nueva instancia de base de datos.

Para configurar una regla de enmascaramiento, necesita ir a la sección de Enmascaramiento de la IU y seleccionar Agregar Regla

Especifique toda la información necesaria sobre una nueva regla en la ventana que aparece y desplácese hacia abajo hasta la parte inferior de la página.

En la sección de Configuración de Enmascaramiento, puede elegir qué tipo de documento desea enmascarar. Puede ser CSV, XML, JSON o texto no estructurado.

Luego, según sus necesidades, marque el tipo de documento que desea proteger en su bucket S3. Este artículo lo guiará a través de los 4 tipos de documentos disponibles y el primero son los archivos CSV.
XML
En la imagen a continuación queremos proteger un archivo XML y marcar este tipo de archivos. Después de eso, debe especificar el nombre completo del archivo en nuestro bucket S3 en el formato que se muestra a continuación.

CSV
En la imagen a continuación queremos proteger un archivo CSV y marcar este tipo de archivos. Después de eso, haga clic en “Agregar Archivo” y especifique un archivo CSV en nuestro bucket S3 que deseamos proteger.

Ahora desplácese hacia abajo, especifique el método de enmascaramiento y el valor de enmascaramiento (asterisco en la imagen). Después de eso, haga clic en Guardar Regla para guardar y activar la nueva regla.

JSON
Si desea proteger JSON, debe elegir esta opción y especificar el nombre completo del archivo en un formato mostrado a continuación. Haga clic en Guardar Regla para activar la regla.

Texto No Estructurado
Si desea enmascarar un archivo de texto no estructurado, elija esta opción e ingrese el nombre completo del archivo en el formato mostrado en la imagen a continuación y haga clic en Guardar Regla para guardar y activar la regla.

Conclusión
DataSunrise Database Security Suite es una herramienta muy poderosa para proteger sus datos tanto en las instalaciones como en la nube. Ahora tiene una oportunidad única de descargar su versión de prueba de DataSunrise y ver cuánto puede hacer para proteger sus datos sensibles dentro de archivos XML, JSON, CSV y textos no estructurados.