
Descubrimiento de Datos Sensibles para el Formato de Archivo Parquet
El Descubrimiento de Datos Sensibles de DataSunrise está disponible para el formato de archivo Parquet para una búsqueda, clasificación y gestión de datos rápida. Parquet es un formato de archivo de código abierto que almacena estructuras de datos anidadas en formato columnar. Este enfoque tiene varias ventajas, por ejemplo, si las consultas necesitan leer columnas específicas de una tabla grande. Parquet optimiza el almacenamiento de datos, guarda y comprime datos de manera más rápida y eficiente, ahorrando espacio en disco.
Debido a estas ventajas y flexibilidad, Parquet suele utilizarse para el almacenamiento permanente y temporal de datos, para importación y exportación desde diversas fuentes, y transferencia de datos entre diferentes aplicaciones y servicios. Cada año, la cantidad de estos datos está aumentando rápidamente. Con su incremento, el software para el análisis y protección de datos, como el almacén de datos Apache Hive y el servicio de consultas interactivas Amazon Athena, se vuelve más común. Esto permite analizar grandes conjuntos de datos que residen en almacenamiento distribuido utilizando SQL.
La versión 7.3 de DataSunrise admite el formato de archivo Parquet, junto con archivos CSV, XML, JSON y archivos de texto no estructurados al realizar el Descubrimiento de Datos Sensibles en depósitos AWS S3.
La búsqueda de datos se realiza mediante un conjunto de filtros predefinidos que se pueden personalizar. Por defecto, los filtros están configurados para encontrar los siguientes tipos de datos:
- Fechas;
- Correo electrónico;
- Financieros (códigos, números de tarjetas de crédito, códigos PIN, etc.);
- Geográficos (nombres de ciudades, países, códigos postales, etc.);
- Médicos (búsqueda de registros médicos);
- Nombres;
- Números (números de cuentas, certificados, matrículas, etc.);
- Número de Seguridad Social;
- Teléfono/Fax.
Buscar y analizar datos en sus almacenamientos de datos le asegura identificar datos sensibles en Amazon S3 a tiempo, de manera rápida y sin esfuerzo. Con DataSunrise puede estar seguro de que sus datos están completamente protegidos contra fugas de datos.