Descubrimiento de Datos Sensibles para el Formato de Archivo Parquet
El Descubrimiento de Datos Sensibles de DataSunrise está disponible para el formato de archivo Parquet para una búsqueda, clasificación y gestión rápidas de datos. Parquet es un formato de archivo de código abierto que almacena estructuras de datos anidadas en un formato columnar. Este enfoque tiene varias ventajas, por ejemplo, si las consultas necesitan leer columnas específicas de una tabla grande. Parquet optimiza el almacenamiento de datos, guarda y comprime datos de manera más rápida y eficiente, ahorrando espacio en disco.
Debido a estas ventajas y flexibilidad, Parquet se utiliza a menudo para el almacenamiento permanente y temporal de datos, para la importación y exportación desde diversas fuentes, y la transferencia de datos entre diferentes aplicaciones y servicios. Cada año, la cantidad de tales datos aumenta rápidamente. Con su aumento, el software para análisis y protección de datos, como el almacén de datos Apache Hive y el servicio de consultas interactivas Amazon Athena, se están volviendo más extendidos. Permiten analizar grandes conjuntos de datos que residen en almacenamiento distribuido utilizando SQL.
La versión 7.3 de DataSunrise admite el formato de archivo Parquet, junto con CSV, XML, JSON, y archivos de texto no estructurado al realizar el Descubrimiento de Datos Sensibles a través de los depósitos AWS S3.
La búsqueda de datos se realiza a través de un conjunto de filtros predefinidos que se pueden personalizar. Por defecto, los filtros están configurados para encontrar los siguientes tipos de datos:
- Fechas;
- Correo electrónico;
- Financieros (códigos, números de tarjetas de crédito, códigos PIN, etc.);
- Geográficos (nombres de ciudades, países, códigos postales, etc.);
- Médicos (búsqueda de registros médicos);
- Nombres;
- Números (números de cuentas, certificados, matrículas, etc.);
- Número de Seguridad Social;
- Teléfono/Fax.
Buscar y analizar datos en tus almacenamientos de datos te asegura identificar a tiempo datos sensibles en Amazon S3, rápida y fácilmente. Con DataSunrise puedes estar seguro de que tus datos están completamente protegidos contra fugas de datos.