Découverte de Données Sensibles pour le Format de Fichier Parquet
La Découverte de Données Sensibles de DataSunrise est disponible pour le format de fichier Parquet pour une recherche, une classification et une gestion rapide des données. Parquet est un format de fichier open source qui stocke des structures de données imbriquées au format colonnaire. Cette approche présente plusieurs avantages, par exemple, si les requêtes doivent lire des colonnes spécifiques à partir d’une grande table. Parquet optimise le stockage des données, enregistre et compresse les données plus rapidement et plus efficacement, économisant ainsi de l’espace disque.
En raison de ces avantages et de cette flexibilité, Parquet est souvent utilisé pour le stockage permanent et temporaire de données, pour l’import et l’export depuis diverses sources, et pour le transfert de données entre différentes applications et services. Chaque année, la quantité de ces données augmente rapidement. Avec cette augmentation, les logiciels d’analyse et de protection des données, tels que l’entrepôt de données Apache Hive et le service de requête interactive Amazon Athena, deviennent de plus en plus répandus. Ils permettent d’analyser de grands ensembles de données situés dans un stockage distribué en utilisant le SQL.
La version 7.3 de DataSunrise prend en charge le format de fichier Parquet, ainsi que les fichiers CSV, XML, JSON, et les fichiers texte non structurés lors de l’exécution de la Découverte de Données Sensibles dans les buckets AWS S3.
La recherche de données s’effectue à travers un ensemble de filtres prédéfinis qui peuvent être personnalisés. Par défaut, les filtres sont configurés pour trouver les types de données suivants :
- Dates ;
- E-mail ;
- Financiers (codes, numéros de carte de crédit, codes PIN, etc.) ;
- Géographiques (noms de villes, pays, codes postaux, etc.) ;
- Médicaux (recherche de dossiers médicaux) ;
- Noms ;
- Numéros (numéros de compte, certificats, plaques d’immatriculation, etc.) ;
- Numéro de Sécurité Sociale ;
- Téléphone/Fax.
La recherche et l’analyse des données dans vos stockages de données vous assurent de localiser les données sensibles dans Amazon S3 à temps, rapidement et sans effort. Avec DataSunrise, vous pouvez être sûr que vos données sont complètement protégées contre les fuites de données.