
Sensitive Data Discovery für Parquet-Dateiformat
DataSunrise Sensitive Data Discovery ist für das Parquet-Dateiformat verfügbar, was eine schnelle Datensuche, -klassifizierung und -verwaltung ermöglicht. Parquet ist ein Open-Source-Dateiformat, das verschachtelte Datenstrukturen im Spaltenformat speichert. Dieser Ansatz bietet mehrere Vorteile, zum Beispiel, wenn Abfragen spezifische Spalten aus einer großen Tabelle lesen müssen. Parquet optimiert die Datenspeicherung, speichert und komprimiert Daten schneller und effizienter, wodurch Speicherplatz gespart wird.
Aufgrund dieser Vorteile und der Flexibilität wird Parquet häufig für die dauerhafte und temporäre Speicherung von Daten, den Import und Export aus verschiedenen Quellen sowie den Datentransfer zwischen verschiedenen Anwendungen und Diensten verwendet. Jedes Jahr steigt die Menge solcher Daten rapide an. Mit dem Anstieg dieser Datenmenge werden Softwarelösungen für Datenanalyse und -schutz, wie z.B. das Apache Hive Data Warehouse und der interaktive Abfragedienst Amazon Athena, immer weiter verbreitet. Diese Lösungen erlauben es Ihnen, große Datensätze, die in verteiltem Speicher liegen, mit SQL zu analysieren.
DataSunrise Version 7.3 unterstützt das Parquet-Dateiformat zusammen mit CSV-, XML-, JSON- und unstrukturierten Textdateien bei der Durchführung von Sensitive Data Discovery in AWS S3-Buckets.
Die Datensuche erfolgt durch eine Reihe vordefinierter Filter, die angepasst werden können. Standardmäßig sind die Filter auf die Suche nach den folgenden Datentypen eingestellt:
- Datum;
- E-Mail;
- Finanziell (Codes, Kreditkartennummern, PIN-Codes usw.);
- Geografisch (Namen von Städten, Ländern, Postleitzahlen usw.);
- Medizinisch (Suche nach Krankenakten);
- Namen;
- Nummern (Kontonummern, Zertifikate, Kennzeichen usw.);
- Sozialversicherungsnummer;
- Telefon/Fax.
Die Suche und Analyse von Daten in Ihren Datenspeichern ermöglicht es Ihnen, sensible Daten in Amazon S3 rechtzeitig, schnell und mühelos zu erkennen. Mit DataSunrise können Sie sicherstellen, dass Ihre Daten vollständig vor Datenlecks geschützt sind.