
Scoperta dei Dati Sensibili per il Formato dei File Parquet
La Scoperta dei Dati Sensibili di DataSunrise è disponibile per il formato dei file Parquet per una ricerca, classificazione e gestione rapida dei dati. Parquet è un formato di file open source che memorizza strutture di dati annidati in formato colonnare. Questo approccio ha diversi vantaggi, ad esempio, se le query devono leggere specifiche colonne da una tabella di grandi dimensioni. Parquet ottimizza la memorizzazione dei dati, salva e comprime i dati in modo più veloce ed efficiente, risparmiando spazio su disco.
A causa di questi vantaggi e della sua flessibilità, Parquet è spesso utilizzato per l’archiviazione permanente e temporanea dei dati, per l’importazione e l’esportazione da varie fonti e per il trasferimento di dati tra diverse applicazioni e servizi. Ogni anno la quantità di tali dati aumenta rapidamente. Con il loro aumento, il software per l’analisi e la protezione dei dati, come il data warehouse Apache Hive e il servizio di query interattiva Amazon Athena, diventano sempre più diffusi. Questi permettono di analizzare grandi insiemi di dati presenti in archiviazioni distribuite utilizzando SQL.
La versione 7.3 di DataSunrise supporta il formato dei file Parquet, insieme a file CSV, XML, JSON e file di testo non strutturati durante la Scoperta dei Dati Sensibili nei bucket AWS S3.
La ricerca dei dati viene effettuata attraverso un insieme di filtri predefiniti che possono essere personalizzati. Per impostazione predefinita, i filtri sono configurati per trovare i seguenti tipi di dati:
- Date;
- E-mail;
- Finanziari (codici, numeri di carte di credito, codici PIN, ecc.);
- Geografici (nomi di città, paesi, CAP, ecc.);
- Medici (ricerca di cartelle cliniche);
- Nomi;
- Numeri (numeri di conti, certificati, targhe, ecc.);
- Numero di Sicurezza Sociale;
- Telefono/Fax.
La ricerca e l’analisi dei dati nei suoi archivi di dati le assicurano di individuare tempestivamente e senza sforzo i dati sensibili in Amazon S3. Con DataSunrise può essere sicuro che i suoi dati sono completamente protetti dalle perdite di dati.