Nuove Capacità per la Scoperta di Dati Sensibili in Amazon S3
Introduzione
Secondo un recente sondaggio, più del 50% delle aziende ospita una grande quantità di dati sensibili nei cloud storage, come S3 di Amazon.
La Scoperta di Dati Sensibili di DataSunrise è disponibile per la ricerca rapida, la classificazione e la gestione dei dati. La ricerca e l’analisi dei dati nei tuoi storage ti consente di individuare in tempo, rapidamente e senza sforzo, i dati sensibili in Amazon S3. Abbiamo aggiornato il nostro strumento. Prima potevamo scoprire dati semi-strutturati e non strutturati in S3 grazie alla funzione NLP, ora possiamo fare ancora di più.
Scoperta di Dati Sensibili DataSunrise
La Scoperta di Dati Sensibili per Amazon S3 ha nuove capacità per la rilevazione e protezione di dati sensibili. Ora è disponibile per:
- Formato file Apache Parquet;
- File semi-strutturati come XML, JSON, CSV;
- Formati di testo non strutturati come documenti Microsoft Word;
- Immagini.
La Scoperta di Dati per S3 analizza non solo gli oggetti ma anche i loro nomi e percorsi. DataSunrise collega le relazioni semantiche con il contesto dell’oggetto per una scoperta completa dei dati sensibili. Così non devi preoccuparti dei nomi specifici degli oggetti che contengono informazioni sensibili e private.
Modelli predefiniti e personalizzati per PII. DataSunrise ha molti modelli predefiniti per la ricerca di dati sensibili come numeri di carte di credito, passaporti, patenti di guida. Per una ricerca più flessibile, è possibile utilizzare tipi di informazioni personalizzate (possono essere impostate usando espressioni regolari, script Lua, ecc.). Grazie a questi filtri avrai un quadro esaustivo dei dati sensibili raccolti. La precisa messa a punto della scoperta dei dati farà risparmiare tempo e altre risorse. La cosa più importante è che sarai sicuro che non ci sono dati sensibili non sotto il tuo controllo che potrebbero portare all’esposizione dei dati.
Scoperta di Dati On-demand. È possibile creare e eseguire la Scoperta di Dati non solo manualmente attraverso la Console Web. Usa il terminale di sistema con la Interfaccia a Riga di Comando per creare sistemi automatizzati che rispondono agli eventi di sicurezza senza intervento manuale.
Scoperta di Dati Sensibili nelle immagini. Le aziende che memorizzano dati sensibili nelle immagini (patente di guida, SSN, ecc.) saranno contente di usare la Scoperta di Dati DataSunrise con Riconoscimento Ottico dei Caratteri. L’uso della scoperta di immagini ti consente di cercare dati sensibili nelle immagini grazie al motore OCR. Estrae il testo dalle immagini, poi analizza questa informazione e trova dati privati dai documenti. La nostra scoperta delle foto supporta i seguenti formati di file: JPG, PNG, GIF, TIFF, PSD.
Scoperta di Dati in file compressi e archiviati. Insieme agli oggetti e ai diversi formati di file, la Scoperta di Dati per S3 può anche cercare dati sensibili nei formati compressi e archiviati. I file compressi ti consentono di ridurre lo spazio utilizzato risparmiando così sui costi. I file archiviati ti consentono di raccogliere e raggruppare file in un unico posto combinandoli. Indipendentemente dalla dimensione dell’archivio, i dati sensibili saranno scoperti.
Prestazioni della Scoperta di Dati Sensibili
La Scoperta di Dati Sensibili lavora su diversi livelli in S3. Prima, puoi scoprire i tuoi bucket e oggetti S3 per informazioni sensibili. È il modo più semplice per trovare informazioni private che dovrebbero essere protette. Ma quando hai molti bucket S3 e oggetti in essi, questo compito sarà dispendioso in termini di tempo e stancante. Con DataSunrise riuscirai a risparmiare tempo, budget e altre risorse in quanto ora DataSunrise supporta diverse tecniche per aumentare le prestazioni.
Inventario AWS S3. Conserva tutti i metadati sui tuoi bucket S3 in un unico posto sotto forma di un file CSV archiviato. Per ridurre il consumo di traffico e il costo delle operazioni, DataSunrise può ottenere questi metadati utilizzando S3 Inventory senza chiamate API AWS.
Scoperta di Dati Incrementale. Con la Scoperta di Dati Incrementale, non è necessario ripetere la scoperta degli stessi oggetti e bucket per la presenza di dati sensibili. La modalità di scansione incrementale salta i bucket e gli oggetti scoperti in precedenza. Scansiona solo oggetti nuovi o aggiornati, confrontandoli con l’ultimo tempo di scansione. Ti aiuta a risparmiare tempo e denaro durante l’esecuzione su grandi volumi di dati. Inoltre, la scansione incrementale è opzionale, quindi puoi disabilitarla in qualsiasi momento.
Scoperta di Dati Parallela. Per la ricerca rapida di dati sensibili su grandi volumi di dati, puoi utilizzare il multiprocessing implementato. Consente l’uso di più server DataSunrise per la scoperta di dati parallela. Con la scoperta parallela, riuscirai a ottimizzare l’utilizzo della CPU e della memoria. L’uso del multiprocessing semplifica il lavoro della scoperta dei dati quando devi elaborare un’enorme quantità di dati. Inoltre, riduce il carico sul server e non influenzale processi paralleli che hai. Con il multiprocessing puoi scegliere più attributi di ricerca ed escludere oggetti specifici dalla scansione.
Scoperta di Dati Casuale. Consente la scansione casuale di file nei bucket S3 per accelerare il processo di Scoperta di Dati. È possibile scegliere la percentuale di dati sensibili da scoprire tra grandi volumi di dati.
Divisione dei file grandi in pezzi. Gli oggetti grandi consumano spazio aggiuntivo aumentando le elaborazioni in memoria. Ora possiamo dividere qualsiasi oggetto in pezzi per aumentare le prestazioni e ottimizzare l’uso della memoria. Con parametri aggiuntivi come “DataDiscoveryChunkSize” e altri, possiamo facilmente scoprire questi pezzi e trovare qualsiasi informazione sensibile.
Impostazioni e Personalizzazione della Scoperta di Dati Sensibili
È possibile perfezionare il processo di scoperta regolando alcuni parametri aggiuntivi.
DataSunrise ha oltre 25 parametri personalizzabili. Ad esempio:
- “DataDiscoveryMatchesSaveStrategy” consente di salvare le occorrenze della Scoperta di Dati nel Dizionario in base alle tue particolari esigenze: salva prime corrispondenze, tutte le corrispondenze o corrispondenze uniche;
- “DataDiscoveryChunkSize” consente di scaricare parzialmente i file per la Scoperta di Dati per evitare il sovraccarico della memoria. Puoi impostare la dimensione del chunk e il limite della somma dei chunk;
- “DataDiscoveryMaxFileSizeForChunkProcessing” è per l’intera dimensione del file da scansionare come somma dei chunk. L’elaborazione dei chunk scansione fino a raggiungere il valore di questo parametro;
- “DataDiscoveryS3FilePartToRead” è per la dimensione massima del file (Mb) per la Scoperta di Dati S3. Questo parametro funziona in combinazione con DataDiscoveryFilesThreadPools. Definisce il numero di thread utilizzati per l’elaborazione del file. Ogni thread elabora un file alla volta. Pertanto, il valore di questo parametro dipende dalle risorse di sistema disponibili.
- “DataDiscoveryBatchSplitFactor” identifica in quante parti verrà suddiviso il batch fallito per il successivo rilancio del compito di scoperta dei dati.
Reportistica per la Scoperta di Dati Sensibili
DataSunrise fornisce una protezione multistrato per AWS S3. Di conseguenza, DataSunrise opera su una grande quantità di dati. Ti consente di ottenere tutte le informazioni più dettagliate sui tuoi database e sui dati in essi creando report personalizzati in formato CSV o PDF.
Disponibilità dei report. Ora è possibile la generazione dei report durante il processo di Scoperta, non è necessario aspettare il completamento del compito. Ti consente di visualizzare i risultati intermedi e utilizzarli per l’analisi.
Uso dei report. Attraverso i risultati dei report, puoi raccogliere analisi e ottenere statistiche sulla velocità di elaborazione dei dati e sugli attributi e utilizzare i dati ricevuti per scopi specifici, incluso l’apprendimento del tuo AI.
Con un sistema flessibile di report personalizzabili, non hai più bisogno di monitorare manualmente le informazioni sui livelli di protezione dei tuoi database.
Conclusione
La Scoperta di Dati Sensibili ti permette di sapere dove risiedono i dati sensibili nei tuoi bucket AWS S3 e sfruttare i mezzi di protezione dei dati rispettivamente.
DataSunrise offre una vasta gamma di formati e modi di scoprire i dati sensibili in AWS S3 ovunque essi risiedano. Con le prestazioni migliorate, la Scoperta dei Dati sarà meno dispendiosa in termini di tempo. Puoi perfezionare la Scoperta di Dati Sensibili DataSunrise per evitare ricerche ripetute non necessarie tra grandi volumi di dati. I modelli di ricerca modificabili ti permettono di eseguire una ricerca per qualsiasi pezzo di dati specifico. Con la reportistica puoi ottenere le informazioni più dettagliate che ti permetteranno di vedere i risultati intermedi per analisi, apprendimento AI e altri processi aziendali.
Per iniziare con DataSunrise su Amazon, visita DataSunrise in AWS Marketplace.