Lo script Lua scopre dati sensibili nei file JSON
Quando si lavora con la funzionalità di Scoperta dei Dati, DataSunrise permette di utilizzare una varietà di filtri di ricerca predefiniti per vari tipi di dati sensibili. Ma esiste un modo per cercare dati unici? Sì, per eseguire questo compito è possibile utilizzare Lua. L’uso di script Lua per la Scoperta dei Dati permette di cercare letteralmente qualsiasi valore di tipo testo non coperto dai modelli esistenti.
Questo articolo descrive come è possibile utilizzare Lua per individuare le colonne di interesse del database nei file JSON. Viene utilizzato uno script dedicato per fare ciò, in modo che si possa basare la propria ricerca sull’algoritmo descritto di seguito. Si noti che ciò può essere fatto non solo con JSON ma con qualsiasi tipo di file — è sufficiente creare uno script Lua appropriato.
Può copiare lo script utilizzato in questo articolo qui:
-- Specificare i valori che desidera scoprire nella lista sensitive_from_json -- ad esempio {"data","id","name"} sensitive_from_json = {"id", "data"} -- valStr conterrà JSON come testo local valStr = tostring(columnValue) local valStrLen = string.len(valStr) -- Funzione per ottenere la lunghezza di una tabella local function tablelength(T) local count = 0 for _ in pairs(T) do count = count + 1 end return count end -- Ottenere il numero di elementi nella lista sensitive_from_json local count = tablelength(sensitive_from_json) -- Identificare se la colonna contiene dati formattati JSON if string.sub(valStr, 1, 1) == '{' and string.sub(valStr, valStrLen, valStrLen) == '}' then for i = 1, count do -- Se JSON contiene almeno 1 valore desiderato, ritorna 1, altrimenti 0 if string.find(valStr, '"' .. tostring(sensitive_from_json[i]) .. '":') then return 1 end end return 0 else return 0 end
Prima di tutto, creare il proprio script Lua per cercare i dati di interesse. Si noti che lo script particolare creato per questo articolo, tra le altre cose, verifica se il file elaborato è formattato come un file JSON. Per altri tipi di file, è necessario utilizzare altri algoritmi di validazione. Abbiamo riempito i valori richiesti nello script. Per la vostra comodità, abbiamo lasciato alcuni commenti.
Quindi, il nostro script è pronto per l’elaborazione e possiamo andare alla Console Web di DataSunrise.
Navighiamo a Scoperta dei Dati -> Tipi di Informazione e creiamo un nuovo Tipo di Informazione.

Aggiungiamo un nuovo Attributo e nelle impostazioni dell’attributo, selezioniamo Dati Colonna. Nel Tipo di Dati Colonna, selezioniamo Solo Stringhe. Nel Metodo di Ricerca, selezioniamo Script Lua.


Poi clicchiamo su Modifica Script Lua per il codice dello script. Incolliamo il nostro script nel campo Script e lo salviamo.

Ora possiamo creare un nuovo compito di Scoperta dei Dati. Nella sottosezione Filtri di Ricerca, selezioniamo Tipi di Informazione e selezioniamo il nostro Tipo di Informazione da utilizzare per la scoperta.

Per avviare il compito dobbiamo selezionare Frequenza di Avvio Manuale, premere il pulsante Applica per salvare le modifiche e premere Avvia Ora per eseguire il compito.

Se il compito è stato completato con successo, possiamo visualizzare i risultati cliccando sul pulsante Mostra. Ciò mostrerà che gli oggetti del database contengono dati sensibili in formato JSON.

In conclusione, l’utilizzo di script Lua all’interno della funzionalità di Scoperta dei Dati di DataSunrise migliora significativamente la capacità di identificare dati unici e sensibili oltre l’ambito dei filtri predefiniti. Seguendo i passaggi descritti, è possibile creare script personalizzati su misura per cercare valori di tipo testo specifici in vari formati di file, inclusi i file JSON. Questo metodo non solo amplia la gamma di dati ricercabili, ma fornisce anche uno strumento flessibile e potente per gli amministratori di database che cercano di proteggere le informazioni sensibili. La semplicità dell’integrazione di questi script tramite la Console Web di DataSunrise e la successiva capacità di automatizzare e visualizzare i compiti di scoperta semplificano il processo, rendendolo una soluzione efficiente per la gestione della sicurezza dei dati completa.