Le script Lua découvre les données sensibles dans les fichiers JSON
Lors de l’utilisation de la fonction de découverte de données, DataSunrise vous permet d’utiliser une variété de filtres de recherche prédéfinis pour différents types de données sensibles. Mais existe-t-il un moyen de rechercher des données uniques ? Oui, pour accomplir cette tâche, vous pouvez utiliser Lua. L’utilisation de scripts Lua pour la découverte de données permet de rechercher littéralement toute valeur de type texte non couverte par les modèles existants.
Cet article décrit comment vous pouvez utiliser Lua pour localiser les colonnes de base de données d’intérêt dans les fichiers JSON. Un script dédié est utilisé pour cela. Vous pouvez ainsi baser votre propre recherche sur l’algorithme décrit ci-dessous. Notez que cela peut être fait non seulement avec JSON, mais avec tout type de fichier – il vous suffit de créer un script Lua approprié.
Vous pouvez copier le script utilisé dans cet article ici :
-- Spécifiez les valeurs que vous souhaitez découvrir dans la liste sensitive_from_json -- par exemple {"data", "id", "name"} sensitive_from_json = {"id", "data"} -- valStr contiendra JSON en tant que texte local valStr = tostring(columnValue) local valStrLen = string.len(valStr) -- Fonction pour obtenir la longueur d'une table local function tablelength(T) local count = 0 for _ in pairs(T) do count = count + 1 end return count end -- Obtenir le nombre d'éléments dans la liste sensitive_from_json local count = tablelength(sensitive_from_json) -- Identifier si la colonne contient des données formatées en JSON if string.sub(valStr, 1, 1) == '{' and string.sub(valStr, valStrLen, valStrLen) == '}' then for i = 1, count do -- Si JSON contient au moins 1 valeur souhaitée, retourner 1, sinon 0 if string.find(valStr, '"' .. tostring(sensitive_from_json[i]) .. '":') then return 1 end end return 0 else return 0 end
Tout d’abord, créez votre script Lua pour rechercher vos propres données d’intérêt. Notez que le script particulier que nous avons créé pour cet article vérifie entre autres si le fichier traité est formaté comme un fichier JSON. Pour d’autres types de fichiers, vous devriez utiliser d’autres algorithmes de validation. Nous remplissons les valeurs requises dans le script. Pour votre commodité, nous avons laissé quelques commentaires.
Donc, notre script est prêt à être traité et nous pouvons aller à la console Web de DataSunrise.
Nous naviguons vers Découverte de données -> Types d’informations et créons un nouveau type d’information.
Nous ajoutons un nouvel attribut et dans les paramètres de l’attribut, nous sélectionnons Données de colonne. Dans le Type de données de colonne, nous sélectionnons Uniquement des chaînes. Dans la méthode de recherche, nous sélectionnons Script Lua.
Ensuite, nous cliquons sur Modifier le script Lua pour le code du script. Nous collons notre script dans le champ du script et l’enregistrons.
Maintenant, nous pouvons créer une nouvelle tâche de découverte de données. Dans la sous-section des filtres de recherche, nous sélectionnons Types d’informations et sélectionnons notre type d’information à utiliser pour la découverte.
Pour exécuter la tâche, nous devons sélectionner la fréquence de démarrage manuel, appuyer sur le bouton Appliquer pour enregistrer les modifications et appuyer sur Commencer maintenant pour lancer la tâche.
Si la tâche a réussi, nous pouvons voir les résultats en cliquant sur le bouton Afficher. Cela montrera les objets de la base de données qui contiennent des données sensibles au format JSON.
Image 7. Résultats[/caption>
En conclusion, l’utilisation de scripts Lua dans la fonction de découverte de données de DataSunrise améliore considérablement votre capacité à identifier des données uniques et sensibles au-delà des filtres prédéfinis. En suivant les étapes décrites, vous pouvez créer des scripts personnalisés adaptés à la recherche de valeurs spécifiques de type texte dans divers formats de fichiers, y compris JSON. Cette méthode élargit non seulement la gamme de données recherchables, mais fournit également un outil flexible et puissant pour les administrateurs de bases de données cherchant à protéger les informations sensibles. La facilité d’intégration de ces scripts via la console Web de DataSunrise et la capacité subséquente à automatiser et à visualiser les tâches de découverte simplifient le processus, en faisant une solution efficace pour la gestion de la sécurité complète des données.