Masquage de Texte Non Structuré sur AWS S3
Données dans les Clouds
Nous vivons dans un monde où les données sont l’un des actifs les plus précieux. Et l’industrie informatique développe constamment des moyens de stocker ces données de la manière la plus pratique.
Le stockage des données dans les clouds est l’un des moyens les plus populaires de stocker des données. Nous avons tous entendu parler et utilisé des plateformes telles qu’Amazon Web Services, Alibaba OSS, Minio, etc.
Cependant, si les données ont tendance à être stockées dans les clouds, les pirates attaqueront ces stockages. Les propriétaires de bases de données peuvent penser que leurs données sensibles y sont complètement en sécurité. Discutons-en pour savoir si c’est complètement vrai.
La sécurité est une responsabilité partagée entre le fournisseur de cloud et le client dans le cloud : AWS gère la sécurité du cloud, et les clients sont responsables de la gestion de la sécurité dans le cloud.
Cependant, il existe des types de documents difficiles à protéger car les données qu’ils contiennent ne sont que du texte brut si l’on parle de textes non structurés, de fichiers CSV, XML et JSON. DataSunrise vous permet de contrôler l’accès à ces fichiers et de masquer leur contenu si nécessaire.
Possibilités de Masquage
XML
Le XML a trouvé une application extrêmement large dans de nombreux programmes et dispositifs pour gérer, structurer, stocker, transmettre et afficher des données en ligne. Il n’est donc pas étonnant que tout ce que nous conservons en ligne en utilisant le XML soit extrêmement vulnérable aux fuites et aux piratages.
Ci-dessous, vous pouvez voir à quoi ressemble un fichier XML protégé par DataSunrise.
<people_test> <record> <id>1</id> <first_name>********</first_name> <last_name>*****</last_name> <email>tguess0@washington.edu</email> <gender>Male</gender> <ip_address>181.236.58.217</ip_address> </record> <record> <id>2</id> <first_name>*******</first_name> <last_name>******</last_name> <email>wculpan1@nature.com</email> <gender>Male</gender> <ip_address>201.187.144.70</ip_address> </record> <record> <id>3</id> <first_name>*******</first_name> <last_name>****</last_name> <email>klace2@etsy.com</email> <gender>Female</gender> <ip_address>113.21.227.26</ip_address> </record> </people_test>
Comme vous pouvez le constater, nous avons caché les données sensibles prénom et nom de famille. En utilisant XmlPath dans DataSunrise sous forme tabulaire, vous pouvez spécifier les balises XML à masquer. Pour masquer toutes les données, laissez le champ XmlPath vide. Ensuite, vous pouvez choisir la méthode de masquage et la valeur du masquage.
JSON
JSON signifie JavaScript Object Notation. Aujourd’hui, c’est un moyen très populaire d’échanger des données entre un navigateur et un serveur. Les données échangées peuvent être uniquement du texte. JSON peut également être utilisé pour stocker des données, mais dans ce cas, les données sont également stockées sous forme de texte. En masquant des fichiers JSON en utilisant DataSunrise dans le champ jsonPath sous forme tabulaire, vous pouvez spécifier différents attributs dont les valeurs doivent être masquées. Si vous laissez le champ jsonPath vide, toutes les valeurs seront masquées. Comme vous pouvez le voir ci-dessous, nous avons décidé de masquer les valeurs “first_name” et “last_name”.
[ { "id":1, "first_name":"masked", "last_name":"masked", "email":"lwankel0@time.com", "gender":"Male", "ip_address":"252.132.213.37", "date":"2019-08-24" }, { "id":2, "first_name":"masked", "last_name":" masked", "email":"jhenrych1@ucoz.com", "gender":"Female", "ip_address":"184.85.69.129", "date":"2019-07-23" }, { "id":3, "first_name":"masked", "last_name":"masked", "email":"aarthur2@google.fr", "gender":"Female", "ip_address":"16.195.117.101", "date":"2020-03-13" } ]
CSV
CSV est un type de fichier spécial avec une extension spéciale qui enregistre les données sous un format tabulaire. Une particularité des fichiers CSV est qu’ils sont en texte brut. Ci-dessous, vous pouvez voir à quoi ressemble les données dans un fichier CSV masqué. Comme vous pouvez le constater, beaucoup de données sensibles ont été masquées : les ID, les noms de famille, les e-mails et les adresses IP. Si vous masquez votre fichier CSV en utilisant DataSunrise, vous devez spécifier les numéros de colonne, puis choisir la méthode de masquage et la valeur du masquage. Dans l’image ci-dessous, nous masquons les colonnes 1 (ID), colonnes 3 (nom de famille), colonnes 4 (e-mails) et colonne 6 (adresses IP).
id first_name last_name email gender ip_address * Gilfoyle ********* ***** Female ********** * Chilcotte ********* ***** Male ********** * Terrell ********* ***** Male ********** * Pearle ********* ***** Female ********** * Kits ********* ***** Male ********** * McAlpine ********* ***** Male **********
Texte Non Structuré
Le texte non structuré (données) n’a pas de modèle de données prédéfini ou n’est pas organisé de manière prédéfinie. Les données non structurées sont généralement lourdes en texte, mais peuvent contenir des dates, des chiffres et d’autres données sensibles. Les données non structurées manquent de métadonnées et ne peuvent pas être facilement indexées ou cartographiées. Ci-dessous un exemple de la manière dont DataSunrise peut masquer un texte non structuré. Comme vous pouvez le constater, les données sensibles sont masquées. Les données à masquer sont prises dans les dictionnaires intégrés de DataSunrise (Lexicon).
Procedure Findings. The patient, **************, is a ** year old male born on October *, ****. He has a * mm sessile polyp that was found in the ascending colon and removed by snare, no cautery. *******'s address is ** *********. ************ *****. His SSN is **********. He experienced the polyp after getting out of his blue ************ with a license number of WDR-***. We were able to control the bleeding. Moderate diverticulosis and hemorrhoids were incidentally noted. Recurrent GI bleed of unknown etiology; hypotension perhaps secondary to this but as likely secondary to polypharmacy. He reports first experiencing hypotension while eating queso ***********.
Règle de Masquage DataSunrise pour AWS S3
Pour masquer les données dynamiquement en utilisant DataSunrise, vous devez créer une instance de base de données, c’est-à-dire spécifier la base de données que vous voulez protéger. Sur l’image ci-dessous, vous pouvez voir une liste des instances de base de données. Une base de données AWS S3 est sur cette liste. Cliquez sur Ajouter Nouveau si vous souhaitez créer une nouvelle instance de base de données.

Pour configurer une règle de masquage, vous devez aller à la section Masquage de l’interface utilisateur et sélectionner Ajouter Règle.

Spécifiez toutes les informations nécessaires sur une nouvelle règle dans la fenêtre qui s’affiche et faites défiler vers le bas de la page.

Dans la section Paramètres de Masquage, vous pouvez choisir le type de document que vous souhaitez masquer. Il peut s’agir soit de CSV, XML, JSON ou de texte non structuré.

Ensuite, en fonction de vos besoins, cochez le type de document que vous souhaitez protéger dans votre bucket S3. Cet article vous guidera à travers les 4 types de documents disponibles et le premier est les fichiers CSV.
XML
Dans l’image ci-dessous, nous souhaitons protéger un fichier XML et cochons ce type de fichiers. Après cela, vous devez spécifier le nom complet du fichier dans notre bucket S3 au format indiqué ci-dessous.

CSV
Dans l’image ci-dessous, nous souhaitons protéger un fichier CSV et cochons ce type de fichiers. Après cela, cliquez sur “Ajouter Fichier” et spécifiez un fichier CSV dans notre bucket S3 que nous souhaitons protéger.

Maintenant, faites défiler vers le bas et spécifiez la méthode de masquage et la valeur de masquage (astérisque dans l’image). Après cela, cliquez sur Enregistrer Règle pour enregistrer et activer la nouvelle règle.

JSON
Si vous souhaitez protéger JSON, vous devez choisir cette option et spécifier le nom complet du fichier dans un format indiqué ci-dessous. Cliquez sur Enregistrer Règle pour activer la règle.

Texte Non Structuré
Si vous souhaitez masquer un fichier texte non structuré, choisissez cette option et entrez le nom complet du fichier dans un format indiqué dans l’image ci-dessous et cliquez sur Enregistrer Règle pour sauvegarder et activer la règle.

Conclusion
La suite DataSunrise de Sécurité de Base de Données est un outil très puissant pour protéger vos données à la fois sur site et dans le cloud. Vous avez désormais une opportunité unique de télécharger votre version d’essai de DataSunrise et de voir à quel point elle peut faire pour protéger vos données sensibles à l’intérieur des fichiers XML, JSON, CSV et des textes non structurés.