Masquage de texte non structuré sur AWS S3
Données dans les nuages
Nous vivons dans un monde où les données sont l’un des actifs les plus précieux. Et l’industrie informatique développe constamment des moyens de stocker ces données de manière la plus pratique possible.
Le stockage des données dans les nuages est l’une des méthodes les plus populaires pour stocker des données. Nous avons tous entendu parler et utilisons des plateformes telles qu’Amazon Web Services, Alibaba OSS, Minio, etc.
Cependant, si les données ont tendance à être stockées dans le nuage, les pirates attaqueront ces stockages. Les propriétaires de bases de données peuvent penser que leurs données sensibles y sont complètement en sécurité. Discutons s’il s’agit réellement du cas.
La sécurité est une responsabilité partagée entre le fournisseur de cloud et le client dans le cloud : AWS gère la sécurité du cloud, et les clients sont responsables de la gestion de la sécurité dans le cloud.
Cependant, il existe des types de documents difficiles à protéger car les données à l’intérieur ne sont que du texte brut si nous parlons de textes non structurés, de fichiers CSV, XML et JSON. DataSunrise vous permet de contrôler l’accès à ces fichiers et de masquer leur contenu si nécessaire.
Possibilités de masquage
XML
Le XML a trouvé une application extrêmement large dans de nombreux programmes et dispositifs divers pour gérer, structurer, stocker, transmettre et afficher des données en ligne. Il n’est donc pas surprenant que tout ce que nous gardons en ligne en utilisant XML soit extrêmement vulnérable aux fuites et au piratage.
Ci-dessous, vous pouvez voir à quoi ressemble un fichier XML protégé par DataSunrise.
<people_test> <record> <id>1</id> <first_name>********</first_name> <last_name>*****</last_name> <email>[email protected]</email> <gender>Male</gender> <ip_address>181.236.58.217</ip_address> </record> <record> <id>2</id> <first_name>*******</first_name> <last_name>******</last_name> <email>[email protected]</email> <gender>Male</gender> <ip_address>201.187.144.70</ip_address> </record> <record> <id>3</id> <first_name>*******</first_name> <last_name>****</last_name> <email>[email protected]</email> <gender>Female</gender> <ip_address>113.21.227.26</ip_address> </record> </people_test>
Comme vous pouvez le constater, nous avons masqué les données sensibles du prénom et du nom de famille. En utilisant le XmlPath dans DataSunrise sous forme tabulaire, vous pouvez spécifier les balises XML à masquer. Pour masquer toutes les données, laissez le champ XmlPath vide. Ensuite, vous pouvez choisir la méthode de masquage et la valeur de masquage.
JSON
JSON signifie JavaScript Object Notation. De nos jours, c’est un moyen très populaire d’échanger des données entre un navigateur et un serveur. Les données échangées ne peuvent être que du texte. Le JSON peut également être utilisé pour stocker des données, mais dans ce cas, les données sont également stockées sous forme de texte. Lors du masquage des fichiers JSON en utilisant DataSunrise dans le champ jsonPath sous forme tabulaire, vous pouvez spécifier différents attributs dont vous voulez masquer les valeurs. Si vous laissez le champ jsonPath vierge, toutes les valeurs seront masquées. Comme vous pouvez le voir ci-dessous, nous avons décidé de masquer les valeurs des données “first_name” et “last_name”.
[ { "id":1, "first_name":"masked", "last_name":"masked", "email":"[email protected]", "gender":"Male", "ip_address":"252.132.213.37", "date":"2019-08-24" }, { "id":2, "first_name":"masked", "last_name":" masked", "email":"[email protected]", "gender":"Female", "ip_address":"184.85.69.129", "date":"2019-07-23" }, { "id":3, "first_name":"masked", "last_name":"masked", "email":"[email protected]", "gender":"Female", "ip_address":"16.195.117.101", "date":"2020-03-13" } ]
CSV
Le CSV est un type de fichier spécial avec une extension spéciale qui enregistre les données sous un format tabulaire. Une particularité des fichiers CSV est qu’ils sont du texte brut. Ci-dessous, vous pouvez voir à quoi ressemblent les données dans un fichier CSV masqué. Comme vous pouvez le constater, beaucoup de données sensibles ont été masquées : identifiants, noms de famille, e-mails et adresses IP. Si vous masquez votre fichier CSV en utilisant DataSunrise, vous devez spécifier les numéros de colonne, puis choisir la méthode de masquage et la valeur de masquage. Dans l’image ci-dessous, nous masquons les colonnes 1 (identifiants), colonnes 3 (nom de famille), colonnes 4 (e-mails) et colonne 6 (adresses IP).
id first_name last_name email gender ip_address * Gilfoyle ********* ***** Female ********** * Chilcotte ********* ***** Male ********** * Terrell ********* ***** Male ********** * Pearle ********* ***** Female ********** * Kits ********* ***** Male ********** * McAlpine ********* ***** Male **********
Texte non structuré
Le texte non structuré (données) n’a pas de modèle de données prédéfini ou n’est pas organisé de manière prédéfinie. Les données non structurées sont généralement très textuelles, mais peuvent contenir des dates, des chiffres et d’autres données sensibles. Les données non structurées manquent de métadonnées et ne peuvent pas être indexées ou mappées facilement. Ci-dessous, un exemple de la manière dont DataSunrise peut masquer un texte non structuré. Comme vous pouvez le voir, les données sensibles sont masquées. Les données à masquer sont prises des dictionnaires intégrés de DataSunrise (Lexicon).
Résultats de la procédure. Le patient, **************, est un homme de ** ans né le octobre *, ****. Il a un polype sessile de * mm trouvé dans le côlon ascendant et enlevé par anse, sans cautérisation. L'adresse de ******* est ** *********. ************ *****. Son numéro de sécurité sociale est **********. Il a ressenti le polype après être sorti de son ************ bleu avec un numéro de licence de WDR-***. Nous avons pu maîtriser le saignement. Un diverticulose modérée et des hémorroïdes ont été notées de manière incidente. Récidive de saignement gastro-intestinal d'étiologie inconnue ; hypotension peut-être secondaire à cela mais aussi probablement secondaire à la polypharmacie. Il rapporte avoir ressenti pour la première fois une hypotension en mangeant du queso ***********.
Règle de masquage de DataSunrise pour AWS S3
Pour masquer des données dynamiquement en utilisant DataSunrise, vous devez créer une instance de base de données, c’est-à-dire spécifier quelle base de données vous souhaitez protéger. Dans l’image ci-dessous, vous pouvez voir une liste des instances de bases de données. Une base de données AWS S3 figure sur cette liste. Cliquez sur Ajouter pour créer une nouvelle instance de base de données.
Pour configurer une règle de masquage, vous devez aller dans la section Masquage de l’interface utilisateur et sélectionner Ajouter une règle.
Spécifiez toutes les informations nécessaires concernant la nouvelle règle dans la fenêtre qui apparaît et faites défiler vers le bas de la page.
Dans la section Paramètres de masquage vous pouvez choisir quel type de document vous souhaitez masquer. Cela peut être soit un fichier CSV, XML, JSON ou un texte non structuré.
Ensuite, selon vos besoins, cochez le type de document que vous voulez protéger dans votre bucket S3. Cet article vous guidera à travers les 4 types de documents disponibles et le premier est les fichiers CSV.
XML
Sur l’image ci-dessous, nous voulons protéger un fichier XML et mettons une coche près de ce type de fichiers. Après cela, vous devez spécifier le nom complet du fichier dans notre bucket S3 selon le format indiqué ci-dessous.
CSV
Sur l’image ci-dessous, nous voulons protéger un fichier CSV et mettons une coche près de ce type de fichiers. Ensuite, cliquez sur “Ajouter un fichier” et spécifiez un fichier CSV dans notre bucket S3 que nous voulons protéger.
Maintenant, faites défiler vers le bas, spécifiez la méthode de masquage et la valeur de masquage (astérisque dans l’image). Ensuite, cliquez sur Enregistrer la règle pour enregistrer et activer la nouvelle règle.
JSON
Si vous voulez protéger JSON, vous devez choisir cette option et spécifier le nom complet du fichier dans un format indiqué ci-dessous. Cliquez sur Enregistrer la règle pour activer la règle.
Texte non structuré
Si vous souhaitez masquer un fichier de texte non structuré, choisissez cette option et entrez le nom complet du fichier dans le format indiqué sur l’image ci-dessous, puis cliquez sur Enregistrer la règle pour enregistrer et activer la règle.
Conclusion
La suite de sécurité de bases de données DataSunrise est un outil très puissant pour protéger vos données à la fois sur site et dans le cloud. Vous avez maintenant une opportunité unique de télécharger votre version d’essai de DataSunrise et voir combien elle peut faire pour protéger vos données sensibles à l’intérieur des fichiers XML, JSON, CSV et textes non structurés.