Masking von XML-, JSON-, CSV- und unstrukturierten Texten auf Amazon S3
Daten in der Cloud
Wir leben in einer Welt, in der Daten zu den wertvollsten Gütern zählen. Und die IT-Branche entwickelt ständig neue Wege, um diese Daten auf die bequemste Art und Weise zu speichern.
Das Speichern von Daten in der Cloud ist eine der populärsten Methoden, Daten zu speichern. Wir alle haben bereits von Plattformen wie Amazon Web Services, Alibaba OSS, Minio usw. gehört und nutzen sie.
Allerdings, wenn Daten in der Cloud gespeichert werden, werden Hacker versuchen, diese Speicherorte anzugreifen. Datenbankbesitzer könnten denken, dass ihre sensiblen Daten dort vollkommen sicher sind. Lassen Sie uns besprechen, ob das wirklich stimmt.
Sicherheit ist eine gemeinsame Verantwortung zwischen dem Cloud-Anbieter und dem Kunden: AWS verwaltet die Sicherheit der Cloud, und die Kunden sind dafür verantwortlich, die Sicherheit in der Cloud zu verwalten.
Es gibt jedoch Dokumenttypen, die schwer zu schützen sind, da die Daten darin nur reiner Text sind, wenn wir über unstrukturierte Texte, CSV-, XML- und JSON-Dateien sprechen. DataSunrise ermöglicht es Ihnen, den Zugriff auf diese Dateien zu kontrollieren und deren Inhalt bei Bedarf zu maskieren.
Maskierungsmöglichkeiten
XML
XML hat eine extrem breite Anwendung in zahlreichen und verschiedenen Programmen und Geräten gefunden, um Daten online zu verarbeiten, zu strukturieren, zu speichern, zu übertragen und anzuzeigen. Kein Wunder, dass alles, was wir online mit XML speichern, extrem anfällig für Leaks und Hacking ist.
Unten sehen Sie, wie eine von DataSunrise geschützte XML-Datei aussieht.
<people_test> <record> <id>1</id> <first_name>********</first_name> <last_name>*****</last_name> <email>[email protected]</email> <gender>Male</gender> <ip_address>181.236.58.217</ip_address> </record> <record> <id>2</id> <first_name>*******</first_name> <last_name>******</last_name> <email>[email protected]</email> <gender>Male</gender> <ip_address>201.187.144.70</ip_address> </record> <record> <id>3</id> <first_name>*******</first_name> <last_name>****</last_name> <email>[email protected]</email> <gender>Female</gender> <ip_address>113.21.227.26</ip_address> </record> </people_test>
Wie Sie sehen können, haben wir sensible Daten wie Vorname und Nachname verborgen. Mit dem XmlPath in DataSunrise in tabellarischer Form können Sie die XML-Tags angeben, die maskiert werden sollen. Um alle Daten zu maskieren, lassen Sie das XmlPath-Feld leer. Danach können Sie die Maskierungsmethode und den Maskierungswert auswählen.
JSON
JSON steht für JavaScript Object Notation. Heutzutage ist es eine sehr beliebte Methode zum Austausch von Daten zwischen einem Browser und einem Server. Die ausgetauschten Daten können nur Text sein. JSON kann auch zur Datenspeicherung verwendet werden, aber in diesem Fall werden die Daten ebenfalls in Textform gespeichert. Beim Maskieren von JSON-Dateien mit DataSunrise im jsonPath-Feld in tabellarischer Form können Sie verschiedene Attribute angeben, deren Werte ausgeblendet werden sollen. Wenn Sie das jsonPath-Feld leer lassen, werden alle Werte maskiert. Wie Sie unten sehen können, haben wir entschieden, die Werte für „first_name“ und „last_name“ zu maskieren.
[ { "id":1, "first_name":"masked", "last_name":"masked", "email":"[email protected]", "gender":"Male", "ip_address":"252.132.213.37", "date":"2019-08-24" }, { "id":2, "first_name":"masked", "last_name":" masked", "email":"[email protected]", "gender":"Female", "ip_address":"184.85.69.129", "date":"2019-07-23" }, { "id":3, "first_name":"masked", "last_name":"masked", "email":"[email protected]", "gender":"Female", "ip_address":"16.195.117.101", "date":"2020-03-13" } ]
CSV
CSV ist ein spezieller Dateityp mit einer speziellen Erweiterung, die Daten im Tabellenformat speichert. Eine Besonderheit von CSV-Dateien ist, dass sie reiner Text sind. Unten sehen Sie, wie Daten in einer maskierten CSV-Datei aussehen. Wie Sie sehen können, wurden viele sensible Daten maskiert: IDs, Nachnamen, E-Mails und IP-Adressen. Wenn Sie Ihre CSV-Datei mit DataSunrise maskieren, müssen Sie die Spaltennummern angeben, dann die Maskierungsmethode und den Maskierungswert auswählen. Im Bild unten maskieren wir die Spalten 1 (IDs), 3 (Nachnamen), 4 (E-Mails) und 6 (IP-Adressen).
id first_name last_name email gender ip_address * Gilfoyle ********* ***** Female ********** * Chilcotte ********* ***** Male ********** * Terrell ********* ***** Male ********** * Pearle ********* ***** Female ********** * Kits ********* ***** Male ********** * McAlpine ********* ***** Male **********
Unstrukturierter Text
Der unstrukturierte Text (Daten) hat kein vordefiniertes Datenmodell oder ist nicht in einer vordefinierten Weise organisiert. Unstrukturierte Daten sind normalerweise textlastig, können aber auch Daten, Zahlen und andere sensible Daten enthalten. Unstrukturierte Daten haben keine Metadaten und können nicht leicht indexiert oder abgebildet werden. Im Folgenden sehen Sie ein Beispiel, wie DataSunrise einen unstrukturierten Text maskieren kann. Wie Sie sehen können, wurden sensible Daten maskiert. Zu maskierende Daten stammen aus den eingebauten Wörterbüchern (Lexikon) von DataSunrise.
Procedure Findings. Der Patient, **************, ist ein ** Jahre alter Mann, geboren am Oktober *, ****. Er hat einen * mm großen, sessilen Polypen, der im aufsteigenden Kolon gefunden und mit einer Schlinge ohne Kauterisation entfernt wurde. *******'s Adresse lautet ** *********. ************ *****. Seine SSN lautet **********. Er erlebte den Polypen, nachdem er aus seinem blauen ************ mit einem Kennzeichen von WDR-*** gestiegen war. Wir konnten die Blutung kontrollieren. Mäßige Divertikulose und Hämorrhoiden wurden zufällig festgestellt. Wiederkehrende Magen-Darm-Blutungen unbekannter Ursache; Hypotonie möglicherweise sekundär dazu, aber ebenso wahrscheinlich sekundär zur Polypharmazie. Er berichtet, dass er die Hypotonie zum ersten Mal beim Verzehr von queso *********** erlebte.
DataSunrise Maskierungsregel für AWS S3
Um Daten dynamisch mit DataSunrise zu maskieren, müssen Sie eine Datenbankinstanz erstellen, also angeben, welche Datenbank Sie schützen möchten. Im Bild unten sehen Sie eine Liste von Datenbankinstanzen. Eine AWS S3-Datenbank ist in dieser Liste enthalten. Klicken Sie auf “Add New”, wenn Sie eine neue Datenbankinstanz erstellen möchten.
Um eine Maskierungsregel einzurichten, müssen Sie zum Abschnitt Maskierung der Benutzeroberfläche gehen und „Neue Regel hinzufügen“ auswählen
Geben Sie alle notwendigen Informationen zu einer neuen Regel in das erscheinende Fenster ein und scrollen Sie bis zum unteren Rand der Seite.
Im Abschnitt Maskierungseinstellungen können Sie den Dokumenttyp auswählen, den Sie maskieren möchten. Es kann sich entweder um CSV-, XML-, JSON- oder unstrukturierten Text handeln.
Kreuzen Sie dann je nach Bedarf den Dokumenttyp an, den Sie in Ihrem S3-Bucket schützen möchten. Dieser Artikel führt Sie durch vier verfügbare Dokumenttypen und der erste sind CSV-Dateien.
XML
Im Bild unten möchten wir eine XML-Datei schützen und ein Häkchen bei dieser Dateitype setzen. Danach müssen Sie den vollständigen Dateinamen in unserem S3-Bucket im unten gezeigten Format angeben.
CSV
Im Bild unten möchten wir eine CSV-Datei schützen und ein Häkchen bei dieser Dateitype setzen. Klicken Sie danach auf „Datei hinzufügen“ und geben Sie eine CSV-Datei in unserem S3-Bucket an, die geschützt werden soll.
Scrollen Sie nun nach unten und geben Sie die Maskierungsmethode und den Maskierungswert (Sternchen im Bild) an. Klicken Sie danach auf „Regel speichern“, um die neue Regel zu speichern und zu aktivieren.
JSON
Wenn Sie JSON schützen möchten, müssen Sie diese Option wählen und den vollständigen Dateinamen im unten gezeigten Format angeben. Klicken Sie auf „Regel speichern“, um die Regel zu aktivieren.
Unstrukturierter Text
Wenn Sie eine unstrukturierte Textdatei maskieren möchten, wählen Sie diese Option und geben Sie den vollständigen Dateinamen im unten gezeigten Format ein und klicken Sie auf „Regel speichern“, um die Regel zu speichern und zu aktivieren.
Schlussfolgerung
Die DataSunrise Database Security Suite ist ein sehr leistungsfähiges Tool, um Ihre Daten sowohl vor Ort als auch in der Cloud zu schützen. Jetzt haben Sie die einmalige Gelegenheit, Ihre Testversion von DataSunrise herunterzuladen und zu sehen, wie viel es tun kann, um Ihre sensiblen Daten in XML-, JSON-, CSV-Dateien und unstrukturierten Texten zu schützen.