Maskierung unstrukturierter Texte auf AWS S3
Daten in der Cloud
Wir leben in einer Welt, in der Daten zu den wertvollsten Gütern gehören. Und die IT-Branche entwickelt ständig neue Möglichkeiten, diese Daten so bequem wie möglich zu speichern.
Das Speichern von Daten in der Cloud ist eine der beliebtesten Methoden zur Datenspeicherung. Wir alle haben von Plattformen wie Amazon Web Services, Alibaba OSS, Minio usw. gehört und nutzen diese.
Aber wenn Daten in der Cloud gespeichert werden, greifen Hacker diese Speicher an. Datenbankbesitzer könnten denken, dass ihre sensiblen Daten dort vollkommen sicher sind. Lassen Sie uns besprechen, ob das wirklich so ist.
Die Sicherheit in der Cloud ist eine gemeinsame Verantwortung zwischen dem Cloud-Anbieter und dem Kunden: AWS verwaltet die Sicherheit der Cloud, und Kunden sind für die Sicherheit in der Cloud verantwortlich.
Es gibt jedoch Dokumenttypen, die schwer zu schützen sind, da die Daten darin nur reiner Text sind, wenn wir über unstrukturierte Texte, CSV-, XML- und JSON-Dateien sprechen. DataSunrise erlaubt Ihnen, den Zugriff auf diese Dateien zu kontrollieren und deren Inhalt bei Bedarf zu maskieren.
Maskierungsmöglichkeiten
XML
XML hat eine extrem breite Anwendung in zahlreichen und verschiedenen Programmen und Geräten gefunden, um Daten online zu verwalten, zu strukturieren, zu speichern, zu übertragen und anzuzeigen. Es ist kein Wunder, dass alles, was wir online mit XML speichern, extrem anfällig für Lecks und Hacks ist.
Unten sehen Sie, wie eine von DataSunrise geschützte XML-Datei aussieht.
<people_test> <record> <id>1</id> <first_name>********</first_name> <last_name>*****</last_name> <email>tguess0@washington.edu</email> <gender>Male</gender> <ip_address>181.236.58.217</ip_address> </record> <record> <id>2</id> <first_name>*******</first_name> <last_name>******</last_name> <email>wculpan1@nature.com</email> <gender>Male</gender> <ip_address>201.187.144.70</ip_address> </record> <record> <id>3</id> <first_name>*******</first_name> <last_name>****</last_name> <email>klace2@etsy.com</email> <gender>Female</gender> <ip_address>113.21.227.26</ip_address> </record> </people_test>
Wie Sie sehen können, haben wir sensible Daten wie Vornamen und Nachnamen verborgen. Mit dem XmlPath in DataSunrise in tabellarischer Form können Sie die zu maskierenden XML-Tags angeben. Um alle Daten zu maskieren, lassen Sie das XmlPath-Feld leer. Danach können Sie die Maskierungsmethode und den Maskenwert wählen.
JSON
JSON steht für JavaScript Object Notation. Heutzutage ist es eine sehr beliebte Methode zum Datenaustausch zwischen einem Browser und einem Server. Die ausgetauschten Daten können nur Text sein. JSON kann auch zum Speichern von Daten verwendet werden, aber in diesem Fall sind die Daten ebenfalls in Textform gespeichert. Beim Maskieren von JSON-Dateien mit DataSunrise können Sie im jsonPath-Feld in tabellarischer Form verschiedene Attribute angeben, deren Werte Sie verbergen möchten. Wenn Sie das jsonPath-Feld leer lassen, werden alle Werte maskiert. Wie Sie unten sehen können, haben wir uns entschieden, die Datenwerte “first_name” und “last_name” zu maskieren.
[ { "id":1, "first_name":"masked", "last_name":"masked", "email":"lwankel0@time.com", "gender":"Male", "ip_address":"252.132.213.37", "date":"2019-08-24" }, { "id":2, "first_name":"masked", "last_name":" masked", "email":"jhenrych1@ucoz.com", "gender":"Female", "ip_address":"184.85.69.129", "date":"2019-07-23" }, { "id":3, "first_name":"masked", "last_name":"masked", "email":"aarthur2@google.fr", "gender":"Female", "ip_address":"16.195.117.101", "date":"2020-03-13" } ]
CSV
CSV ist ein spezieller Dateityp mit einer speziellen Erweiterung, die Daten im tabellarischen Format speichert. Eine Besonderheit von CSV-Dateien ist, dass sie reiner Text sind. Unten sehen Sie, wie Daten in einer maskierten CSV-Datei aussehen. Wie Sie sehen können, wurden viele sensible Daten maskiert: IDs, Nachnamen, E-Mails und IP-Adressen. Wenn Sie Ihre CSV-Datei mit DataSunrise maskieren, müssen Sie die Spaltennummern angeben, dann die Maskierungsmethode und den Maskierungswert wählen. Im Bild unten maskieren wir Spalten 1 (IDs), Spalten 3 (Nachname), Spalten 4 (E-Mails) und Spalten 6 (IP-Adressen).
id first_name last_name email gender ip_address * Gilfoyle ********* ***** Female ********** * Chilcotte ********* ***** Male ********** * Terrell ********* ***** Male ********** * Pearle ********* ***** Female ********** * Kits ********* ***** Male ********** * McAlpine ********* ***** Male **********
Unstrukturierter Text
Unstrukturierte Texte (Daten) haben kein vordefiniertes Datenmodell oder sind nicht in einer vordefinierten Weise organisiert. Unstrukturierte Daten sind in der Regel textlastig, können aber auch Daten, Zahlen und andere sensible Daten enthalten. Unstrukturierte Daten fehlen Metadaten und können nicht ohne weiteres indexiert oder zugeordnet werden. Unten ist ein Beispiel, wie DataSunrise einen unstrukturierten Text maskieren kann. Wie Sie sehen, sind sensible Daten maskiert. Zu maskierende Daten stammen aus den integrierten Wörterbüchern (Lexikon) von DataSunrise.
Prozedurbefunde. Der Patient, **************, ist ein ** Jahre alter Mann, der am * Oktober geboren wurde, ****. Er hat ein * mm sessiles Polyp, das im aufsteigenden Kolon gefunden und mit der Schlinge entfernt wurde, kein Kauter. Die Adresse von ******* ist ** *********. ************ *****. Seine SSN ist **********. Er erlebte das Polyp, nachdem er aus seinem blauen ************ mit einem Lizenznummer von WDR-*** stieg. Wir konnten die Blutung kontrollieren. Moderater Divertikulose und Hämorrhoiden wurden zufällig festgestellt. Erneutes GI-Blutungen unbekannter Ätiologie; Hypotonie möglicherweise sekundär dazu, aber ebenso wahrscheinlich aufgrund von Polypharmazie. Er berichtet, erstmals Hypotonie während des Verzehrs von Queso *********** erlebt zu haben.
DataSunrise Maskierungsregel für AWS S3
Um Daten dynamisch mit DataSunrise zu maskieren, müssen Sie eine Datenbankinstanz erstellen, das heißt, angeben, welche Datenbank Sie schützen möchten. Im Bild unten sehen Sie eine Liste von Datenbankinstanzen. Eine AWS S3-Datenbank steht auf dieser Liste. Klicken Sie auf “Hinzufügen”, wenn Sie eine neue Datenbankinstanz erstellen möchten.

Um eine Maskierungsregel einzurichten, müssen Sie zum Maskierungsbereich der Benutzeroberfläche gehen und “Regel hinzufügen” auswählen

Geben Sie alle notwendigen Informationen über eine neue Regel im daraufhin angezeigten Fenster ein und scrollen Sie zum unteren Rand der Seite.

Im Abschnitt Maskierungseinstellungen können Sie den Dokumenttyp auswählen, den Sie maskieren möchten. Es kann entweder CSV, XML, JSON oder unstrukturierter Text sein.

Je nach Bedarf, markieren Sie den zu schützenden Dokumenttyp in Ihrem S3-Bucket. Dieser Artikel führt Sie durch die 4 verfügbaren Dokumenttypen, und der erste ist CSV-Dateien.
XML
Im Bild unten möchten wir eine XML-Datei schützen und setzen ein Häkchen neben diesen Dateityp. Danach müssen Sie den vollständigen Dateinamen in unserem S3-Bucket im unten gezeigten Format angeben.

CSV
Im Bild unten möchten wir eine CSV-Datei schützen und setzen ein Häkchen neben diesen Dateityp. Danach klicken Sie auf “Datei hinzufügen” und geben eine CSV-Datei in unserem S3-Bucket an, die geschützt werden soll.

Scrollen Sie nun nach unten, geben Sie die Maskierungsmethode und den Maskierungswert (Sternchen im Bild) an. Klicken Sie anschließend auf “Regel speichern”, um die neue Regel zu speichern und zu aktivieren.

JSON
Wenn Sie JSON schützen möchten, müssen Sie diese Option wählen und den vollständigen Dateinamen im unten gezeigten Format angeben. Klicken Sie auf “Regel speichern”, um die Regel zu aktivieren.

Unstrukturierter Text
Wenn Sie eine unstrukturierte Textdatei maskieren möchten, wählen Sie diese Option und geben den vollständigen Dateinamen im unten gezeigten Format an. Klicken Sie auf “Regel speichern”, um die Regel zu speichern und zu aktivieren.

Fazit
Die DataSunrise Database Security Suite ist ein sehr leistungsfähiges Werkzeug, um Ihre Daten sowohl vor Ort als auch in der Cloud zu schützen. Jetzt haben Sie die einzigartige Möglichkeit, Ihre Testversion von DataSunrise herunterzuladen und zu sehen, wie viel es tun kann, um Ihre sensiblen Daten in XML-, JSON-, CSV-Dateien und unstrukturierten Texten zu schützen.