DataSunrise sponsert AWS re:Invent 2024 in Las Vegas, bitte besuchen Sie uns am Stand #2158 von DataSunrise

Neue Funktionen für die Erkennung sensibler Daten in Amazon S3

Neue Funktionen für die Erkennung sensibler Daten in Amazon S3

Einführung

Laut einer kürzlich durchgeführten Umfrage speichern mehr als 50 % der Unternehmen eine riesige Menge sensibler Daten in Cloud-Speicher, wie S3 von Amazon.

Die Erkennung sensibler Daten von DataSunrise steht zur schnellen Datensuche, Klassifizierung und Verwaltung zur Verfügung. Durch die Suche und Analyse der Daten in Ihren Datenspeichern können Sie sensible Daten in Amazon S3 rechtzeitig, schnell und mühelos identifizieren. Wir haben unser Tool aufgerüstet. Zuvor konnten wir aufgrund der NLP-Funktion semi-strukturierte und unstrukturierte Daten in S3 entdecken, und jetzt können wir noch mehr.

DataSunrise Sensitive Data Discovery

Die Datenerkennung für Amazon S3 bietet neue Funktionen zur Erkennung und zum Schutz sensibler Daten. Jetzt ist die Datenerkennung verfügbar für:

  • Apache-Parquet-Dateiformat;
  • Semi-strukturierte Dateien wie XML, JSON, CSV;
  • Unstrukturierte Textformate wie Microsoft Word-Dokumente;
  • Bilder.

Die Datenerkennung für S3 analysiert nicht nur Objekte, sondern auch deren Namen und Pfade. DataSunrise verbindet semantische Beziehungen mit dem Kontext des Objekts für eine vollständige und umfassende Erkennung sensibler Daten. So müssen Sie sich keine Gedanken über die spezifischen Namen von Objekten machen, die sensible und vertrauliche Informationen enthalten.

Vordefinierte und benutzerdefinierte Vorlagen für PII. DataSunrise verfügt über viele vordefinierte Vorlagen für die Suche nach sensiblen Daten wie Kreditkartennummern, Reisepässen, Führerscheinen. Für eine flexiblere Suche können Sie benutzerdefinierte Informationstypen verwenden (können mit regulären Ausdrücken, Lua-Skript usw. eingerichtet werden). Dank dieser Filter erhalten Sie ein umfassendes Bild der gesammelten sensiblen Daten. Die Feinabstimmung der Erkennung spart Zeit und andere Ressourcen. Das Wichtigste ist, dass Sie sicherstellen, dass keine sensiblen Daten außerhalb Ihrer Kontrolle gelangen können, was zu einer Datenoffenlegung führen könnte.

Bedarfsgesteuerte Datenerkennung. Sie können die Datenerkennung nicht nur manuell über die Webkonsole erstellen und ausführen. Verwenden Sie das Systemterminal mit der Befehlszeilenschnittstelle, um automatisierte Systeme zu erstellen, die ohne manuelle Eingriffe auf Sicherheitsvorfälle reagieren.

Erkennung sensibler Daten in Bildern. Unternehmen, die sensible Daten in Bildern speichern (Führerschein, SSN, etc.), werden die DataSunrise-Datenerkennung mit optischer Zeichenerkennung (OCR) zu schätzen wissen. Die Verwendung der Bilderkennung ermöglicht die Suche nach sensiblen Daten in Bildern dank der OCR-Engine. Es extrahiert Text aus den Bildern, analysiert dann diese Informationen und findet private Daten aus Dokumenten. Unsere Bilderdatenerkennung unterstützt folgende Dateiformate: JPG, PNG, GIF, TIFF, PSD.

Komprimierte und archivierte Dateien Datenerkennung. Zusammen mit den Objekten und verschiedenen Dateiformaten kann die Datenerkennung für S3 auch nach sensiblen Daten in komprimierten und archivierten Formaten suchen. Komprimierte Dateien reduzieren den genutzten Speicherplatz und sparen so Kosten. Archivierte Dateien ermöglichen es Ihnen, Dateien an einem Ort zu sammeln und zu gruppieren, indem sie kombiniert werden. Unabhängig von der Größe des Archivs werden sensible Daten erkannt.

Leistung der Datenerkennung für sensible Daten

Die Erkennung sensibler Daten arbeitet auf verschiedenen Ebenen in S3. Zunächst können Sie Ihre S3-Buckets und -Objekte auf sensible Informationen durchsuchen. Es ist der einfachste Weg, private Informationen zu finden, die geschützt werden sollten. Wenn Sie jedoch viele S3-Buckets und -Objekte darin haben, wird diese Aufgabe zeitaufwändig und ermüdend. Mit DataSunrise können Sie Ihre Zeit, Ihr Budget und andere Ressourcen sparen, da DataSunrise jetzt mehrere Techniken zur Leistungssteigerung unterstützt.

AWS S3-Inventar. Es hält alle Metadaten über Ihre S3-Buckets an einem Ort in Form einer archivierten CSV-Datei. Um den Datenverkehr und die Betriebskosten zu reduzieren, kann DataSunrise diese Metadaten mithilfe des S3-Inventars ohne AWS-API-Aufrufe abrufen.

Inkrementelle Datenerkennung. Mit der inkrementellen Datenerkennung ist keine wiederholte Erkennung derselben Objekte und Buckets auf das Vorhandensein sensibler Daten erforderlich. Der inkrementelle Scan-Modus überspringt zuvor entdeckte Buckets und Objekte. Es scannt nur neue oder aktualisierte Objekte und vergleicht sie mit der zuletzt gescannten Zeit. Dies hilft Ihnen, Zeit und Geld zu sparen, während Sie mit großen Datenmengen arbeiten. Zudem ist der inkrementelle Scan optional, sodass Sie ihn jederzeit deaktivieren können.

Parallele Datenerkennung. Für die schnelle Suche nach sensiblen Daten in großen Datenmengen können Sie Multiprocessing verwenden. Es ermöglicht die Verwendung mehrerer DataSunrise-Server für die parallele Datenerkennung. Mit paralleler Erkennung können Sie die CPU- und Speicherauslastung optimieren. Die Verwendung von Multiprocessing vereinfacht die Datenerkennung, wenn Sie eine große Menge an Daten verarbeiten müssen. Außerdem reduziert es die Belastung des Servers und beeinträchtigt nicht die parallelen Prozesse, die Sie haben. Mit Multiprocessing können Sie mehrere Suchattribute auswählen und bestimmte Objekte vom Scan ausschließen.

Zufällige Datenerkennung. Sie ermöglicht das Scannen zufälliger Dateien in S3-Buckets, um den Datenerkennungsprozess zu beschleunigen. Es ist möglich, den Prozentsatz der sensiblen Daten auszuwählen, die über große Datenmengen hinweg entdeckt werden sollen.

Teilen großer Dateien in Stücke. Große Objekte verbrauchen zusätzlichen Speicherplatz und führen zu In-Memory-Berechnungen. Jetzt können wir jedes Objekt in Stücke teilen, um die Leistung zu steigern und die Speichernutzung zu optimieren. Mit zusätzlichen Parametern wie “DataDiscoveryChunkSize” und anderen können wir diese Stücke leicht entdecken und alle sensiblen Informationen finden.

Einstellungen und Anpassung der Datenerkennung für sensible Daten

Sie können den Erkennungsprozess feineinstellen, indem Sie einige zusätzliche Parameter anpassen.

DataSunrise verfügt über mehr als 25 anpassbare Parameter. Zum Beispiel:

  • “DataDiscoveryMatchesSaveStrategy” ermöglicht das Speichern von Datenerkennungsereignissen im Wörterbuch je nach Ihren speziellen Bedürfnissen: erste Übereinstimmungen, alle Übereinstimmungen oder eindeutige Übereinstimmungen speichern;
  • “DataDiscoveryChunkSize” ermöglicht das teilweise Herunterladen der Dateien zur Datenerkennung, um ein Überlaufen des Speichers zu vermeiden. Sie können die Chunk-Größe und das Summenlimit der Chunks festlegen;
  • “DataDiscoveryMaxFileSizeForChunkProcessing” ist für die gesamte Dateigröße, die als SUMME der Chunks gescannt wird. Die Chunk-Verarbeitung scannt, bis der Wert dieses Parameters erreicht ist;
  • “DataDiscoveryS3FilePartToRead” ist für die maximale Dateigröße (MB) für die S3-Datenerkennung. Dieser Parameter funktioniert in Verbindung mit DataDiscoveryFilesThreadPools. Es definiert die Anzahl der Threads, die für die Dateiverarbeitung verwendet werden. Jeder Thread verarbeitet eine Datei nach der anderen. Der Wert dieses Parameters hängt also von den verfügbaren Systemressourcen ab.
  • “DataDiscoveryBatchSplitFactor” identifiziert, in wie viele Teile der fehlgeschlagene Batch für den erneuten Durchlauf der Datenerkennungsaufgabe aufgeteilt wird.

Berichterstattung zur Datenerkennung für sensible Daten

DataSunrise bietet mehrschichtigen Schutz für AWS S3. Als Ergebnis arbeitet DataSunrise mit einer riesigen Menge an Daten. Es ermöglicht Ihnen, alle detaillierten Informationen über Ihre Datenbanken und die in ihnen enthaltenen Daten zu erhalten, indem Sie benutzerdefinierte Berichte im CSV- oder PDF-Format erstellen.

Bild 1: Beispiel eines PDF-Berichts zur Datenerkennung sensibler Daten

Verfügbarkeit von Berichten. Jetzt ist die Berichtsgenerierung während des Datenerkennungsprozesses möglich, es ist keine Wartezeit bis zum Abschluss der Aufgabe erforderlich. Dies ermöglicht es Ihnen, Zwischenergebnisse anzuzeigen und für Analysen zu verwenden.

Verwendung von Berichten. Durch die Ergebnisse von Berichten können Sie Analysen sammeln und Statistiken zur Datenverarbeitungsgeschwindigkeit und zu Attributen erhalten und die erhaltenen Daten für bestimmte Zwecke verwenden, einschließlich des Lernens Ihrer eigenen KI.

Mit einem flexiblen System anpassbarer Berichte müssen Sie Informationen über die Schutzstufen Ihrer Datenbanken nicht mehr manuell überwachen.

Schlussfolgerung

Die Erkennung sensibler Daten ermöglicht es Ihnen, zu wissen, wo sich sensible Daten in Ihren AWS S3-Buckets befinden und entsprechende Datenschutzmittel zu nutzen.

DataSunrise bietet eine Vielzahl von Formaten und Möglichkeiten zur Erkennung sensibler Daten in AWS S3, unabhängig davon, wo sie sich befinden. Mit der verbesserten Leistung wird die Datenerkennung weniger zeitaufwendig. Sie können die DataSunrise-Datenerkennung feineinstellen, um unnötige wiederholte Suchen in großen Datenmengen zu vermeiden. Anpassbare Suchmuster ermöglichen es Ihnen, nach einem bestimmten Datensatz zu suchen. Mit Berichten erhalten Sie die detailliertesten Informationen, die es Ihnen ermöglichen, Zwischenergebnisse für Analysen, KI-Lernen und andere Geschäftsprozesse zu sehen.

Um mit DataSunrise bei Amazon zu beginnen, besuchen Sie DataSunrise im AWS Marketplace.

Nächste

Neue Zero-Day-Sicherheitslücke in Spring

Neue Zero-Day-Sicherheitslücke in Spring

Erfahren Sie mehr

Benötigen Sie die Hilfe unseres Support-Teams?

Unsere Experten beantworten gerne Ihre Fragen.

Allgemeine Informationen:
[email protected]
Kundenservice und technischer Support:
support.datasunrise.com
Partnerschafts- und Allianz-Anfragen:
[email protected]