DataSunrise está patrocinando AWS re:Invent 2024 en Las Vegas, por favor visítenos en el stand #2158 de DataSunrise

Nuevas capacidades para el descubrimiento de datos sensibles de Amazon S3

Nuevas capacidades para el descubrimiento de datos sensibles de Amazon S3

Introducción

De acuerdo con una encuesta reciente, más del 50% de las empresas almacenan una gran cantidad de datos sensibles en almacenamientos en la nube, como S3 de Amazon.

El descubrimiento de datos sensibles de DataSunrise está disponible para una rápida búsqueda, clasificación y gestión de datos. Buscar y analizar datos en sus almacenamientos de datos le garantiza identificar datos sensibles en Amazon S3 a tiempo, de forma rápida y sin esfuerzo. Hemos actualizado nuestra herramienta. Antes podíamos descubrir datos semi-estructurados y no estructurados en S3 debido a la función NLP, y ahora podemos hacer aún más.

Descubrimiento de datos sensibles de DataSunrise

El Descubrimiento de Datos para Amazon S3 tiene nuevas capacidades para la detección y protección de datos sensibles. Ahora el Descubrimiento de Datos está disponible para:

  • Formato de archivo Apache Parquet;
  • Archivos semi-estructurados como XML, JSON, CSV;
  • Formatos de texto no estructurados como documentos de Microsoft Word;
  • Imágenes.

El Descubrimiento de Datos para S3 analiza no solo objetos sino también sus nombres y rutas hacia ellos. DataSunrise conecta relaciones semánticas con el contexto del objeto para un descubrimiento completo y exhaustivo de datos sensibles. Por lo tanto, no necesita molestar con los nombres específicos de objetos que contienen información sensible y privada.

Plantillas predefinidas y personalizables para PII. DataSunrise cuenta con una gran cantidad de plantillas predefinidas para la búsqueda de datos sensibles, como números de tarjetas de crédito, pasaporte, licencia de conducir. Para una búsqueda más flexible, puedes aprovechar los tipos de información personalizables (pueden configurarse usando expresiones regulares, scripts de Lua, etc.). Gracias a estos filtros tendrás una imagen exhaustiva de los datos sensibles recolectados. El ajuste del descubrimiento te ahorrará tiempo y otros recursos. Lo más importante es que tendrás la certeza de que no hay datos sensibles fuera de tu control y que podrían llevar a la exposición de datos.

Descubrimiento de datos a demanda. Puedes crear y ejecutar el descubrimiento de datos no solo manualmente a través de la Consola Web. Utiliza el terminal del sistema con la Interfaz de línea de comandos para crear sistemas automatizados que respondan a eventos de seguridad sin intervención manual.

Descubrimiento de datos sensibles en imágenes. Las empresas que almacenan datos sensibles en imágenes (licencia de conducir, Número de Seguro Social, etc.) estarán contentas de usar DataSunrise Data Discovery con Reconocimiento Óptico de Caracteres. El uso del descubrimiento de imágenes te permite buscar datos sensibles en imágenes gracias al motor de OCR. Toma el texto de las imágenes, luego analiza esta información y encuentra datos privados de los documentos. Nuestro descubrimiento de datos de imágenes es compatible con los siguientes formatos de archivo: JPG, PNG, GIF, TIFF, PSD.

Detecdetecdescubrimiento de datos en archivos comprimidos y archivados. Junto con los objetos y diferentes formatos de archivos, Descubrimiento de Datos para S3 también puede buscar datos sensibles en formatos comprimidos y archivados. Los archivos comprimidos te permiten reducir el espacio utilizado, por lo tanto, ahorrando costos. Los archivos archivados te permiten recopilar y agrupar archivos en un solo lugar combinándolos. No importa el tamaño del archivo, se descubrirán los datos sensibles.

Rendimiento del descubrimiento de datos sensibles

El descubrimiento de datos sensibles funciona en diferentes niveles en S3. En primer lugar, puedes descubrir tus depósitos y objetos S3 para información sensible. Es la forma más sencilla de encontrar información privada que debe estar protegida. Pero cuando tienes muchos depósitos S3 y objetos en ellos, esta tarea será laboriosa y cansada. Con DataSunrise podrás ahorrar tu tiempo, presupuesto, y otros recursos ya que ahora DataSunrise soporta varias técnicas para aumentar el rendimiento.

Inventario de AWS S3. Mantiene todos los metadatos de tus depósitos S3 en un solo lugar en forma de archivo CSV archivado. Para reducir el consumo de tráfico y el costo de operación, DataSunrise puede obtener estos metadatos utilizando el inventario S3 sin llamadas a la API de AWS.

Descubrimiento de datos incremental. Con el Descubrimiento de Datos Incremental, no hay necesidad de repetir el descubrimiento de los mismos objetos y depósitos para la presencia de datos sensibles. El modo de escaneo incremental omite los depósitos y objetos descubiertos anteriormente. Escanea solo objetos nuevos o actualizados, comparándolos con la última vez que se escanearon. Te ayuda a ahorrar tiempo y dinero mientras trabajas en grandes volúmenes de datos. Además, el escaneo incremental es opcional, por lo que puedes desactivarlo en cualquier momento que lo necesites.

Descubrimiento de datos paralelos. Para la búsqueda rápida de datos sensibles en grandes volúmenes de datos, puedes utilizar la multiprocesamiento implementada. Permite el uso de varios servidores de DataSunrise para el descubrimiento de datos en paralelo. Con el descubrimiento en paralelo, podrás optimizar la utilización de la CPU y de la memoria. El uso de multiprocesamiento simplifica el trabajo del descubrimiento de datos cuando necesitas procesar una gran cantidad de datos. Además, reduce la carga en el servidor y no afecta los procesos en paralelo que tienes. Con multiprocesamiento, puedes elegir múltiples atributos de búsqueda y excluir objetos específicos del escaneo.

Descubrimiento de datos aleatorios. Permite escanear archivos aleatorios en los depósitos S3 para acelerar el proceso de Descubrimiento de Datos. Es posible seleccionar el porcentaje de datos sensibles a ser descubiertos en grandes volúmenes de datos.

Dividir grandes archivos en piezas. Los objetos grandes consumen espacio adicional haciendo cálculos en memoria. Ahora podemos dividir cualquier objeto en piezas para aumentar el rendimiento y optimizar el uso de la memoria. Con parámetros adicionales como “DataDiscoveryChunkSize” y otros, podemos descubrir fácilmente estas piezas y encontrar cualquier información sensible.

Configuración y personalización del descubrimiento de datos sensibles

Puedes ajustar el proceso de descubrimiento ajustando algunos parámetros adicionales.

DataSunrise tiene más de 25 parámetros personalizables. Por ejemplo:

  • “DataDiscoveryMatchesSaveStrategy” permite guardar las ocurrencias de Descubrimiento de Datos en el Diccionario dependiendo de tus necesidades particulares: guardar las primeras coincidencias, todas las coincidencias o coincidencias únicas;
  • “DataDiscoveryChunkSize” permite la descarga parcial de los archivos para el Descubrimiento de Datos para evitar el desbordamiento de la memoria. Puedes establecer el tamaño del fragmento y el límite de la suma de fragmentos;
  • “DataDiscoveryMaxFileSizeForChunkProcessing” es para el tamaño total del archivo a escanear como SUM de fragmentos. El procesamiento de fragmentos escanea hasta que se alcanza el valor de este parámetro;
  • “DataDiscoveryS3FilePartToRead” es para el tamaño máximo del archivo (Mb) para el Descubrimiento de Datos S3. Este parámetro funciona en conjunto con DataDiscoveryFilesThreadPools. Define la cantidad de hilos utilizados para el procesamiento de archivos. Cada hilo procesa un archivo a la vez. Por lo tanto, el valor de este parámetro depende de los recursos del sistema disponibles.
  • “DataDiscoveryBatchSplitFactor” identifica en cuántas partes se dividirá el lote fallido para la futura reejecución de la tarea de descubrimiento de datos.

Reportes del descubrimiento de datos sensibles

DataSunrise proporciona protección multicapa para AWS S3. Como resultado, DataSunrise opera en una enorme cantidad de datos. Te permite obtener toda la información más detallada sobre tus bases de datos y los datos contenidos en ellas mediante la creación de informes personalizados en formato CSV o PDF.

Imagen 1: Ejemplo de informe en PDF de descubrimiento de datos sensibles

Disponibilidad de informes. Ahora la generación de informes es posible durante el proceso de la tarea de Descubrimiento, no hay necesidad de esperar a que la tarea se complete. Te permite ver los resultados intermedios y utilizarlos para el análisis.

Uso de informes. A través de los resultados de los informes, puedes recopilar análisis y obtener estadísticas sobre la velocidad de procesamiento de datos y atributos y utilizar los datos recibidos para fines específicos, incluyendo el aprendizaje de tu propio IA.

Con un sistema flexible de informes personalizables, ya no necesitarás monitorear manualmente información sobre los niveles de protección de tus bases de datos.

Conclusión

El Descubrimiento de Datos Sensibles te permite saber dónde residen los datos sensibles en tus depósitos de AWS S3 y aprovechar los medios de protección de datos respectivamente.

DataSunrise proporciona una gran variedad de formatos y formas de descubrir datos sensibles en AWS S3 dondequiera que residan. Con el rendimiento mejorado, el Descubrimiento de Datos será menos consumidor de tiempo. Puedes afinar el Descubrimiento de Datos Sensibles de DataSunrise para evitar búsquedas innecesariamente repetidas entre grandes volúmenes de datos. Los patrones de búsqueda editables te permiten realizar una búsqueda de cualquier pieza específica de datos. Con los informes puedes obtener la información más detallada que te permitirá ver resultados intermedios para análisis, aprendizaje de IA y otros procesos de negocios.

Para comenzar con DataSunrise con Amazon, visita DataSunrise en AWS Marketplace.

Siguiente

Nueva Vulnerabilidad Zero-Day en Spring

Nueva Vulnerabilidad Zero-Day en Spring

Más información

¿Necesita la ayuda de nuestro equipo de soporte?

Nuestros expertos estarán encantados de responder a sus preguntas.

Información general:
[email protected]
Servicio al Cliente y Soporte Técnico:
support.datasunrise.com
Consultas sobre Asociaciones y Alianzas:
[email protected]