
Almacenes de Datos

Introducción
En el mundo de hoy, impulsado por los datos, gestionar y almacenar datos de manera eficiente es crucial para que las empresas prosperen. Los almacenes de datos son repositorios centralizados que permiten a las organizaciones almacenar, gestionar y acceder a sus datos de manera efectiva. En este artículo, exploraremos los conceptos básicos de los almacenes de datos, sus tipos y cómo DataSunrise, una plataforma líder en seguridad de datos, permite a los usuarios crear y gestionar instancias de almacenes de datos de manera fluida usando su funcionalidad de Llamada a Procedimiento Remoto (RPC).
¿Qué son los Almacenes de Datos?
Un almacén de datos es un lugar donde los datos se almacenan y gestionan para su fácil recuperación y manipulación. Los almacenes de datos pueden ser físicos o digitales, y pueden ser bases de datos, archivos o servicios de almacenamiento en la nube.
DataSunrise ofrece una amplia cobertura de bases de datos modernas, almacenes, sistemas de archivos y servicios de almacenamiento. Vamos a discutir cómo el almacén de datos está incluido en DataSunrise para monitorear, asegurar los datos y llevar a cabo el descubrimiento de cumplimiento.
Los almacenes de datos desempeñan un papel vital en el apoyo a las operaciones comerciales, permitiendo el análisis de datos y facilitando los procesos de toma de decisiones. Al centralizar el almacenamiento de datos, las organizaciones pueden eliminar silos de datos, reducir redundancias y simplificar las tareas de gestión de datos.
Instancias para Almacenes de Datos en DataSunrise
DataSunrise ofrece un conjunto integral de herramientas para gestionar diversos tipos de almacenamiento de datos.
DataSunrise implementa el almacén de datos como una Instancia de Base de Datos. Para crear una, debe ir a ‘Configuración’ -> ‘Bases de Datos’ -> ‘+ Añadir Base de Datos’.
A continuación, puede ver la interfaz de configuración de la instancia. Hemos truncado la configuración del proxy para mayor claridad. Como puede ver en la imagen, configura los parámetros del host, el nombre de usuario y la contraseña. También puede probar la conexión a la base de datos.
DataSunrise no le permite guardar una nueva instancia antes de probar la conexión.

Todas las bases de datos, almacenes, servicios y sistemas de archivos cubiertos por DataSunrise son iguales en la configuración de instancias. Con la única excepción de las credenciales para los sistemas de almacenamiento en la nube y los sistemas de archivos.
Exploremos los diferentes tipos de almacenes de datos disponibles en DataSunrise:
- Bases de Datos Relacionales: DataSunrise admite bases de datos relacionales populares como MySQL, PostgreSQL, Oracle y SQL Server. Estas bases de datos almacenan datos estructurados en tablas con esquemas predefinidos, lo que permite realizar consultas y manipulaciones de datos de manera eficiente utilizando SQL.
- Bases de Datos NoSQL: Para manejar datos no estructurados o semiestructurados, DataSunrise se integra con bases de datos NoSQL como MongoDB, Cassandra y Redis. Las bases de datos NoSQL ofrecen flexibilidad y escalabilidad, lo que las hace adecuadas para manejar grandes volúmenes de datos diversos.
- Almacenamiento en la Nube: DataSunrise se integra sin problemas con plataformas de almacenamiento en la nube como Amazon S3, Google Cloud Storage y Azure Blob Storage. Estos almacenes de datos ofrecen soluciones escalables y rentables para almacenar y acceder a datos en la nube.
- Sistemas de Archivos: DataSunrise le ayuda a organizar los datos almacenados en sistemas de archivos regulares como carpetas en su computadora o almacenamiento en red. Los sistemas de archivos son ideales para almacenar datos no estructurados como documentos, imágenes y videos.
Creación de Instancias de Almacenes de Datos con RPC
DataSunrise tiene una función llamada Llamada a Procedimiento Remoto (JSON RPC) que permite a los usuarios crear y gestionar instancias de almacenes de datos utilizando código. RPC permite la automatización y flexibilidad en las tareas de gestión de datos. Exploremos un ejemplo de cómo crear una instancia de almacén de datos utilizando RPC en DataSunrise.
Ejemplo: Creando una Instancia de Almacén de Datos PostgreSQL con RPC
./executecommand.bat connect -host 192.168.10.205 -port 11000 -login admin -password 123123 -protocol https
La sesión expirará en 10 minutos después de la conexión si no se usa.
./executecommand.sh callRPC -file ./myfolder/Request.json
El archivo JSON RPC – Request.json es el siguiente:
{ "data": { "login": "postgres", "dbType": 4, "name": "PostgreSQL@192.168.10.230:5432", "connectType": 1, "enableSNI": false, "dbName": "postgres", "awsRegion": "", "withFKMetadata": false, "asSysdba": false, "host": "192.168.10.230", "port": 5432, "ipVersion": 0, "cryptoType": 0, "kerberosServiceName": "postgres", "sslCertVerificationType": 0, "clientSslKeyGroupID": -1, "serverSslKeyGroupID": 0, "serverID": 1, "loginType": 1, "isSeparateMsgHandler": false, "msgHandlerThreads": 1, "isSeparateAuditJournal": false, "auditJournalThreads": 1, "trafficSrcType": 1, "networkInterfaceIP": "0.0.0.0", "localPort": 5433, "queryGroupFilter": "{\"groups_id\":[]}", "dynamicSqlProcessing": false, "dynamicSqlHandlerPort": 0, "dynamicSqlHandlerHost": "", "acceptSslConnectionsOnly": false, "passwd": "AES256_CBC_fYTdX42TQX5a/FKb4jawfQ==", "protocolType": 0, "additionOption": "", "dsEnvironmentName": "DS_ENVIRONMENT", "autoCreateEnvironment": false, "checkExistInterface": true, "enableSslOnlyForClientConnections": false, "useConnString": false, "customConnString": "", "passwordVaultType": 0, "isConnectionString": 0 }, "func": "createNewInstance", "queryID": 1220950648, "session_id": 967799160853902 }
Esto produce una salida similar a la siguiente en caso de que la instancia ya exista:
{ "errorStmt" : "", "errorDesc" : "Ya existe una instancia con el mismo nombre. PostgreSQL@192.168.10.230:5432", "error" : 10, "queryID" : 1220950648 }
Cuando trabaje con JSON, asegúrese de no tener instancias con el mismo nombre o instancias vinculadas a la misma base de datos. De lo contrario, el backend de DataSunrise da un error o preguntas adicionales. Esto puede romper la automatización al ejecutar la llamada RPC.
En caso de una llamada RPC exitosa, verá esto en el JSON de respuesta:
{ "id" : 16, "error" : 0, "errorDesc" : "", "queryID" : 1739172125 }
¿Cómo Encontrar JSON para RPC?
La interfaz web de DataSunrise utiliza JSON RPC por defecto como el método principal para controlar el núcleo del cortafuegos.
Puede encontrar todos los comandos en formato JSON utilizando la Consola de Depuración en su navegador web.
- Para Chrome o Edge presione la tecla F12 y vaya al ‘Panel de Red’.
- Vaya a ‘Configuración’ → ‘Bases de Datos’ → ‘+ Añadir Base de Datos’, haga la configuración inicial de la Instancia y pruebe la conexión a la base de datos. No presione el botón ‘Guardar’.
- Use el botón ‘Iniciar registro de red’ para comenzar a registrar y presione el botón ‘Guardar’. Los eventos del registro aparecerán abajo en la consola.
- Presione el botón Detener registro. Encontrará una o más solicitudes a la dirección como https://192.168.10.205:11000/web_iface. La carga útil de la solicitud es en realidad el JSON para la llamada RPC. Active la sección de Carga útil para verla
Intente detener la escritura del registro de red tan pronto como se presione ‘Guardar’. Esto minimiza el registro de red en la consola del navegador. Y será más fácil analizar las llamadas a ‘web_iface’ para encontrar el JSON que necesita. En el caso de Guardar Instancia debería incluir la propiedad “func”: “createNewInstance” después de la sección de datos.

La funcionalidad RPC de DataSunrise automatiza la creación y gestión de instancias de almacenes de datos. Simplifica el proceso de configuración y establecimiento de entornos de almacenamiento de datos. Esto ahorra tiempo y esfuerzo. Esto ahorra tiempo y esfuerzo.
Ejemplo: Creando una Instancia de Almacén de Datos PostgreSQL con comando dedicado
Este enfoque es menos común porque la línea de comandos (CLI) de DataSunrise no implementa toda la funcionalidad. Pero funciona y merece ser mencionado al menos. Este enfoque funciona sin JSON y sin análisis de la consola del navegador.
executecommand.bat connect -host 192.168.10.205 -port 11000 -login admin -password 123123 -protocol https
executecommand.bat addInstancePlus -dbHost 192.168.10.230 -dbPort 3305 -proxyHost 192.168.10.205 -proxyPort 5432 -dbType postgresql -database test -password 1234 -login postgres -name test
Para otros tipos de bases de datos, consulte la Guía CLI de DataSunrise en el comando ‘addInstancePlus’. También puede encontrar más información sobre DataSunrise RPC en esta guía.
Resumen y Conclusión
Los Almacenes de Datos son componentes esenciales de la gestión moderna de datos, proporcionando un repositorio centralizado para almacenar y gestionar los datos de una organización. DataSunrise ofrece varias herramientas para gestionar diferentes tipos de Almacenes de Datos, incluidas bases de datos relacionales, bases de datos NoSQL, almacenamiento en la nube y sistemas de archivos.
Con la funcionalidad de Llamada a Procedimiento Remoto (RPC) de DataSunrise, los usuarios pueden crear y gestionar instancias de almacenes de datos programáticamente, lo que permite la automatización y flexibilidad en las tareas de gestión de datos. El ejemplo proporcionado demuestra cómo crear una instancia de almacén de datos MySQL utilizando RPC en la CLI de DataSunrise.
DataSunrise es una plataforma destacada para la gestión de datos, con características robustas para la seguridad de datos, reglas de auditoría, enmascaramiento y cumplimiento. También es altamente flexible. La interfaz fácil de usar y las potentes características la convierten en una opción popular para las empresas que buscan simplificar su gestión de datos.
Para obtener más información sobre DataSunrise y sus avanzadas soluciones de gestión de datos, le invitamos a visitar a nuestro equipo para una demostración en línea. Experimente de primera mano cómo DataSunrise puede transformar la forma en que maneja y protege sus valiosos activos de datos.