
Historique des activités de données dans Greenplum

Comprendre et suivre l’historique des activités de données dans la base de données Greenplum est devenu de plus en plus crucial pour les organisations gérant des opérations de données à grande échelle. Selon le rapport sur la cybersécurité de Check Point Research, les organisations font face à une moyenne de 1 248 attaques hebdomadaires, soulignant le besoin critique de surveillance des activités de la base de données. La capacité à suivre et analyser les activités de données historiques n’est pas seulement une question de sécurité — elle est fondamentale pour maintenir la sécurité des données, optimiser les performances et assurer la conformité réglementaire.
La base de données Greenplum offre des capacités robustes pour suivre l’historique des activités de données grâce à son infrastructure sophistiquée de journalisation et de surveillance. Cette approche systématique permet aux organisations de conserver des enregistrements détaillés de toutes les opérations de la base de données tout en répondant aux exigences de sécurité et à l’efficacité opérationnelle.
Comprendre l’historique des activités de données de Greenplum
Principaux composants
Le système de gestion des données de Greenplum se compose de plusieurs composants clés travaillant ensemble :
- Suivi des activités distribuées : chaque segment maintient des journaux détaillés des opérations locales
- Collecte centrale des activités : le nœud coordinateur agrège les données d’activité de tous les segments
- Stockage historique des requêtes : conserve des enregistrements détaillés des exécutions de requêtes passées
- Statistiques de performance : suit l’utilisation des ressources et les métriques de performance des requêtes
- Historique des sessions utilisateur : enregistre les détails de connexion et d’interaction des utilisateurs
Configuration de base
Pour activer un suivi complet de l’historique des activités de données dans Greenplum :
-- Activer le suivi de l'activité de base ALTER SYSTEM SET track_activities = on; ALTER SYSTEM SET track_counts = on; ALTER SYSTEM SET track_io_timing = on; -- Configurer la journalisation détaillée des activités ALTER SYSTEM SET log_statement_stats = on; ALTER SYSTEM SET log_parser_stats = on; ALTER SYSTEM SET log_planner_stats = on; ALTER SYSTEM SET log_executor_stats = on;
Configuration avancée de la surveillance des activités
Pour des capacités de suivi des activités améliorées et la détection des menaces :
-- Activer les détails étendus des activités ALTER SYSTEM SET track_functions = 'all'; ALTER SYSTEM SET track_activity_query_size = 2048; -- Configurer la rétention des activités ALTER SYSTEM SET stats_temp_directory = 'pg_stat_temp'; ALTER SYSTEM SET track_commit_timestamp = on;
Exemples de mise en œuvre pratiques
1. Surveiller les modèles d’accès aux tables
SELECT schemaname, relname, seq_scan, seq_tup_read, idx_scan FROM pg_stat_user_tables WHERE schemaname = 'public' AND relname = 'clients';
Exemple de sortie :
schemaname | relname | seq_scan | seq_tup_read | idx_scan |
---|---|---|---|---|
public | clients | 8420 | 1842930 | 385720 |
2. Analyser l’historique des performances des requêtes
SELECT datname, calls, total_time / 1000 as total_seconds, min_time / 1000 as min_seconds, max_time / 1000 as max_seconds, mean_time / 1000 as avg_seconds, rows FROM pg_stat_statements JOIN pg_database ON pg_stat_statements.dbid = pg_database.oid WHERE datname = 'testdb' AND query ILIKE '%clients%' ORDER BY total_time DESC LIMIT 10;
Exemple de sortie :
datname | calls | total_seconds | min_seconds | max_seconds | avg_seconds | rows |
---|---|---|---|---|---|---|
testdb | 15420 | 842.45 | 0.002 | 12.458 | 0.054 | 154892 |
testdb | 8240 | 425.84 | 0.001 | 8.245 | 0.051 | 84520 |
testdb | 4120 | 245.62 | 0.001 | 5.842 | 0.059 | 45820 |
testdb | 2840 | 158.45 | 0.002 | 4.584 | 0.055 | 28450 |
testdb | 1520 | 84.52 | 0.001 | 3.245 | 0.055 | 15840 |
3. Analyse de l’activité des utilisateurs
SELECT usename, client_addr, backend_start, xact_start, query_start, state, query FROM pg_stat_activity WHERE state != 'idle' AND datname = 'testdb' AND query ILIKE '%clients%' AND query ILIKE '%birth_date%' OR query ILIKE '%sex%' ORDER BY query_start DESC;
Exemple de sortie :

Améliorer l’historique des activités avec DataSunrise
Bien que Greenplum fournisse des capacités natives robustes pour le suivi des activités de données, DataSunrise étend ces fonctionnalités avec des capacités avancées de surveillance et d’analyse grâce à sa technologie de pare-feu de base de données.
1. Suivi des activités avancé
DataSunrise fournit une interface complète pour surveiller les activités de la base de données en temps réel. Grâce à son tableau de bord intuitif, les administrateurs peuvent facilement suivre et analyser toutes les opérations de la base de données.

La plateforme offre un contrôle granulaire sur le suivi des activités grâce à des règles et des filtres personnalisés :
- Surveillance des activités en temps réel avec des informations de session détaillées
- Règles de suivi personnalisées pour des objets ou des opérations spécifiques de la base de données
- Analyse détaillée des sessions avec attribution des utilisateurs
- Suivi de l’utilisation des ressources sur toutes les instances surveillées
2. Outils d’analyse historique
DataSunrise conserve des pistes d’audit détaillées de toutes les activités de la base de données, offrant une visibilité complète sur les opérations historiques.

Les principales fonctionnalités comprennent :
- Stockage des activités à long terme avec des capacités de recherche avancées
- Génération de rapports personnalisés pour l’analyse de la conformité et de la sécurité
- Capacités d’analyse de tendances pour identifier les modèles d’utilisation
- Outils d’évaluation de l’impact sur la performance
Bénéfices d’intégration
- Surveillance centralisée des activités sur toutes les instances de la base de données
- Analyses de sécurité avancées avec des capacités d’apprentissage automatique
- Rapports de conformité automatisés pour les principales réglementations
- Notifications en temps réel pour les événements de sécurité et de performance
Meilleures pratiques pour la gestion de l’historique des activités
Optimisation des performances
Maintenir des performances optimales tout en suivant l’historique des activités nécessite une considération attentive de plusieurs facteurs, y compris une configuration appropriée de l’accessibilité des données :
Suivi sélectif des activités : implémentez un suivi basé sur les exigences commerciales et la sensibilité des données. Concentrez-vous sur les opérations critiques et les modèles d’accès aux données sensibles pour minimiser l’impact sur les performances tout en maintenant une couverture complète des activités essentielles.
Gestion du stockage : l’entretien régulier des tables d’historique des activités est crucial. Mettez en œuvre des stratégies d’archivage efficaces et des procédures de nettoyage pour éviter la dégradation des performances due à l’accumulation excessive de données historiques.
Surveillance des ressources : surveillez en continu l’effet du suivi des activités sur les performances du système. Ajustez les paramètres de suivi et les politiques de rétention en fonction des métriques de performance observées et des ressources système.
Considérations de sécurité
Protéger les données d’historique des activités nécessite une approche de sécurité multicouche et un contrôle d’accès basé sur les rôles approprié :
Protection des données : implémentez le cryptage des données d’activité sensibles, en particulier lors du stockage d’informations personnellement identifiables ou d’autres types de données protégées. Des solutions tierces comme DataSunrise peuvent offrir des capacités de cryptage supplémentaires et des fonctionnalités de sécurité.
Contrôle d’accès : implémentez des contrôles d’accès stricts pour les données d’historique des activités. Limitez l’accès au personnel autorisé et maintenez des journaux détaillés de qui accède à l’historique des activités.
Examens de sécurité : réalisez régulièrement des évaluations de sécurité de votre infrastructure de suivi des activités. Cela inclut la révision des modèles d’accès, l’analyse des menaces potentielles et la validation des contrôles de sécurité.
Exigences de conformité
Répondre aux exigences réglementaires par le suivi de l’historique des activités nécessite des approches systématiques, y compris une protection continue des données appropriée :
Gestion de la rétention : établissez des politiques claires pour la rétention de l’historique des activités qui s’alignent sur les exigences réglementaires. Prenez en compte les réglementations spécifiques à l’industrie et les lois locales sur la protection des données lors de la définition des périodes de rétention.
Rapports automatisés : mettez en place des mécanismes automatisés pour générer des rapports de conformité. Cela aide à rationaliser les processus d’audit et à garantir l’application cohérente des politiques dans l’environnement de la base de données.
Documentation : maintenez une documentation complète de toutes les configurations de suivi, y compris la justification des décisions de suivi et toute modification apportée aux paramètres de suivi.
Conclusion
La gestion efficace de l’historique des activités de données dans Greenplum nécessite une approche équilibrée combinant des capacités natives avec des outils spécialisés. Alors que Greenplum fournit des fonctionnalités essentielles pour suivre les activités de la base de données, les organisations ont souvent besoin de fonctionnalités supplémentaires pour répondre aux exigences complexes de surveillance et de conformité.
DataSunrise améliore ces capacités en offrant des outils de surveillance avancés, des analyses en temps réel et des rapports de conformité automatisés. Cette combinaison permet aux organisations de maintenir une visibilité complète de leurs opérations de base de données tout en garantissant la sécurité et la conformité.
Pour plus d’informations sur l’amélioration de vos capacités de surveillance de bases de données Greenplum avec DataSunrise, programmez une démonstration en ligne pour voir ces fonctionnalités en action.