Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Partage de données dans Amazon Redshift
Avec Amazon Redshift, vous pouvez partager des données en toute sécurité entre des clusters Amazon Redshift ou avec d'autres services. AWS Le partage de données vous permet de partager des données en temps réel, sans avoir à en créer une copie ou à les déplacer. Les administrateurs de bases de données et les ingénieurs de données peuvent utiliser le partage de données pour fournir un accès sécurisé en lecture seule aux données à des fins d'analyse, tout en gardant le contrôle sur les données. Les analystes de données, les professionnels de l'informatique décisionnelle et les scientifiques des données peuvent tirer parti des données partagées pour obtenir des informations sans les dupliquer ni les déplacer. Les cas d'utilisation courants incluent le partage de données avec des partenaires, la possibilité d'analyses interfonctionnelles et la facilitation de la démocratisation des données au sein d'une organisation. Les sections suivantes décrivent en détail la configuration et la gestion du partage de données dans Amazon Redshift.
Grâce au partage de données Amazon Redshift, vous pouvez partager en toute sécurité l'accès aux données en temps réel entre les clusters Amazon Redshift Régions AWS et les groupes de travail Comptes AWS, sans déplacer ni copier manuellement les données. Comme les données sont en ligne, tous les utilisateurs peuvent consulter les informations les plus complètes up-to-date et les plus cohérentes dans Amazon Redshift dès leur mise à jour.
Vous pouvez partager des données entre les clusters mis en service, les groupes de travail sans serveur, les zones de disponibilité, les Comptes AWS et les Régions AWS. Vous pouvez effectuer des partages entre différents types de cluster, mais aussi entre les clusters mis en service et les groupes de travail sans serveur.
Vous pouvez partager des objets de base de données en lecture et en écriture entre différents clusters Amazon Redshift ou groupes de travail Amazon Redshift Serverless au sein d'un Compte AWS même cluster ou de l'un à l'autre. Compte AWS Vous pouvez également lire et écrire des données dans toutes les régions. Vous pouvez accorder des autorisations telles que SELECT, INSERT et UPDATE pour différentes tables, et USAGE et CREATE pour différents schémas. Les données sont en ligne et disponibles dans tous les entrepôts dès qu’une transaction d’écriture est validée.
Cas d’utilisation du partage de données pour Amazon Redshift
Le partage de données Amazon Redshift est particulièrement utile dans les situations suivantes :
-
Prise en charge de différents types d’applications essentielles à vos activités – utilisez un cluster central Extract-transform-load (ETL) qui partage des données avec plusieurs clusters de Business Intelligence (BI) ou d’analytique. Cette approche fournit l’isolation des charges de travail en lecture et la rétrofacturation pour les applications individuelles. Vous pouvez dimensionner et mettre à l’échelle votre calcul de charges de travail individuel en fonction des exigences spécifiques aux charges de travail en termes de prix et de performances.
-
Activation de la collaboration entre groupes – permet une collaboration transparente entre les équipes et les groupes métier pour une analytique, une science des données et des analyses d’impact interproduits plus larges.
-
Diffusion Data as a Service – partagez des données sous forme de services dans l’ensemble de votre organisation.
-
Partage de données entre environnements – partagez des données entre les environnements de développement, de test et de production. Vous pouvez améliorer l’agilité des équipes en partageant des données selon différents niveaux de précision.
-
Accès sous licence aux données dans Amazon Redshift — Répertoriez les ensembles de données Amazon Redshift dans AWS Data Exchange le catalogue que les clients peuvent trouver, auxquels ils peuvent s'abonner et consulter en quelques minutes.
Cas d'utilisation du partage de données et accès en écriture
Le partage de données pour les écritures présente plusieurs cas d'utilisation importants :
-
Mettre à jour les données des sources commerciales sur le producteur : vous pouvez partager des données sous forme de service au sein de votre organisation, mais les consommateurs peuvent également effectuer des actions sur les données sources. Par exemple, ils peuvent communiquer des up-to-date valeurs rétrospectives ou accuser réception des données. Ce ne sont là que quelques cas d'utilisation commerciale possibles.
-
Insérer des enregistrements supplémentaires sur le producteur — Les consommateurs peuvent ajouter des enregistrements aux données sources d'origine. Ils peuvent être marqués comme provenant du consommateur, si nécessaire.
Pour des informations spécifiques concernant la manière d'effectuer des opérations d'écriture sur un partage de données, consultez la section Partage de l'accès en écriture aux données.
Partage de données à différents niveaux dans Amazon Redshift
Avec Amazon Redshift, vous pouvez partager des données à différents niveaux. Ces niveaux incluent les bases de données, les schémas, les tables, les vues (y compris les vues standard, à liaison tardive et matérialisées) et les fonctions SQL définies par l'utilisateur (). UDFs Vous pouvez créer plusieurs unités de partage des données pour une base de données spécifique. Une unité de partage des données peut contenir des objets provenant de plusieurs schémas dans la base de données sur laquelle le partage est créé.
Grâce à cette flexibilité dans le partage des données, vous bénéficiez d’un contrôle d’accès affiné. Vous pouvez adapter ce contrôle aux différents utilisateurs et entreprises qui ont besoin d’accéder aux données Amazon Redshift.
Gestion de cohérence pour le partage de données dans Amazon Redshift
Amazon Redshift assure la cohérence des transactions sur tous les clusters et partages up-to-date de producteurs et de consommateurs, ainsi que des vues cohérentes des données avec tous les consommateurs.
Vous pouvez mettre à jour en continu les données du cluster producteur. Toutes les requêtes d’un cluster consommateur au sein d’une transaction affichent le même état des données partagées. Amazon Redshift ne prend pas en compte les données modifiées par une autre transaction sur le cluster producteur validé après le début de la transaction sur le cluster consommateur. Une fois que la modification des données est validée sur le cluster producteur, les nouvelles transactions sur le cluster consommateur peuvent immédiatement interroger les données mises à jour.
La forte cohérence élimine les risques liés aux rapports métier de faible fidélité qui peuvent contenir des résultats invalides lors du partage des données. Ce facteur est particulièrement important pour l’analyse financière ou lorsque les résultats peuvent être utilisés pour préparer des jeux de données qui sont utilisés pour entraîner des modèles de machine learning.