Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Quelles sont les nouveautés d'Amazon DataZone ?
Cette section décrit les nouvelles fonctionnalités et améliorations d'Amazon DataZone par date de sortie.
2024
Amazon DataZone lance des unités de domaine et des politiques d'autorisation
Publié le 08/12/2024
Amazon DataZone introduit un ensemble de nouvelles fonctionnalités de gouvernance des données appelées unités de domaine et politiques d'autorisation qui permettent aux clients de créer une organisation au niveau de l'unité commerciale/de l'équipe et de gérer les politiques en fonction des besoins de leur entreprise. Avec l'ajout d'unités de domaine, les utilisateurs peuvent organiser, créer, rechercher et trouver des actifs de données et des projets associés à des unités commerciales ou à des équipes. Grâce aux politiques d'autorisation, ces utilisateurs d'unités de domaine peuvent définir des politiques d'accès pour créer des projets, des glossaires et utiliser des ressources informatiques au sein d'Amazon DataZone. Pour de plus amples informations, veuillez consulter Unités de domaine et politiques d'autorisation sur Amazon DataZone.
Amazon DataZone lance des produits de données
Publié le 08/05/2024
Amazon DataZone lance des produits de données, qui permettent de regrouper les actifs de données dans des packages autonomes bien définis, adaptés à des cas d'utilisation professionnels spécifiques. Par exemple, un produit de données d'analyse marketing peut regrouper divers actifs de données, tels que les données de campagnes marketing, les données de pipeline et les données clients. Grâce aux produits de données, les clients peuvent simplifier les processus de découverte et d'abonnement, en les alignant sur les objectifs commerciaux et en réduisant la redondance dans la gestion des actifs individuels. Pour plus d'informations, consultez Produits DataZone de données Amazon .
Amazon DataZone lance une fonctionnalité de contrôle d'accès précise
Publié le 07/02/2024
Amazon DataZone a introduit un contrôle d'accès précis, qui vous permet de contrôler de manière précise vos actifs de données dans le catalogue de données commerciales d'Amazon, à travers les lacs DataZone de données et les entrepôts de données. Grâce à cette nouvelle fonctionnalité, les propriétaires de données peuvent désormais restreindre l'accès à des enregistrements de données spécifiques au niveau des lignes et des colonnes, au lieu d'accorder l'accès à l'ensemble des actifs de données. Par exemple, si vos données contiennent des colonnes contenant des informations sensibles telles que des informations personnelles identifiables (PII), vous pouvez limiter l'accès aux seules colonnes nécessaires, afin de protéger les informations sensibles tout en autorisant l'accès aux données non sensibles. De même, vous pouvez contrôler l'accès au niveau des lignes, en permettant aux utilisateurs de ne voir que les enregistrements correspondant à leur rôle ou à leur tâche. Pour plus d’informations, consultez Contrôle d'accès précis aux données sur Amazon DataZone.
Amazon DataZone lance une fonctionnalité de traçabilité des données
Publié le 27/06/2024
Amazon DataZone lance le lignage des données en version préliminaire, afin d'aider les clients à visualiser les événements liés au lignage à partir de systèmes OpenLineage compatibles ou via API et à suivre le mouvement des données de la source à la consommation. Grâce à la OpenLineage compatibilité DataZone d'AmazonAPIs, les administrateurs de domaines et les producteurs de données peuvent capturer et stocker des événements de lignage au-delà de ce qui est disponible sur Amazon DataZone, y compris les transformations dans Amazon S3, AWS Glue et autres services. En outre, DataZone les versions d'Amazon font le suivi de chaque événement, ce qui permet aux utilisateurs de visualiser le lignage à tout moment ou de comparer les transformations liées à l'historique d'un actif ou d'une tâche. Cette généalogie historique permet de mieux comprendre l'évolution des données, ce qui est essentiel pour le dépannage, l'audit et la validation de l'intégrité des actifs de données. Pour plus d’informations, consultez Lignage des données dans Amazon DataZone (version préliminaire) .
Amazon DataZone lance le custom AWS plans de service
Publié le 17/06/2024
Avec personnalisation AWS plans de service, si vous en avez déjà AWS ressources, notamment IAM les rôles, les lacs de données, les maillages de données, les compartiments Amazon S3 et les clusters Amazon Redshift, vous pouvez désormais spécifier des autorisations pour ces ressources existantes à l'aide de votre propre rôle IAM personnalisé, afin que vos utilisateurs DataZone Amazon puissent tirer parti de la publication et de l'abonnement pour partager et gérer ces ressources. Avec personnalisation AWS plans de service, les DataZone administrateurs Amazon peuvent configurer AWS environnements de service utilisant leurs propres rôles personnalisés. Ils peuvent configurer des liens d'actions pour ceux-ci. AWS environnements de service et fournissent ainsi un accès fédéré à tous leurs environnements existants AWS ressources. Ils peuvent également configurer des cibles d'abonnement et des sources de données dans ces options personnalisées AWS environnements de service. Les administrateurs peuvent configurer AWS environnements de service dans leur propre compte de DataZone domaine Amazon ou dans tout compte associé à partir duquel ils souhaitent publier, s'abonner, découvrir ou gérer des données. Pour de plus amples informations, veuillez consulter DataZone Schémas AWS de service personnalisés Amazon .
Améliorations apportées au flux de création de sources de données
Publié le 06/10/2024
Amazon DataZone a apporté des améliorations au flux de création des sources de données afin de simplifier la gestion des accès pour les producteurs de données. Avec ces mises à jour, lorsqu'un producteur de données crée une source de données pour publier ses AWS Glue et Amazon Redshift Assets, Amazon DataZone accorde des autorisations de lecture seule aux membres du projet. Lors de la création d'un AWS Source de données Glue, Amazon accorde DataZone automatiquement des autorisations « en lecture seule » au IAM rôle de l'environnement utilisé pour créer la source de données, permettant ainsi l'accès à toutes les tables du AWS Bases de données Glue. De même, pour les sources de données Amazon Redshift, Amazon DataZone accorde un accès « en lecture seule » à toutes les tables des schémas Amazon Redshift utilisés dans la source de données. Pour plus d’informations, consultez Créez et exécutez une source DataZone de données Amazon pour AWS Glue Data Catalog et Création et gestion d'une source de DataZone données Amazon pour Amazon Redshift.
Amazon DataZone lance l'intégration avec Amazon SageMaker
Publié le 05/06/2024
Amazon DataZone lance l'intégration avec Amazon SageMaker
Amazon DataZone lance l'intégration avec AWS Mode d'accès hybride à Lake Formation
Publié le 04/03/2024
Amazon DataZone a introduit une intégration avec AWS Mode d'accès hybride Lake Formation. Cette intégration vous permet de publier et de partager facilement votre AWS Glue des tables via Amazon DataZone, sans avoir à les enregistrer AWS Lake Formation d'abord. Pour commencer, les administrateurs activent le paramètre d'enregistrement de la localisation des données dans le DefaultDataLake
plan de la DataZone console Amazon. Ensuite, lorsqu'un consommateur de données s'abonne à un AWS Table Glue gérée via IAM des autorisations, Amazon enregistre d' DataZone abord les emplacements Amazon S3 de cette table en mode hybride, puis accorde l'accès au consommateur de données en gérant les autorisations sur la table via AWS Lake Formation. Cela garantit que IAM les autorisations sur la table continuent d'exister avec les autorisations nouvellement accordées AWS Permissions de Lake Formation, sans perturber les flux de travail existants. Pour plus d’informations, consultez le DataZone Intégration d'Amazon au mode hybride de AWS Lake Formation .
Amazon DataZone lance l'intégration avec AWS Qualité des données Glue
Publié le 04/03/2024
Amazon DataZone lance l'intégration avec AWS Glue Data Quality et propose APIs d'intégrer des mesures de qualité des données issues de solutions de qualité des données tierces. La nouvelle intégration vous permet de publier automatiquement AWS Intégrez les scores de qualité des données dans le catalogue de données Amazon DataZone Business. Amazon DataZone APIs peut être utilisé pour ingérer des indicateurs de qualité provenant de sources tierces. Une fois publiées, les consommateurs de données peuvent facilement rechercher des actifs de données, consulter des indicateurs de qualité détaillés et identifier les contrôles et les règles défaillants, ce qui permet aux entreprises de prendre des décisions éclairées. Pour plus d’informations, consultez le Qualité des données sur Amazon DataZone.
Mise à disposition générale des recommandations relatives à l'IA pour les descriptions sur Amazon DataZone
Publié le 27/03/2024
Amazon DataZone a annoncé la mise à disposition générale de la nouvelle fonctionnalité générative basée sur l'IA afin d'améliorer la découverte des données, leur compréhension et leur utilisation en enrichissant le catalogue de données commerciales. En un seul clic, les producteurs de données peuvent générer des descriptions et un contexte complets des données commerciales, mettre en évidence les colonnes pertinentes et inclure des recommandations sur des cas d'utilisation analytiques. Le lancement ajoute un support APIs que les producteurs de données peuvent utiliser pour générer par programmation des descriptions pour les actifs. Pour de plus amples informations, veuillez consulter Utilisation de l'apprentissage automatique et de l'IA générative sur Amazon DataZone.
Amazon apporte DataZone des améliorations à l'intégration d'Amazon Redshift
Publié le 21/03/2024
Amazon DataZone a apporté plusieurs améliorations à son intégration avec Amazon Redshift, simplifiant le processus de publication et d'abonnement aux tables et aux vues Amazon Redshift. Ces mises à jour rationalisent l'expérience des producteurs de données et des consommateurs, en leur permettant de créer rapidement des environnements d'entrepôt de données à l'aide d'informations d'identification et de paramètres de connexion préconfigurés fournis par leurs DataZone administrateurs Amazon. En outre, ces améliorations permettent aux administrateurs de mieux contrôler qui peut utiliser les ressources de leur AWS comptes et clusters Amazon Redshift, et dans quel but.
-
Configuration du plan : une fois que vous avez activé le
DefaultDataWarehouseBlueprint
plan, vous pouvez contrôler quels projets peuvent utiliser leDefaultDataWarehouseBlueprint
plan dans votre compte pour créer des profils d'environnement en attribuant la gestion des projets au plan activé. Vous pouvez également créer des ensembles de paramètres enDefaultDataWarehouseBlueprint
fournissant des paramètres tels que le cluster, la base de données et un AWS Secret. Vous pouvez également créer AWS Secrets provenant de la DataZone console Amazon. -
Profil d'environnement : lors de la création d'un profil d'environnement, vous pouvez choisir de fournir vos propres paramètres Amazon Redshift ou d'utiliser l'un des ensembles de paramètres de la configuration du plan. Si vous choisissez d'utiliser le jeu de paramètres créé dans la configuration du plan, AWS le secret ne nécessite qu'une
AmazonDataZoneDomain
AmazonDataZoneProject
balise (la balise n'est requise que si vous choisissez de fournir vos propres ensembles de paramètres dans le profil d'environnement). Dans le profil d'environnement, vous pouvez spécifier une liste de projets autorisés. Seuls les projets autorisés peuvent utiliser ce profil d'environnement pour créer des environnements d'entrepôt de données. Vous pouvez également spécifier les données que les projets autorisés sont autorisés à publier. Actuellement, vous pouvez choisir l'une des options suivantes : 1) Publier à partir de n'importe quel schéma, 2) Publier à partir du schéma d'environnement par défaut, 3) Ne pas autoriser la publication. -
Environnement : les producteurs ou les consommateurs de données peuvent désormais sélectionner un profil d'environnement pour créer des environnements, sans avoir à fournir leurs propres paramètres Amazon Redshift, notamment AWS Secret, cluster, groupe de travail et base de données. Ces paramètres sont transférés vers l'environnement à partir du profil d'environnement. Parallèlement à la création de l'environnement, Amazon crée DataZone désormais également un schéma par défaut pour l'environnement. Les membres du projet ont un accès en lecture et en écriture à ce schéma et peuvent facilement publier les tables créées dans ce schéma dans le catalogue en exécutant la source de données par défaut créée dans le cadre de la création de l'environnement. Les paramètres Amazon Redshift utilisés pour créer un environnement peuvent également être utilisés pour créer de nouvelles sources de données (au lieu que le producteur de données fournisse ses propres paramètres lors de la création de la source de données).
AWS Support à la formation dans le cloud pour Amazon DataZone
Publié le 18/01/2024
Les utilisateurs d'Amazon DataZone peuvent désormais tirer parti AWS CloudFormation pour modéliser et gérer efficacement une suite de DataZone ressources Amazon. Cette approche facilite le provisionnement cohérent des ressources, tout en permettant la gestion du cycle de vie par le biais de pratiques liées à l'infrastructure en tant que code. Grâce aux modèles personnalisés, vous pouvez définir avec précision les ressources dont vous avez besoin et leurs interdépendances. Pour plus d'informations, consultez la référence DataZone des types de ressources Amazon.
Ajoutez IAM des directeurs directement en tant que membres de projets Amazon DataZone
Publié le 01/05/2024
Vous pouvez désormais ajouter IAM des directeurs en tant que membres du projet, même s'ils IAM ne se sont pas encore connectés à Amazon DataZone (exigence précédente). Une fois qu'un administrateur de domaine ou un administrateur informatique a ajouté iam:GetUser
et iam:GetRole
au rôle d'exécution du domaine, les propriétaires de projet peuvent ajouter IAM des principaux en tant que membres en fournissant simplement le nom de ressource Amazon (ARN) du IAM rôle ou de l'utilisateur. IAM Le IAM principal doit toujours disposer des IAM autorisations requises pour accéder à Amazon DataZone et celles-ci peuvent être configurées dans la IAM console. Pour de plus amples informations, veuillez consulter Ajouter des membres à un projet.
Support pour les types d'actifs personnalisés depuis le portail de données
Publié le 01/05/2024
La prise en charge des actifs personnalisés permet DataZone à Amazon de cataloguer les actifs via le portail de données pour les données non structurées, notamment les tableaux de bord, les requêtes et les modèles, ce qui vous permet d'ajouter plus facilement des actifs personnalisés directement dans le portail de données, en plus du support précédemment disponibleAPI. La possibilité de créer, de mettre à jour et de publier des ressources personnalisées sur Amazon DataZone vous permet de partager, de rechercher, de vous abonner à tout type d'actif et de créer un flux de travail qui assure la gouvernance de ces actifs. Pour de plus amples informations, veuillez consulter Créez des types d'actifs personnalisés sur Amazon DataZone.
2023
Supprimer le domaine
Publié le 27/12/2023
Il s'agit d'une fonctionnalité qui vous permet de supprimer plus facilement vos domaines. Vous pouvez désormais procéder à la suppression du domaine même s'il n'est pas vide (car il contient des projets, des environnements, des actifs, des sources de données, etc.). Pour de plus amples informations, veuillez consulter Supprimer des DataZone domaines Amazon.
Mode hybride
Publié le 22/12/2023
Amazon DataZone a ajouté la prise en charge de AWS Mode hybride Lake Formation. Grâce à ce support, si vous publiez un AWS Glue Table to Amazon DataZone avec son AWS Emplacement S3 enregistré dans Lake Formation en mode hybride, Amazon DataZone traite cette table comme un actif géré et peut gérer les subventions d'abonnement à cette table. Avant la sortie de cette fonctionnalité, Amazon DataZone traitait ce tableau comme un actif non géré, c'est-à-dire DataZone qu'Amazon ne serait pas en mesure d'accorder des abonnements à ce tableau. Pour de plus amples informations, veuillez consulter Configurer les autorisations de Lake Formation pour Amazon DataZone.
HIPAAéligibilité
Publié le 14/12/2023
Amazon DataZone est désormais conforme à la loi américaine de 1996 sur la portabilité et la responsabilité en matière d'assurance maladie (HIPAA). Pour consulter la liste des AWS services HIPAA conformes, voir https://aws.amazon.com/compliance/hipaa-eligible-services-reference/
Recommandations de l'IA pour les descriptions dans Amazon DataZone (version préliminaire)
Publié le 28/11/2023
AWS annonce la prévisualisation d'une nouvelle fonctionnalité générative basée sur l'IA dans Amazon DataZone afin d'améliorer la découverte des données, leur compréhension et leur utilisation en enrichissant le catalogue de données commerciales. En un seul clic, les producteurs de données peuvent générer des descriptions et un contexte complets des données commerciales, mettre en évidence les colonnes pertinentes et inclure des recommandations sur des cas d'utilisation analytiques. Grâce aux recommandations de l'IA pour les descriptions sur Amazon DataZone, les consommateurs de données peuvent identifier les tables de données et les colonnes nécessaires à l'analyse, ce qui améliore la découvrabilité des données et réduit les back-and-forth communications avec les producteurs de données. La version préliminaire est disponible dans les DataZone domaines Amazon approvisionnés dans les domaines suivants AWS Régions : USA Est (Virginie du Nord), USA Ouest (Oregon). Pour de plus amples informations, veuillez consulter Utilisation de l'apprentissage automatique et de l'IA générative sur Amazon DataZone.
DefaultDataLake amélioration du plan
Publié le 20/11/2023
Amazon DataZone a ajouté une amélioration au DefaultDataLake plan qui vous permet de mieux contrôler qui peut publier quelles données à partir de votre AWS . Deux modifications majeures ont été introduites avec le lancement de cette fonctionnalité.
-
Dans la console, une fois que vous avez activé le DefaultDataLake plan, vous pouvez contrôler quels projets peuvent utiliser le DefaultDataLake plan dans votre compte pour créer des profils d'environnement en attribuant la gestion des projets au plan activé.
-
Le deuxième changement concerne le portail. Si vous créez un profil d'environnement à l'aide du DefaultDataLake plan, vous pouvez également sélectionner les projets autorisés autorisés à utiliser le profil d'environnement pour créer des environnements. Par défaut, tous les projets sont autorisés à utiliser le profil d'environnement du lac de données, mais vous pouvez restreindre le profil d'environnement à des projets spécifiques et également contrôler les données qui peuvent être publiées à l'aide des environnements créés avec le profil.
Pour de plus amples informations, veuillez consulter Création d'un profil d'environnement.