DataZone Integrierte Pläne von Amazon - Amazon DataZone

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

DataZone Integrierte Pläne von Amazon

Ein Blueprint, mit dem eine Umgebung erstellt wird, definiert, welche Tools und Dienste Mitglieder des Projekts, zu dem die Umgebung gehört, verwenden können, wenn sie mit Ressourcen im DataZone Amazon-Katalog arbeiten. In der aktuellen Version von Amazon DataZone gibt es die folgenden integrierten Blueprints:

  • Bauplan für einen Data Lake

  • Bauplan für ein Data Warehouse

  • SageMaker Amazon-Entwurf

Sie können die Schritte der folgenden Verfahren ausführen, um Standard-Blueprints in Amazon DataZone zu aktivieren:

Aktivieren Sie die integrierten Blueprints in AWS Konto, dem die DataZone Amazon-Domain gehört

Ein Blueprint, mit dem eine Umgebung erstellt wird, definiert, welche Tools und Dienste Mitglieder des Projekts, zu dem die Umgebung gehört, verwenden können, wenn sie mit Ressourcen im DataZone Amazon-Katalog arbeiten.

In der aktuellen Version von Amazon DataZone gibt es mehrere integrierte Blueprints: Data Lake Blueprint, Data Warehouse Blueprint und Amazon Blueprint. SageMaker

  • Der Data Lake-Blueprint enthält die Definition für den Start und die Konfiguration einer Reihe von Diensten (AWS Glue, AWS Lake Formation, Amazon Athena), um Data Lake-Assets im DataZone Amazon-Katalog zu veröffentlichen und zu verwenden.

  • Der Data Warehouse-Blueprint enthält die Definition für den Start und die Konfiguration einer Reihe von Diensten (Amazon Redshift) zur Veröffentlichung und Verwendung von Amazon Redshift Redshift-Assets im Amazon-Katalog. DataZone

  • Amazon SageMaker Blueprint enthält die Definition für den Start und die Konfiguration einer Reihe von Diensten (Amazon SageMaker Studio) zur Veröffentlichung und Verwendung von SageMaker Amazon-Ressourcen im DataZone Amazon-Katalog.

Weitere Informationen finden Sie unter DataZone Amazon-Terminologie und Konzepte.

Bei der Erstellung einer DataZone Amazon-Domain haben Sie die Möglichkeit, das Schnell-Setup zu wählen, das automatisch den Standard-Data Lake und die integrierten Standard-Data Warehouse-Blueprints als Teil des Domain-Erstellungsprozesses aktiviert. Quick Setup erstellt mithilfe dieser integrierten Blueprints auch Standardumgebungsprofile und Standardumgebungen für Sie.

Wenn Sie bei der Erstellung Ihrer DataZone Amazon-Domain nicht die Option Schnellinstallation wählen, können Sie wie folgt vorgehen, um die verfügbaren integrierten Blueprints in der AWS Konto, das diese DataZone Amazon-Domain beherbergt. Sie müssen diese integrierten Blueprints aktivieren, bevor Sie sie verwenden können, um Umgebungsprofile und Umgebungen in dieser Domain zu erstellen.

Um integrierte Blueprints in einer DataZone Amazon-Domain über die DataZone Amazon-Managementkonsole zu aktivieren, müssen Sie eine IAM Rolle in dem Konto mit Administratorberechtigungen übernehmen. Konfigurieren Sie die IAM für die Nutzung der Amazon DataZone Management Console erforderlichen Berechtigungenum die Mindestberechtigungen zu erhalten.

Integrierte Blueprints in einer DataZone Amazon-Domain aktivieren
  1. Navigieren Sie zur DataZone Amazon-Konsole unter https://console.aws.amazon.com/datazone und melden Sie sich mit Ihren Kontoanmeldeinformationen an.

  2. Wählen Sie Domains anzeigen und wählen Sie die Domain aus, für die Sie einen oder mehrere integrierte Blueprints aktivieren möchten.

  3. Navigieren Sie auf der Seite mit den Domain-Details zur Registerkarte Blueprints.

  4. Wählen Sie aus der Blueprint-Liste entweder den DefaultDataLakeoder den oder den DefaultDataWarehouse SageMakerAmazon-Blueprint aus.

  5. Wählen Sie auf der Detailseite des ausgewählten Blueprints die Option In diesem Konto aktivieren aus.

  6. Geben Sie auf der Seite „Berechtigungen und Ressourcen“ Folgendes an:

    • Wenn Sie den DefaultDataLakeBlueprint aktivieren, geben Sie für die Glue-Rolle „Zugriff verwalten“ eine neue oder bestehende Servicerolle an, die Amazon die DataZone Autorisierung zum Erfassen und Verwalten des Zugriffs auf Tabellen in AWS Glue und AWS Lake Formation.

    • Wenn Sie den DefaultDataWarehouseBlueprint aktivieren, geben Sie für die Rolle Redshift Manage Access eine neue oder bestehende Servicerolle an, die Amazon die DataZone Autorisierung erteilt, den Zugriff auf Datashares, Tabellen und Ansichten in Amazon Redshift aufzunehmen und zu verwalten.

    • Wenn Sie den SageMakerAmazon-Blueprint aktivieren, geben Sie für die Rolle „Zugriff SageMaker verwalten“ eine neue oder bestehende Servicerolle an, die Amazon DataZone Berechtigungen zur Veröffentlichung von SageMaker Amazon-Daten im Katalog erteilt. Es gibt Amazon auch die DataZone Erlaubnis, Zugriff auf von Amazon SageMaker veröffentlichte Assets im Katalog zu gewähren oder den Zugriff zu widerrufen.

      Wichtig

      Wenn Sie den SageMakerAmazon-Blueprint aktivieren, DataZone prüft Amazon, ob die folgenden IAM Rollen für Amazon im aktuellen Konto und in der Region DataZone existieren. Wenn diese Rollen nicht existieren, erstellt Amazon sie DataZone automatisch.

      • AmazonDataZoneGlueAccess- <region>-< > domainId

      • AmazonDataZoneRedshiftAccess- <region>-< > domainId

    • Geben Sie für die Bereitstellungsrolle eine neue oder bestehende Servicerolle an, die Amazon die DataZone Autorisierung zum Erstellen und Konfigurieren von Umgebungsressourcen erteilt, indem AWS CloudFormation im Umgebungskonto und in der Region.

    • Wenn Sie den SageMakerAmazon-Blueprint aktivieren, geben Sie für den Amazon S3-Bucket für SageMaker die -Glue-Datenquelle einen Amazon S3 S3-Bucket an, der von allen SageMaker Umgebungen in der AWS Konto. Das von Ihnen angegebene Bucket-Präfix muss eines der folgenden sein:

      • Amazon-Datazone*

      • Datazone-Sagemaker*

      • Sagemaker-Datazone*

      • DataZone-Sagemaker*

      • Salbeimacher- * DataZone

      • DataZone-SageMaker*

      • SageMaker-DataZone*

  7. Wählen Sie Blueprint aktivieren.

Sobald Sie die ausgewählten Blueprints aktiviert haben, können Sie steuern, welche Projekte die Blueprints in Ihrem Konto verwenden können, um Umgebungsprofile zu erstellen. Sie können dies tun, indem Sie der Konfiguration des Blueprints die Verwaltung von Projekten zuweisen.

Wichtig

Standardmäßig sind für die Umgebungs-Blueprints keine Verwaltungsprojekte angegeben, was bedeutet, dass jeder DataZone Amazon-Benutzer Profile für einen Umgebungs-Blueprint erstellen kann. Es wird daher dringend empfohlen, dass Sie immer Verwaltungsprojekte für Ihre Umgebungs-Blueprints angeben, um eine bessere Verwaltung zu gewährleisten.

Geben Sie die Verwaltung von Projekten auf aktivierten Blueprints an
  1. Navigieren Sie zur DataZone Amazon-Konsole unter https://console.aws.amazon.com/datazone und melden Sie sich mit Ihren Kontoanmeldeinformationen an.

  2. Wählen Sie Domains anzeigen und wählen Sie dann die Domain aus, zu der Sie die Verwaltungsprojekte für die ausgewählten Blueprints hinzufügen möchten.

  3. Wählen Sie die Registerkarte Blueprints und dann den Blueprint aus, mit dem Sie arbeiten möchten.

  4. Standardmäßig können alle Projekte innerhalb der Domain die DefaultDataLake oder oder die SageMaker Amazon-Blueprints im Konto verwenden DefaultDataWareshouse, um Umgebungsprofile zu erstellen. Sie können dies jedoch einschränken, indem Sie den Blueprints die Verwaltung von Projekten zuweisen. Um Verwaltungsprojekte hinzuzufügen, wählen Sie Verwaltungsprojekt auswählen aus, wählen Sie dann im Dropdownmenü die Projekte aus, die Sie als Verwaltungsprojekte hinzufügen möchten, und wählen Sie dann Verwaltungsprojekte auswählen aus.

Sobald Sie den DefaultDataWarehouse Blueprint in Ihrem aktiviert haben AWS Konto, Sie können der Blueprint-Konfiguration Parametersätze hinzufügen. Ein Parametersatz ist eine Gruppe von Schlüsseln und Werten, die Amazon benötigt, um eine Verbindung DataZone zu Ihrem Amazon Redshift Redshift-Cluster herzustellen, und wird zur Erstellung von Data Warehouse-Umgebungen verwendet. Zu diesen Parametern gehören der Name Ihres Amazon Redshift Redshift-Clusters, der Datenbank und AWS Geheimnis, das die Anmeldeinformationen für den Cluster enthält.

Hinzufügen von Parametersätzen zum DefaultDataWarehouse Blueprint
  1. Navigieren Sie zur DataZone Amazon-Konsole unter https://console.aws.amazon.com/datazone und melden Sie sich mit Ihren Kontoanmeldeinformationen an.

  2. Wählen Sie Domains anzeigen und wählen Sie dann die Domain aus, zu der Sie den Parametersatz hinzufügen möchten.

  3. Wählen Sie die Registerkarte Blueprints und dann den DefaultDataWareshouse Blueprint aus, um die Blueprint-Detailseite zu öffnen.

  4. Wählen Sie auf der Blueprint-Detailseite auf der Registerkarte Parametersätze die Option Parametersatz erstellen aus.

    • Geben Sie einen Namen für den Parametersatz ein.

    • Geben Sie optional eine Beschreibung für den Parametersatz ein.

    • Region auswählen

    • Wählen Sie entweder Amazon Redshift Cluster oder Amazon Redshift Serverless aus.

    • Wählen Sie AWS geheimARN, das die Anmeldeinformationen für den ausgewählten Amazon Redshift-Cluster oder die Amazon Redshift Serverless-Arbeitsgruppe enthält. Das Tool AWS secret muss mit dem AmazonDataZoneDomain : [Domain_ID] Tag gekennzeichnet sein, um innerhalb eines Parametersatzes verwendet werden zu können.

      • Wenn Sie noch kein vorhandenes haben AWS Secret, Sie können auch ein neues Secret erstellen, indem Sie Create New wählen AWS Geheim. Dadurch wird ein Dialogfeld geöffnet, in dem Sie den Namen des Geheimnisses, den Benutzernamen und das Passwort eingeben können. Sobald Sie „Neu erstellen“ ausgewählt haben AWS Geheim, Amazon DataZone kreiert ein neues Geheimnis in der AWS Secrets Manager dient und stellt sicher, dass das Geheimnis mit der Domäne gekennzeichnet ist, in der Sie versuchen, den Parametersatz zu erstellen.

    • Wenn Sie im obigen Schritt Amazon Redshift Redshift-Cluster ausgewählt haben, wählen Sie jetzt einen Cluster aus der Drop-down-Liste aus. Wenn Sie im obigen Schritt Amazon Redshift Redshift-Arbeitsgruppe ausgewählt haben, wählen Sie jetzt eine Arbeitsgruppe aus dem Drop-down-Menü aus.

    • Geben Sie den Namen der Datenbank innerhalb des ausgewählten Amazon Redshift-Clusters oder der Amazon Redshift Serverless-Arbeitsgruppe ein.

    • Wählen Sie Parametersatz erstellen aus.

Anmerkung

Sie können dem DefaultDataWarehouse Blueprint nur bis zu 10 Parametersätze hinzufügen.

Sobald Sie den SageMaker Amazon-Blueprint in Ihrem aktiviert haben AWS Konto, Sie können der Blueprint-Konfiguration Parametersätze hinzufügen. Ein Parametersatz ist eine Gruppe von Schlüsseln und Werten, die Amazon benötigt, um eine Verbindung DataZone zu Ihrem Amazon herzustellen, SageMaker und wird verwendet, um Sagemaker-Umgebungen zu erstellen.

Hinzufügen von Parametersätzen zum SageMaker Amazon-Blueprint
  1. Navigieren Sie zur DataZone Amazon-Konsole unter https://console.aws.amazon.com/datazone und melden Sie sich mit Ihren Kontoanmeldeinformationen an.

  2. Wählen Sie Domains anzeigen und wählen Sie dann die Domain aus, die den aktivierten Blueprint enthält, zu dem Sie den Parametersatz hinzufügen möchten.

  3. Wählen Sie die Registerkarte Blueprints und dann den SageMaker Amazon-Blueprint aus, um die Detailseite des Blueprints zu öffnen.

  4. Wählen Sie auf der Blueprint-Detailseite auf der Registerkarte Parametersätze die Option Parametersatz erstellen aus und geben Sie dann Folgendes an:

    • Geben Sie einen Namen für den Parametersatz ein.

    • Geben Sie optional eine Beschreibung für den Parametersatz ein.

    • Geben Sie den SageMaker Amazon-Domain-Authentifizierungstyp an. Sie können entweder IAM oder IAM Identity Center (SSO) wählen.

    • Geben Sie eine an AWS Region.

    • Geben Sie eine an AWS KMSSchlüssel für die Datenverschlüsselung. Sie können einen vorhandenen Schlüssel auswählen oder einen neuen Schlüssel erstellen.

    • Geben Sie unter Umgebungsparameter Folgendes an:

      • VPCID — die ID, die Sie für die VPC SageMaker Amazon-Umgebung verwenden. Sie können eine bestehende angeben oder eine neue erstellenVPC.

      • Subnetze — eines oder mehrere IDs für einen Bereich von IP-Adressen für bestimmte Ressourcen innerhalb IhresVPC.

      • Netzwerkzugriff — wählen Sie entweder „VPCNur“ oder „Nur öffentliches Internet“.

      • Sicherheitsgruppe — Die Sicherheitsgruppe, die bei der Konfiguration von VPC Subnetzen verwendet werden soll.

    • Wählen Sie unter Datenquellenparameter eine der folgenden Optionen aus:

      • AWS Nur Glue

      • AWS Glue + Amazon Redshift Serverless. Wenn Sie diese Option wählen, geben Sie Folgendes an:

        • Geben Sie die AWS GeheimnisARN, das die Anmeldeinformationen für den ausgewählten Amazon Redshift Redshift-Cluster enthält. Das Tool AWS secret muss mit dem AmazonDataZoneDomain : [Domain_ID] Tag gekennzeichnet werden, um innerhalb eines Parametersatzes verwendet werden zu können.

          Wenn Sie noch kein vorhandenes haben AWS Secret, Sie können auch ein neues Secret erstellen, indem Sie Create New wählen AWS Geheim. Dadurch wird ein Dialogfeld geöffnet, in dem Sie den Namen des Geheimnisses, den Benutzernamen und das Passwort eingeben können. Sobald Sie „Neu erstellen“ ausgewählt haben AWS Geheim, Amazon DataZone kreiert ein neues Geheimnis in der AWS Secrets Manager dient und stellt sicher, dass das Geheimnis mit der Domäne gekennzeichnet ist, in der Sie versuchen, den Parametersatz zu erstellen.

        • Geben Sie die Amazon Redshift Redshift-Arbeitsgruppe an, die Sie beim Erstellen von Umgebungen verwenden möchten.

        • Geben Sie den Namen der Datenbank (innerhalb der von Ihnen ausgewählten Arbeitsgruppe) an, die Sie beim Erstellen von Umgebungen verwenden möchten.

      • AWS Nur Glue + Amazon Redshift Cluster

        • Geben Sie das an AWS GeheimnisARN, das die Anmeldeinformationen für den ausgewählten Amazon Redshift Redshift-Cluster enthält. Das Tool AWS secret muss mit dem AmazonDataZoneDomain : [Domain_ID] Tag gekennzeichnet werden, um innerhalb eines Parametersatzes verwendet werden zu können.

          Wenn Sie noch kein vorhandenes haben AWS Secret, Sie können auch ein neues Secret erstellen, indem Sie Create New wählen AWS Geheim. Dadurch wird ein Dialogfeld geöffnet, in dem Sie den Namen des Geheimnisses, den Benutzernamen und das Passwort eingeben können. Sobald Sie „Neu erstellen“ ausgewählt haben AWS Geheim, Amazon DataZone kreiert ein neues Geheimnis in der AWS Secrets Manager dient und stellt sicher, dass das Geheimnis mit der Domäne gekennzeichnet ist, in der Sie versuchen, den Parametersatz zu erstellen.

        • Geben Sie den Amazon Redshift Redshift-Cluster an, den Sie beim Erstellen von Umgebungen verwenden möchten.

        • Geben Sie den Namen der Datenbank (innerhalb des von Ihnen ausgewählten Clusters) an, die Sie beim Erstellen von Umgebungen verwenden möchten.

  5. Wählen Sie Parametersatz erstellen aus.

Fügen Sie Amazon SageMaker als vertrauenswürdigen Service hinzu in der AWS Konto, dem die DataZone Amazon-Domain gehört

Wenn Sie den SageMaker Amazon-Blueprint aktiviert haben, müssen Sie ihn auch SageMaker als einen der vertrauenswürdigen Dienste innerhalb von Amazon DataZone hinzufügen. Führen Sie dazu das folgende Verfahren aus:

  1. Navigieren Sie zur DataZone Amazon-Konsole unter https://console.aws.amazon.com/datazone und melden Sie sich mit Ihren Kontoanmeldeinformationen an.

  2. Wählen Sie Domains anzeigen und wählen Sie dann die Domain aus, die den aktivierten Blueprint enthält. SageMaker

  3. Wählen Sie die Trusted Services, dann Amazon SageMaker und dann Enable aus.