Planos DataZone integrados de Amazon - Amazon DataZone

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Planos DataZone integrados de Amazon

Un plano con el que se crea un entorno define qué herramientas y servicios pueden utilizar los miembros del proyecto al que pertenece el entorno cuando trabajan con los activos del DataZone catálogo de Amazon. En la versión actual de Amazon DataZone, hay los siguientes planos integrados:

  • Plano de lago de datos

  • Plano de almacén de datos

  • SageMaker Plano de Amazon

Puede seguir los pasos de los siguientes procedimientos para habilitar los blueprints predeterminados en Amazon DataZone:

Habilite los blueprints integrados en el AWS cuenta propietaria del DataZone dominio de Amazon

Un plano con el que se crea un entorno define qué herramientas y servicios pueden utilizar los miembros del proyecto al que pertenece el entorno cuando trabajan con los activos del DataZone catálogo de Amazon.

En la versión actual de Amazon DataZone, hay varios planos integrados: el plano del lago de datos, el plano del almacén de datos y el plano de Amazon. SageMaker

  • El plano del lago de datos contiene la definición para lanzar y configurar un conjunto de servicios (AWS Glue, AWS Lake Formation, Amazon Athena) para publicar y utilizar los activos de los lagos de datos en el catálogo de Amazon DataZone .

  • El plano de almacén de datos contiene la definición para lanzar y configurar un conjunto de servicios (Amazon Redshift) para publicar y utilizar los activos de Amazon Redshift en el catálogo de Amazon. DataZone

  • El SageMaker blueprint de Amazon contiene la definición para lanzar y configurar un conjunto de servicios (Amazon SageMaker Studio) para publicar y utilizar SageMaker los activos de Amazon en el DataZone catálogo de Amazon.

Para obtener más información, consulte DataZone Terminología y conceptos de Amazon.

Al crear un DataZone dominio de Amazon, tiene la opción de elegir la configuración rápida, que habilita automáticamente el lago de datos predeterminado y los planos integrados del almacén de datos predeterminado como parte del proceso de creación del dominio. La configuración rápida también crea perfiles de entorno predeterminados y entornos predeterminados para usted mediante estos esquemas integrados.

Si no eliges la configuración rápida como parte de la creación de tu DataZone dominio de Amazon, puedes usar el siguiente procedimiento para habilitar los blueprints integrados disponibles en el AWS cuenta que alberga este DataZone dominio de Amazon. Debe habilitar estos esquemas integrados antes de poder usarlos para crear perfiles de entorno y entornos en este dominio.

Para habilitar los blueprints integrados en un DataZone dominio de Amazon a través de la consola DataZone de administración de Amazon, debes asumir un IAM rol en la cuenta con permisos administrativos. Configurar los IAM permisos necesarios para usar la consola de DataZone administración de Amazonpara obtener los permisos mínimos.

Habilita los blueprints integrados en un dominio de Amazon DataZone
  1. Ve a la DataZone consola de Amazon en https://console.aws.amazon.com/datazone e inicia sesión con las credenciales de tu cuenta.

  2. Selecciona Ver dominios y elige el dominio en el que quieres habilitar uno o más blueprints integrados.

  3. En la página de detalles del dominio, vaya a la pestaña Blueprints.

  4. En la lista de planos, selecciona el plano DefaultDataLakeo DefaultDataWarehouseel SageMaker plano de Amazon.

  5. En la página de detalles del plano elegido, selecciona Activar en esta cuenta.

  6. En la página de permisos y recursos, especifique lo siguiente:

    • Si estás habilitando el DefaultDataLakeblueprint, para la función Glue Manage Access, especifica una función de servicio nueva o existente que DataZone autorice a Amazon a ingerir y gestionar el acceso a las tablas en AWS Glue y AWS Lake Formation.

    • Si está habilitando el DefaultDataWarehouseblueprint, para la función Administrar acceso de Redshift, especifique una función de servicio nueva o existente que autorice a DataZone Amazon a ingerir y administrar el acceso a datos compartidos, tablas y vistas en Amazon Redshift.

    • Si está habilitando el SageMaker blueprint de Amazon, en la función SageMaker Administrar acceso, especifique una función de servicio nueva o existente que conceda DataZone permisos a Amazon para publicar SageMaker datos de Amazon en el catálogo. También otorga DataZone permisos a Amazon para conceder o revocar el acceso a los activos SageMaker publicados por Amazon en el catálogo.

      importante

      Al activar el SageMaker blueprint de Amazon, Amazon DataZone comprueba si las siguientes IAM funciones para Amazon DataZone existen en la cuenta corriente y la región. Si estos roles no existen, Amazon los crea DataZone automáticamente.

      • AmazonDataZoneGlueAccess- <region>-< > domainId

      • AmazonDataZoneRedshiftAccess- <region>-< > domainId

    • Para la función de aprovisionamiento, especifique una función de servicio nueva o existente que DataZone autorice a Amazon a crear y configurar los recursos del entorno mediante AWS CloudFormation en la cuenta y la región del entorno.

    • Si está habilitando el SageMaker blueprint de Amazon, para el bucket de Amazon S3 para la fuente de datos SageMaker -Glue, especifique un bucket de Amazon S3 que vayan a utilizar todos los SageMaker entornos del AWS account. El prefijo de bucket que especifique debe ser uno de los siguientes:

      • amazon-datazone*

      • datazone-sagemaker*

      • sagemaker-datazone*

      • DataZone-Sagemaker*

      • Sagemaker- * DataZone

      • DataZone-SageMaker*

      • SageMaker-DataZone*

  7. Seleccione Activar blueprint.

Una vez que haya activado los planos elegidos, podrá controlar qué proyectos pueden utilizarlos en su cuenta para crear perfiles de entorno. Para ello, puede asignar la gestión de proyectos a la configuración del blueprint.

importante

De forma predeterminada, no se especifica ningún proyecto de gestión para los blueprints del entorno, lo que significa que cualquier DataZone usuario de Amazon puede crear perfiles para un blueprint del entorno. Por lo tanto, se recomienda encarecidamente que siempre especifique la gestión de proyectos para los planos de su entorno a fin de garantizar una gobernanza más sólida.

Especifique la gestión de proyectos en planos habilitados
  1. Ve a la DataZone consola de Amazon en https://console.aws.amazon.com/datazone e inicia sesión con las credenciales de tu cuenta.

  2. Selecciona Ver dominios y, a continuación, elige el dominio en el que quieres añadir los proyectos de gestión para los planos elegidos.

  3. Selecciona la pestaña Planos y, a continuación, elige el plano con el que quieres trabajar.

  4. De forma predeterminada, todos los proyectos del dominio pueden usar los DefaultDataLake SageMaker blueprints o o Amazon de la cuenta para crear perfiles de entorno. DefaultDataWareshouse Sin embargo, puede restringirlo asignando la gestión de proyectos a los blueprints. Para añadir proyectos de gestión, elija Seleccionar proyecto de gestión y, a continuación, elija los proyectos que desee añadir como proyectos de gestión en el menú desplegable y, a continuación, seleccione Seleccionar proyectos de gestión.

Una vez que hayas activado el DefaultDataWarehouse plano en tu AWS cuenta, puede añadir conjuntos de parámetros a la configuración del blueprint. Un conjunto de parámetros es un grupo de claves y valores necesarios para que Amazon DataZone establezca una conexión con el clúster de Amazon Redshift y que se utiliza para crear entornos de almacenamiento de datos. Estos parámetros incluyen el nombre del clúster de Amazon Redshift, la base de datos y el AWS secreto que contiene las credenciales del clúster.

Añadir conjuntos de parámetros al DefaultDataWarehouse plano
  1. Ve a la DataZone consola de Amazon en https://console.aws.amazon.com/datazone e inicia sesión con las credenciales de tu cuenta.

  2. Selecciona Ver dominios y, a continuación, elige el dominio en el que quieres añadir el conjunto de parámetros.

  3. Seleccione la pestaña Planos y, a continuación, elija el DefaultDataWareshouse esquema para abrir la página de detalles del esquema.

  4. En la pestaña Conjuntos de parámetros de la página de detalles del plano, elija Crear conjunto de parámetros.

    • Proporcione un nombre para el conjunto de parámetros.

    • Si lo desea, proporcione una descripción del conjunto de parámetros.

    • Seleccione una región

    • Seleccione un clúster de Amazon Redshift o Amazon Redshift Serverless.

    • Seleccione el AWS secreto ARN que contiene las credenciales del clúster de Amazon Redshift seleccionado o del grupo de trabajo Amazon Redshift Serverless. La AWS El secreto debe estar etiquetado con la AmazonDataZoneDomain : [Domain_ID] etiqueta para que pueda usarse dentro de un conjunto de parámetros.

      • Si no tiene una existente AWS secreto, también puedes crear un secreto nuevo seleccionando Crear nuevo AWS Secreto. Se abre un cuadro de diálogo en el que puede proporcionar el nombre del secreto, el nombre de usuario y la contraseña. Una vez que haya elegido Crear nuevo AWS Secreto, Amazon DataZone crea un nuevo secreto en el AWS El servicio Secrets Manager garantiza que el secreto esté etiquetado con el dominio en el que se intenta crear el conjunto de parámetros.

    • Si eligió un clúster de Amazon Redshift en el paso anterior, ahora elija un clúster del menú desplegable. Si eligió el grupo de trabajo Amazon Redshift en el paso anterior, ahora elija un grupo de trabajo del menú desplegable.

    • Introduzca el nombre de la base de datos del clúster de Amazon Redshift o del grupo de trabajo Amazon Redshift Serverless seleccionado.

    • Elija Crear conjunto de parámetros.

nota

Solo puede añadir un máximo de 10 conjuntos de parámetros al DefaultDataWarehouse esquema.

Una vez que habilites el SageMaker blueprint de Amazon en tu AWS cuenta, puede añadir conjuntos de parámetros a la configuración del blueprint. Un conjunto de parámetros es un grupo de claves y valores necesarios para DataZone que Amazon establezca una conexión con tu Amazon SageMaker y que se utiliza para crear entornos de SageMaker.

Añadir conjuntos de parámetros al SageMaker blueprint de Amazon
  1. Ve a la DataZone consola de Amazon en https://console.aws.amazon.com/datazone e inicia sesión con las credenciales de tu cuenta.

  2. Selecciona Ver dominios y, a continuación, elige el dominio que contiene el blueprint activado al que quieres añadir el conjunto de parámetros.

  3. Selecciona la pestaña Blueprints y, a continuación, elige el SageMaker blueprint de Amazon para abrir la página de detalles del blueprint.

  4. En la pestaña Conjuntos de parámetros de la página de detalles del blueprint, selecciona Crear conjunto de parámetros y, a continuación, especifica lo siguiente:

    • Proporcione un nombre para el conjunto de parámetros.

    • Si lo desea, proporcione una descripción del conjunto de parámetros.

    • Especifica el tipo de autenticación SageMaker del dominio de Amazon. Puede elegir entre IAM IAM Identity Center (SSO).

    • Especifique un AWS region.

    • Especifique un AWS KMSclave para el cifrado de datos. Puede elegir una clave existente o crear una nueva clave.

    • En Parámetros del entorno, especifique lo siguiente:

      • VPCID: el ID que utilizas para el SageMaker entorno VPC de Amazon. Puede especificar uno existente o crear uno nuevoVPC.

      • Subredes: una o más IDs para un rango de direcciones IP para recursos específicos dentro de su VPC red.

      • Acceso a la red: elija VPCsolo o Solo Internet público.

      • Grupo de seguridad: el grupo de seguridad que se utilizará al configurar VPC las subredes.

    • En Parámetros de la fuente de datos, elija una de las siguientes opciones:

      • AWS Glue únicamente

      • AWS Glue + Amazon Redshift Serverless. Si elige esta opción, especifique lo siguiente:

        • Especifique el AWS secreto ARN que contiene las credenciales del clúster de Amazon Redshift seleccionado. La AWS El secreto debe estar etiquetado con la AmazonDataZoneDomain : [Domain_ID] etiqueta para que pueda usarse dentro de un conjunto de parámetros.

          Si no tiene una existente AWS secreto, también puedes crear un secreto nuevo seleccionando Crear nuevo AWS Secreto. Se abre un cuadro de diálogo en el que puede proporcionar el nombre del secreto, el nombre de usuario y la contraseña. Una vez que haya elegido Crear nuevo AWS Secreto, Amazon DataZone crea un nuevo secreto en el AWS El servicio Secrets Manager garantiza que el secreto esté etiquetado con el dominio en el que se intenta crear el conjunto de parámetros.

        • Especifique el grupo de trabajo de Amazon Redshift que desee utilizar al crear entornos.

        • Especifique el nombre de la base de datos (dentro del grupo de trabajo que ha elegido) que desea usar al crear entornos.

      • AWS Solo Glue + Amazon Redshift Cluster

        • Especifique el AWS secreto ARN que contiene las credenciales del clúster de Amazon Redshift seleccionado. La AWS El secreto debe estar etiquetado con la AmazonDataZoneDomain : [Domain_ID] etiqueta para que pueda usarse dentro de un conjunto de parámetros.

          Si no tiene una existente AWS secreto, también puedes crear un secreto nuevo seleccionando Crear nuevo AWS Secreto. Se abre un cuadro de diálogo en el que puede proporcionar el nombre del secreto, el nombre de usuario y la contraseña. Una vez que haya elegido Crear nuevo AWS Secreto, Amazon DataZone crea un nuevo secreto en el AWS El servicio Secrets Manager garantiza que el secreto esté etiquetado con el dominio en el que se intenta crear el conjunto de parámetros.

        • Especifique el clúster de Amazon Redshift que desee utilizar al crear entornos.

        • Especifique el nombre de la base de datos (dentro del clúster que ha elegido) que desea usar al crear entornos.

  5. Elija Crear conjunto de parámetros.

Añade Amazon SageMaker como servicio de confianza en la AWS cuenta propietaria del DataZone dominio de Amazon

Si has activado el SageMaker blueprint de Amazon, también debes añadirlo SageMaker como uno de los servicios de confianza de Amazon DataZone. Para ello, complete el siguiente procedimiento:

  1. Ve a la DataZone consola de Amazon en https://console.aws.amazon.com/datazone e inicia sesión con las credenciales de tu cuenta.

  2. Selecciona Ver dominios y, a continuación, elige el dominio que contiene el blueprint activado. SageMaker

  3. Elige los servicios de confianza, Amazon y SageMaker, por último, Activar.