Creación y ejecución de una fuente de DataZone datos de Amazon para Amazon Redshift

En Amazon DataZone, puede crear una fuente de datos de Amazon Redshift para importar metadatos técnicos de tablas y vistas de bases de datos desde el almacén de datos de Amazon Redshift. Para añadir una fuente de DataZone datos de Amazon para Amazon Redshift, el almacén de datos de origen debe existir ya en Amazon Redshift.

Cuando crea y ejecuta una fuente de datos de Amazon Redshift, añade activos del almacén de datos de Amazon Redshift de origen al inventario de su proyecto de DataZone Amazon. Puede ejecutar sus orígenes de datos de Amazon Redshift según un cronograma establecido o bajo demanda para crear o actualizar los metadatos técnicos de sus activos. Durante la ejecución de la fuente de datos, si lo desea, puede optar por publicar los activos de inventario de su proyecto en el DataZone catálogo de Amazon y, de este modo, hacer que todos los usuarios del dominio puedan descubrirlos. También puede publicar los activos del inventario después de editar sus metadatos empresariales. Los usuarios del dominio pueden buscar y descubrir sus activos publicados y solicitar suscripciones a estos activos.

Agregación de un origen de datos de Amazon Redshift:

Ve al portal de DataZone datos de Amazon URL e inicia sesión con el inicio de sesión único (SSO) o tus AWS credenciales. Si eres DataZone administrador de Amazon, puedes ir a la DataZone consola de Amazon en https://console.aws.amazon.com/datazone e iniciar sesión con el Cuenta de AWS lugar donde se creó el dominio y, a continuación, elegir Open data portal.
Elija Seleccionar proyecto en el panel de navegación superior y seleccione el proyecto al que desea añadir el origen de datos.
Vaya a la pestaña Datos del proyecto.
En el panel de navegación izquierdo, elija Origen de datos y, a continuación, elija Crear origen de datos.
Configure los siguientes campos:
- Nombre: el nombre del origen de datos.
- Descripción: descripción del origen de datos.
En Tipo de origen de datos, elija Amazon Redshift.
En Seleccione un entorno, especifique un entorno en el que publicar las tablas de Amazon Redshift.
Según el entorno que seleccione, Amazon DataZone aplicará automáticamente las credenciales de Amazon Redshift y otros parámetros directamente desde el entorno o le dará la opción de elegir los suyos propios.
- Si ha seleccionado un entorno que solo permite publicar desde el esquema de Amazon Redshift predeterminado del entorno, Amazon DataZone aplicará automáticamente las credenciales de Amazon Redshift y otros parámetros, como el nombre del clúster o grupo de trabajo de Amazon Redshift, el secreto AWS , el nombre de la base de datos y el nombre del esquema. No puede editar estos parámetros que se rellenan automáticamente.
- Si selecciona un entorno que no permite publicar ningún dato, no podrá continuar con la creación del origen de datos.
- Si selecciona un entorno que permita publicar datos desde cualquier esquema, verá la opción de usar las credenciales y otros parámetros de Amazon Redshift del entorno, o la de introducir sus propias credenciales/parámetros.
Si decide usar sus propias credenciales para crear el origen de datos, proporcione los siguientes detalles:
- En Proporcionar credenciales de Amazon Redshift, elija si desea utilizar un clúster de Amazon Redshift aprovisionado o un espacio de trabajo Amazon Redshift sin servidor como el origen de datos.
- Según lo que haya seleccionado en el paso anterior, elija su clúster o espacio de trabajo de Amazon Redshift en el menú desplegable y, a continuación, elija el secreto en AWS Secrets Manager que desee usar para la autenticación. Puede elegir un secreto que ya exista o crear uno nuevo.
- Para que el secreto existente aparezca en el menú desplegable, asegúrate de que tu secreto en AWS Secrets Manager incluya las siguientes etiquetas (clave/valor):
  - AmazonDataZoneProject: <projectID>
  - AmazonDataZoneDomain: <domainID>
  Si decide crear un secreto nuevo, el secreto se etiqueta automáticamente con las etiquetas a las que se ha hecho referencia anteriormente y no es necesario realizar ningún paso adicional. Para obtener más información, consulte Almacenar las credenciales de la base de datos en AWS Secrets Manager.
  
  Los usuarios de Amazon Redshift que utilicen el AWS secreto proporcionado para crear la fuente de datos deben tener SELECT permisos en las tablas que se van a publicar. Si quieres que Amazon DataZone también gestione las suscripciones (acceso) en tu nombre, los usuarios de la base de datos que figuran en el AWS secreto también deben tener los siguientes permisos:
  - CREATE DATASHARE
  - ALTER DATASHARE
  - DROP DATASHARE
En Selección de datos, proporcione una base de datos y un esquema de Amazon Redshift, e introduzca el criterio de selección de la tabla o vista. Por ejemplo, si selecciona Incluir e introduce *corporate, el activo incluirá todas las tablas de origen que terminen con la palabra corporate.

Puede añadir varias reglas de inclusión para las tablas dentro de una sola base de datos. También puede agregar varias bases de datos mediante el botón Agregar otra base de datos.
Elija Next (Siguiente).
En la Configuración de publicación, elija si los activos se pueden detectar inmediatamente en el catálogo de datos. Si solo los agrega al inventario, puede elegir las condiciones de suscripción más adelante y publicarlos en el catálogo de datos empresariales.
Para la Generación automatizada de nombres comerciales, elija si desea generar automáticamente los metadatos de los activos a medida que se publican y actualizan desde el origen.
(Opcional) En el caso de los formularios de metadatos, añade formularios para definir los metadatos que se recopilan y guardan cuando los activos se importan a Amazon DataZone. Para obtener más información, consulte Crear un formulario de metadatos en Amazon DataZone.
En Preferencia de ejecución, elija cuándo ejecutar el origen de datos.
- Ejecutar según una programación: especifique las fechas y la hora para ejecutar el origen de datos.
- Ejecutar bajo demanda: puede iniciar manualmente la ejecución del origen de datos.
Elija Next (Siguiente).
Revise su configuración del origen de datos y seleccione Crear.

nota

Cuando se crea una fuente de datos de Amazon Redshift, Amazon DataZone concede acceso de «solo lectura» al entorno utilizado para crear la fuente de datos para acceder a todas las tablas de los esquemas de Amazon Redshift utilizados en la fuente de datos. Puede supervisar el estado de estas concesiones en los orígenes de datos en la página de detalles de su entorno.

Si utiliza un clúster de Amazon Redshift o un grupo de trabajo sin servidor diferente al que se utilizó para crear el entorno, debe asegurarse de añadir la siguiente AWS etiqueta al clúster o grupo de trabajo. Esto es necesario para que los usuarios del entorno puedan ver la base de datos concedida en el editor de consultas V2 de Amazon Redshift: DataZoneDiscoverable_${domainId}: true

En el caso de los entornos creados antes de la versión actual de Amazon DataZone, los miembros del proyecto no podrán ver las tablas concedidas en Amazon Redshift.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Cree y ejecute una fuente de datos para AWS Glue Data Catalog

Edición de un origen de datos