Uso compartido de datos en Amazon Redshift
Con Amazon Redshift, puede compartir datos de forma segura entre clústeres de Amazon Redshift o con otros servicios de AWS. El uso compartido de datos le permite compartir datos en tiempo real, sin tener que crear una copia ni moverlos. Los administradores de bases de datos y los ingenieros de datos pueden utilizar el intercambio de datos para proporcionar un acceso seguro y de solo lectura a los datos con fines de análisis y, al mismo tiempo, mantener el control sobre los datos. Los analistas de datos, los profesionales de inteligencia empresarial y los científicos de datos pueden aprovechar los datos compartidos para obtener información sin duplicarlos ni moverlos. Los casos de uso comunes incluyen compartir datos con socios, permitir el análisis multifuncional y facilitar la democratización de los datos dentro de una organización. En las siguientes secciones se describen los detalles de la configuración y la administración del uso compartido de datos en Amazon Redshift.
Con el uso compartido de datos de Amazon Redshift, puede compartir de forma segura el acceso a datos en directo en clústeres de Amazon Redshift, grupos de trabajo, Cuentas de AWS y Regiones de AWS sin mover ni copiar los datos manualmente. Desde que los datos son en directo, todos los usuarios pueden ver la información más actualizada y coherente en Amazon Redshift en cuanto se actualiza.
Puede compartir datos entre clústeres aprovisionados, grupos de trabajo sin servidor, zonas de disponibilidad, Cuentas de AWS y Regiones de AWS. Puede compartir entre tipos de clústeres, así como entre clústeres aprovisionados y sin servidor.
Puede compartir objetos de base de datos para lecturas y escrituras entre distintos clústeres de Amazon Redshift o grupos de trabajo de Amazon Redshift sin servidor dentro de la misma Cuenta de AWS o de una Cuenta de AWS a otra. También puede escribir datos entre regiones. Puede conceder permisos como SELECT, INSERT y UPDATE para distintas tablas y USAGE y CREATE para distintos esquemas. Los datos están activos y disponibles para todos los almacenes en cuanto se confirma una transacción de escritura.
Para obtener más información sobre la configuración de las capacidades para compartir datos en la pista PREVIEW_2023, consulte Uso compartido del acceso de escritura a los datos (versión preliminar).
nota
La escritura en varios almacenamientos mediante el uso compartido de datos no está disponible actualmente en los clústeres ra3.xlplus. Para utilizar esta característica, cree clústeres ra3.4xl, clústeres ra3.16xl o grupos de trabajo de Amazon Redshift sin servidor.
Consideraciones al compartir datos en Amazon Redshift
Estos son los aspectos que se deben tener en cuenta para trabajar con el uso compartido de datos de Amazon Redshift. Para obtener información sobre las limitaciones del uso compatido de datos, consulte Limitaciones del uso compartido de datos.
-
El uso compartido de datos entre regiones conlleva cargos adicionales por transferencia de datos entre regiones. Estos cargos por transferencia de datos no se aplican dentro de la misma región, solo entre regiones. Para obtener más información, consulte Administración del control de costos para el uso compartido de datos entre regiones.
-
Al leer datos de un recurso compartido de datos, permanece conectado a la base de datos del clúster local. Para obtener más información sobre cómo establecer a y leer de una base de datos creada a partir de un recurso compartido de datos, consulte Consulta de objetos de recursos compartidos de datos.
-
Al consumidor se le cobran todas las tarifas informáticas y de transferencia de datos entre regiones necesarias para consultar los datos del productor. Al productor se le cobra por el almacenamiento subyacente de los datos en el clúster aprovisionado o en el espacio de nombres sin servidor.
-
El rendimiento de las consultas sobre datos compartidos depende de la capacidad informática de los clústeres consumidores.
Administración del cifrado de clústeres para el uso compartido de datos
Para compartir datos entre Cuenta de AWS, deben estar cifrados tanto el clúster productor como el consumidor.
En Amazon Redshift, puede activar el cifrado de la base de datos de los clústeres para proteger los datos en reposo. Cuando activa el cifrado para un clúster, se cifran los bloques de datos y metadatos del sistema para el clúster y sus instantáneas. Puede activar el cifrado al lanzar el clúster o puede modificar un clúster sin cifrar para que utilice el cifrado AWS Key Management Service (AWS KMS). Para obtener información acerca del cifrado de las bases de datos de Amazon Redshift, consulte Cifrado de bases de datos de Amazon Redshift en la Guía de administración de Amazon Redshift.
Para proteger los datos en tránsito, todos ellos se cifran en tránsito a través del esquema de cifrado del clúster productor. El clúster consumidor adopta este esquema de cifrado cuando se cargan los datos. Luego, el clúster consumidor funciona como un clúster cifrado normal. Las comunicaciones entre el productor y el consumidor también se cifran con un esquema de clave compartida. Para obtener más información sobre el cifrado en tránsito, consulte Cifrado en tránsito.
Limitaciones del uso compartido de datos
A continuación, se describen las limitaciones que se presentan a la hora de trabajar con datashares en Amazon Redshift:
El uso compartido de datos se admite para todos los tipos de clúster RA3 aprovisionados y Amazon Redshift sin servidor. No se admite para otros tipos de clúster.
Si los clústeres del productor y del consumidor y los espacios de nombres sin servidor están en la misma cuenta, deben tener el mismo tipo de cifrado (ambos sin cifrar o ambos cifrados). En todos los demás casos, como los recursos compartidos de datos administrados por Lake Formation, el consumidor y el productor deben estar cifrados. Esto se hace por motivos de seguridad. Sin embargo, no es necesario que compartan la misma clave de cifrado.
Solo puede compartir UDF de SQL a través de recursos compartidos de datos. No se admiten los UDF de Python y Lambda.
Si la base de datos productora tiene una intercalación específica, utilice la misma configuración de intercalación para la base de datos consumidora.
Amazon Redshift no admite la adición de esquemas externos, tablas o vistas de enlace tardío en tablas externas a los recursos compartidos de datos.
Amazon Redshift no admite funciones definidas por el usuario de SQL anidadas en clústeres productores.
Amazon Redshift no admite el uso compartido de tablas con claves de ordenación intercaladas ni vistas que referencien tablas con claves de ordenación intercaladas.
Los consumidores no pueden añadir objetos de recursos compartidos de datos a otro recurso compartido de datos. Además, los consumidores no pueden añadir vistas que hagan referencia a objetos de recursos compartidos de datos a otro recurso compartido de datos.
Amazon Redshift no admite el acceso a un objeto de recurso compartido de datos en el que se haya producido un DDL simultáneo entre la preparación y la ejecución del acceso.
Amazon Redshift no admite el uso compartido de procedimientos almacenados a través de recursos compartidos de datos.
Amazon Redshift no permite compartir tablas del sistema ni vistas del sistema de metadatos.
Regiones donde está disponible el uso compartido de datos
En la siguiente tabla, se muestra la disponibilidad de las capacidades del uso compartido de datos.
Región | Uso compartido de datos en la misma región | Uso compartido de datos entre regiones | Recursos compartidos de datos gobernados por AWS Lake Formation |
---|---|---|---|
Este de EE. UU. (Norte de Virginia) (us-east-1) | Sí | Sí | Sí |
Este de EE. UU. (Ohio) (us-east-2) | Sí | Sí | Sí |
EE. UU. Oeste (Norte de California) (us-west-1) | Sí | Sí | Sí |
Oeste de EE. UU. (Oregón) (us-west-2) | Sí | Sí | Sí |
Asia-Pacífico (Hong Kong) (ap-east-1) | Sí | No | No |
Asia Pacífico (Bombay) (ap-south-1) | Sí | Sí | Sí |
Asia Pacífico (Hyderabad) (ap-south-2) | Sí | No | No |
Asia-Pacífico (Tokio) (ap-northeast-1) | Sí | Sí | Sí |
Asia-Pacífico (Singapur) (ap-southeast-1) | Sí | Sí | Sí |
Asia-Pacífico (Sídney) (ap-southeast-2) | Sí | Sí | Sí |
Asia-Pacífico (Yakarta); (ap-southeast-3) | Sí | No | No |
Asia Pacífico (Melbourne) (ap-southeast-4) | Sí | No | No |
Asia-Pacífico (Seúl) (ap-northeast-2) | Sí | Sí | Sí |
Asia Pacific (Osaka) (ap-northeast-3) | Sí | No | No |
China (Pekín) (cn-north-1) | Sí | No | No |
África (Ciudad del Cabo) (af-south-1) | Sí | Sí | No |
Oeste de Canadá (Calgary) (ca-west-1) | Sí | No | No |
Canadá (centro) (ca-central-1) | Sí | Sí | Sí |
Europa (Fráncfort) (eu-central-1) | Sí | Sí | Sí |
Europa (Zúrich) (eu-central-2) | Sí | No | No |
Europa (Irlanda) (eu-west-1) | Sí | Sí | Sí |
Europa (Londres) (eu-west-2) | Sí | Sí | Sí |
Europa (París) (eu-west-3) | Sí | Sí | Sí |
UE (Milán) (eu-south-1) | Sí | No | No |
Europa (España) (eu-south-2) | Sí | No | No |
Europa (Estocolmo) (eu-north-1) | Sí | Sí | Sí |
Medio Oriente (EAU) (me-central-1) | Sí | No | No |
Medio Oriente (Baréin) (me-south-1) | Sí | No | No |
Israel (Tel Aviv) (il-central-1) | Sí | No | No |
América del Sur (São Paulo) (sa-east-1) | Sí | Sí | Sí |
AWS GovCloud (EE. UU. Este) (us-gov-east-1) | Sí | No | Sí |
AWS GovCloud (EE. UU. Oeste) (us-gov-west-1) | Sí | No | Sí |
Disponibilidad regional de la escritura en varios almacenes para el uso compartido de datos
En la pista PREVIEW_2023, el uso compartido de datos tiene la capacidad de realizar operaciones de escritura y funcionalidades de uso compartido de datos más detalladas. Para obtener más información sobre cómo configurarlas, consulte Uso compartido del acceso de escritura a los datos (versión preliminar). Para obtener información sobre las regiones en las que están disponibles las capacidades de la versión preliminar, consulte Regiones donde está disponible el uso compartido de datos (versión preliminar).