Casos de uso compartido de datos Uso compartido de datos en niveles diferentes Administración de la coherencia del uso compartido de datos

Uso compartido de datos en Amazon Redshift

Con Amazon Redshift, puede compartir datos de forma segura entre clústeres de Amazon Redshift o con otros servicios de AWS. El uso compartido de datos le permite compartir datos en tiempo real, sin tener que crear una copia ni moverlos. Los administradores de bases de datos y los ingenieros de datos pueden utilizar el intercambio de datos para proporcionar un acceso seguro y de solo lectura a los datos con fines de análisis y, al mismo tiempo, mantener el control sobre los datos. Los analistas de datos, los profesionales de inteligencia empresarial y los científicos de datos pueden aprovechar los datos compartidos para obtener información sin duplicarlos ni moverlos. Los casos de uso comunes incluyen compartir datos con socios, permitir el análisis multifuncional y facilitar la democratización de los datos dentro de una organización. En las siguientes secciones se describen los detalles de la configuración y la administración del uso compartido de datos en Amazon Redshift.

Con el uso compartido de datos de Amazon Redshift, puede compartir de forma segura el acceso a datos en directo en clústeres de Amazon Redshift, grupos de trabajo, Cuentas de AWS y Regiones de AWS sin mover ni copiar los datos manualmente. Desde que los datos son en directo, todos los usuarios pueden ver la información más actualizada y coherente en Amazon Redshift en cuanto se actualiza.

Puede compartir datos entre clústeres aprovisionados, grupos de trabajo sin servidor, zonas de disponibilidad, Cuentas de AWS y Regiones de AWS. Puede compartir entre tipos de clústeres, así como entre clústeres aprovisionados y sin servidor.

Puede compartir objetos de base de datos para lecturas y escrituras entre distintos clústeres de Amazon Redshift o grupos de trabajo de Amazon Redshift sin servidor dentro de la misma Cuenta de AWS o de una Cuenta de AWS a otra. También puede leer y escribir datos entre regiones. Puede conceder permisos como SELECT, INSERT y UPDATE para distintas tablas y USAGE y CREATE para distintos esquemas. Los datos están activos y disponibles para todos los almacenes en cuanto se confirma una transacción de escritura.

Casos de uso compartido de datos en Amazon Redshift

El uso compartido de datos de Amazon Redshift es especialmente útil para estos casos de uso:

Compatibilidad con diferentes tipos de cargas de trabajo críticas para la empresa: utilice un clúster central de extracción, transformación y carga (ETL) que comparta los datos con varios clústeres de análisis o inteligencia empresarial (BI). Este enfoque proporciona aislamiento de la carga de trabajo de lectura y reintegro para las cargas de trabajo individuales. Puede ajustar el tamaño y la escala de la informática de la carga de trabajo individual de acuerdo con los requisitos de precio y rendimiento específicos de la carga de trabajo.
Habilitación de la colaboración entre grupos: habilite la colaboración continua entre los equipos y los grupos empresariales para lograr analítica, ciencia de datos y análisis de impacto entre productos más amplios.
Entrega de datos como servicio: comparta datos como un servicio con toda la organización.
Uso compartido de datos entre entornos: comparta datos entre entornos de desarrollo, prueba y producción. Puede mejorar la agilidad del equipo compartiendo datos con diferentes niveles de detalle.
Acceso con licencia a los datos de Amazon Redshift: enumere los conjuntos de datos de Amazon Redshift en el catálogo de AWS Data Exchange que los clientes pueden encontrar y consultar, además de suscribirse a ellos, en cuestión de minutos.

Casos de uso compartido de datos para accesos de escritura

El uso compartido de datos para escrituras tiene varios casos de uso importantes:

Actualizar los datos de origen empresarial en el productor: puede compartir los datos como un servicio en toda su organización, pero los consumidores también pueden realizar acciones en los datos de origen. Por ejemplo, pueden comunicar valores actualizados o confirmar la recepción de los datos. Estos son solo un par de posibles casos de uso empresariales.
Insertar registros adicionales en el productor: los consumidores pueden agregar registros a los datos de origen originales. Si es necesario, se pueden marcar como procedentes del consumidor.

Para obtener información específica sobre cómo realizar operaciones de escritura en un recurso compartido de datos, consulte Uso compartido del acceso de escritura a los datos.

Uso compartido de datos en niveles diferentes en Amazon Redshift

Con Amazon Redshift, puede compartir datos en niveles diferentes. Estos niveles incluyen las bases de datos, los esquemas, las tablas, las vistas (incluidas las vistas normales, de enlace de tiempo de ejecución y materializadas) y las funciones definidas por el usuario (UDF) de SQL. Puede crear varios datashares para determinada base de datos. Un datashare puede contener objetos de varios esquemas de la base de datos en la cual se crea el uso compartido.

Contar con esta flexibilidad para compartir datos le permite obtener control de acceso pormenorizado. Puede personalizar este control para diferentes usuarios y empresas que necesiten acceder a los datos de Amazon Redshift.

Administración de la coherencia del uso compartido de datos en Amazon Redshift

Amazon Redshift proporciona consistencia transaccional en todos los clústeres productores y consumidores, y comparte vistas actualizadas y consistentes de los datos con todos los consumidores.

Los datos se pueden actualizar de forma continua en el clúster productor. Todas las consultas de un clúster consumidor dentro de una transacción leen el mismo estado de los datos compartidos. Amazon Redshift no tiene en cuenta los datos modificados por otra transacción del clúster productor que se haya confirmado después de que se inicia la transacción en el clúster consumidor. Después de confirmar el cambio en los datos en el clúster productor, las transacciones nuevas que se produzcan en el clúster consumidor podrán consultar de inmediato los datos actualizados.

La consistencia sólida elimina el riesgo de que se generen informes empresariales poco confiables que puedan contener resultados no válidos mientras se comparten los datos. Este factor es especialmente importante para el análisis financiero o para los casos en que los resultados puedan utilizarse para preparar conjuntos de datos que se utilicen para formar modelos de machine learning.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Consulta de catálogos federados de Glue IRC

Consideraciones