Importación de datos de DynamoDB desde Amazon S3: cómo funciona - Amazon DynamoDB

Importación de datos de DynamoDB desde Amazon S3: cómo funciona

Para importar datos a DynamoDB, estos deben estar en un bucket de Amazon S3 en formato CSV, JSON de DynamoDB o Amazon Ion. Los datos pueden comprimirse en formato ZSTD o GZIP, o pueden importarse directamente sin comprimir. Los datos de origen pueden ser un único objeto de Amazon S3 o varios objetos de Amazon S3 que utilicen el mismo prefijo.

Sus datos se importarán a una nueva tabla de DynamoDB, que se creará cuando inicie la solicitud de importación. Puede crear esta tabla con índices secundarios y, a continuación, consultar y actualizar los datos en todos los índices primarios y secundarios en cuanto se complete la importación. También puede agregar una réplica de la tabla global una vez finalizada la importación.

nota

Durante el proceso de importación de Amazon S3, DynamoDB crea una nueva tabla de destino a la que se importará. Esta característica no admite actualmente la importación en tablas existentes.

La importación desde Amazon S3 no consume capacidad de escritura en la nueva tabla, por lo que no es necesario aprovisionar ninguna capacidad adicional para importar datos a DynamoDB. El precio de la importación de datos se basa en el tamaño sin comprimir de los datos de origen en Amazon S3, que se procesan como resultado de la importación. Los elementos que se procesan pero que no se cargan en la tabla debido al formato u otras incoherencias en los datos de origen también se facturan como parte del proceso de importación. Consulte Precios de Amazon DynamoDB para obtener más detalles.

Puede importar datos de un bucket de Amazon S3 que pertenece a otra cuenta si tiene los permisos correctos para leer de ese bucket específico. La nueva tabla también puede estar en una región diferente del bucket de Amazon S3 de origen. Para obtener más información, consulte Configuración y permisos de Amazon Simple Storage Service.

Los tiempos de importación están directamente relacionados con las características de sus datos en Amazon S3. Esto incluye el tamaño de los datos, el formato de los datos, el esquema de compresión, la uniformidad de la distribución de los datos, el número de objetos de Amazon S3 y otras variables relacionadas. En concreto, los conjuntos de datos con claves distribuidas de un modo uniforme serán más rápidos de importar que los conjuntos de datos sesgados. Por ejemplo, si la clave del índice secundario utiliza el mes del año para la partición y todos sus datos son del mes de diciembre, la importación de estos datos puede tardar bastante más.

Se espera que los atributos asociados a las claves sean únicos en la tabla base. Si alguna clave no es única, la importación sobrescribirá los elementos asociados hasta que solo quede la última sobrescritura. Por ejemplo, si la clave principal es el mes y se establecen varios elementos en el mes de septiembre, cada nuevo elemento sobrescribirá los elementos escritos anteriormente y solo quedará un elemento con la clave principal de “mes” establecido en septiembre. En estos casos, el número de elementos procesados en la descripción de la tabla de importación no coincidirá con el número de elementos de la tabla de destino.

AWS CloudTrail registra todas las acciones de la consola y de la API para la importación de tablas. Para obtener más información, consulte Registrar las operaciones de DynamoDB mediante AWS CloudTrail.

El siguiente vídeo es una introducción a la importación directa desde Amazon S3 a DynamoDB.