Paso 3: Defina la capacidad de rendimiento de la tabla de destino - Amazon Keyspaces (para Apache Cassandra)

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Paso 3: Defina la capacidad de rendimiento de la tabla de destino

Este tutorial le muestra cómo ajustar DSBulk la carga de datos dentro de un rango de tiempo establecido. Dado que sabe de antemano cuántas lecturas y escrituras realiza, utilice el modo de capacidad aprovisionada. Una vez finalizada la transferencia de datos, debe ajustar el modo de capacidad de la tabla para que se adapte a los patrones de tráfico de su aplicación. Para obtener más información sobre administración de capacidad, consulte Administración de recursos sin servidor en Amazon Keyspaces (para Apache Cassandra).

Con el modo de capacidad aprovisionada, usted especifica con antelación cuánta capacidad de lectura y escritura desea aprovisionar a su tabla. La capacidad de escritura se factura por hora y se mide en unidades de capacidad de escritura ()WCUs. Cada una WCU tiene capacidad de escritura suficiente para poder escribir 1 KB de datos por segundo. Al cargar los datos, la velocidad de escritura debe estar por debajo del máximo WCUs (parámetro:write_capacity_units) establecido en la tabla de destino.

De forma predeterminada, puedes aprovisionar WCUs hasta 40 000 en una tabla y 80 000 WCUs en todas las tablas de tu cuenta. Si necesita capacidad adicional, puede solicitar un aumento de cuota en la consola de Service Quotas. Para obtener más información sobre las cuotas, consulte Cuotas para Amazon Keyspaces (para Apache Cassandra).

Calcula la cantidad media WCUs necesaria para un encarte

Insertar 1 KB de datos por segundo requiere 1WCU. Si CSV el archivo tiene 360 000 filas y desea cargar todos los datos en 1 hora, debe escribir 100 filas por segundo (360 000 filas/ 60 minutos/ 60 segundos = 100 filas por segundo). Si cada fila tiene hasta 1 KB de datos, para insertar 100 filas por segundo, debe aprovisionar 100 WCUs a la tabla. Si cada fila tiene 1,5 KB de datos, necesitará dos WCUs para insertar una fila por segundo. Por lo tanto, para insertar 100 filas por segundo, debe aprovisionar 200WCUs.

Para determinar cuántas filas WCUs necesita insertar una fila por segundo, divida el tamaño medio de las filas en bytes entre 1024 y redondee al número entero más cercano.

Por ejemplo, si el tamaño medio de una fila es de 3000 bytes, necesitará tres WCUs para insertar una fila por segundo.

ROUNDUP(3000 / 1024) = ROUNDUP(2.93) = 3 WCUs
Cálculo de capacidad y tiempo de carga de datos

Ahora que conoce el tamaño medio y el número de filas del CSV archivo, puede calcular cuántas filas WCUs necesita para cargar los datos en un período de tiempo determinado y el tiempo aproximado que se tarda en cargar todos los datos del CSV archivo con una WCU configuración diferente.

Por ejemplo, si cada fila del archivo ocupa 1 KB y tiene 1 000 000 de filas en el CSV archivo, para cargar los datos en 1 hora, debe aprovisionar al menos 278 WCUs a la tabla para esa hora.

1,000,000 rows * 1 KBs = 1,000,000 KBs 1,000,000 KBs / 3600 seconds =277.8 KBs / second = 278 WCUs
Configuración de los ajustes de capacidad aprovisionada

Puede configurar los ajustes de capacidad de escritura de una tabla al crearla o mediante el comando ALTER TABLE. A continuación se muestra la sintaxis para modificar los ajustes de capacidad aprovisionada de una tabla con el comando ALTER TABLE.

ALTER TABLE catalog.book_awards WITH custom_properties={'capacity_mode':{'throughput_mode': 'PROVISIONED', 'read_capacity_units': 100, 'write_capacity_units': 278}} ;

Para ver la referencia completa del lenguaje, consulte CREATE TABLE y ALTER TABLE.