Modos de rendimiento
El Almacén de características de Amazon SageMaker ofrece dos modelos de precios entre los que elegir: los modos de rendimiento bajo demanda (On-demand
) y aprovisionado (Provisioned
). On-demand
funciona mejor para un tráfico menos predecible, mientras que Provisioned
funciona mejor para un tráfico uniforme y predecible.
Tiene la opción de cambiar entre los modos de rendimiento On-demand
y Provisioned
para un grupo de características determinado, a fin de adaptarse a los períodos en los que los patrones de tráfico de las aplicaciones cambian o son menos predecibles. Solo puede actualizar el modo de rendimiento de su grupo de características a On-demand
una vez cada 24 horas. El modo de rendimiento se puede actualizar mediante programación con la API UpdateFeatureGroup o mediante la interfaz de usuario de la consola. Para obtener más información sobre cómo usar la consola, consulte Uso del Almacén de características de Amazon SageMaker en la consola.
Puede usar el modo de rendimiento Provisioned
con grupos de características solo sin conexión o grupos de características con el tipo de almacenamiento Standard
. Para otras configuraciones de almacenamiento, se utiliza el modo de rendimiento On-demand
. Para obtener más información sobre las configuraciones de almacenamiento en línea y sin conexión, consulte Almacenamiento en línea y Almacenamiento sin conexión, respectivamente.
Para obtener más información sobre los precios, consulte Precios de Amazon SageMaker
Temas
Modo de rendimiento bajo demanda
El modo de rendimiento On-demand
(predeterminado) funciona mejor cuando se utilizan grupos de características con una carga de trabajo desconocida o un tráfico de aplicaciones impredecible y no se pueden prever los requisitos de capacidad.
El modo On-demand
le cobra por las lecturas y escrituras que realiza su aplicación en sus grupos de características. No es necesario especificar el rendimiento de lectura y escritura que se espera de la aplicación, ya que el Almacén de características se adapta instantáneamente a las cargas de trabajo a medida que aumentan o disminuyen. Solo pagará por lo que utilice, que se mide en ReadRequestsUnits
y WriteRequestsUnits
.
Puede activar el modo de rendimiento On-demand
mediante las API CreateFeatureGroup o UpdateFeatureGroup o mediante la interfaz de usuario de la consola. Para obtener más información sobre cómo usar la IU de la consola, consulte Uso del Almacén de características de Amazon SageMaker en la consola.
importante
Solo puede actualizar el modo de rendimiento de su grupo de características a On-demand
una vez cada 24 horas.
Modo de rendimiento aprovisionado
El modo de rendimiento Provisioned
funciona mejor cuando se utilizan grupos de características con cargas de trabajo predecibles y se pueden pronosticar los requisitos de capacidad para controlar los costos. Esto puede hacer que sea más rentable para determinadas cargas de trabajo, en las que puede anticipar los requisitos de rendimiento con antelación.
Al configurar un grupo de características en el modo Provisioned
, se especifican las unidades de capacidad, que son la cantidad máxima de capacidad que una aplicación puede consumir de un grupo de características. Si la aplicación supera esta capacidad de rendimiento Provisioned
, se somete a una limitación controlada.
A continuación, se proporciona información sobre las unidades de capacidad de lectura y escritura.
-
La recuperación de un único registro de hasta 4 KB mediante la API
GetRecord
consumirá al menos 1 RCU (unidad de capacidad de lectura). La recuperación de cargas útiles más grandes puede llevar más tiempo. El número total de unidades de capacidad de lectura necesarias depende del tamaño del elemento, incluidos un pequeño metadato por registro que añade el servicio del Almacén de características. -
Una sola solicitud de escritura con una carga útil de 1 KB que utilice la API
PutRecord
consumirá al menos 1 WCU (unidad de capacidad de escritura), y las cargas útiles fraccionarias se redondearán al KB más cercano. Es posible que consuma más en función de la hora del evento, del estado de eliminación del registro y del tiempo de vida (TTL). Para obtener más información sobre TTL, consulte Duración del tiempo de vida (TTL) de los registros.
importante
Al configurar las unidades de capacidad, tenga en cuenta lo siguiente:
-
Se le cobrará por las capacidades de lectura y escritura que aprovisione para su grupo de características, incluso si no utiliza toda la capacidad
Provisioned
. -
Si configura una capacidad de lectura o escritura demasiado baja, es posible que sus solicitudes se vean limitadas.
-
En algunos casos, los registros pueden consumir una unidad de capacidad adicional debido a los metadatos de los registros que añade el servicio del Almacén de características para habilitar diversas características.
-
La recuperación de solo un subconjunto de características mediante las API
GetRecord
oBatchGetRecord
seguirá consumiendo la RCU correspondiente a todo el registro. -
En lo que respecta a la capacidad de escritura, debe aprovisionar el doble de la capacidad máxima reciente para evitar limitaciones al realizar rellenos o ingestiones masivas que pueden dar lugar a un gran número de escrituras de registros históricos. Esto se debe a que la escritura de registros históricos consume una capacidad de escritura adicional.
-
Actualmente, el Almacén de características no admite el escalado automático para el modo
Provisioned
.
Puede activar el modo de rendimiento On-demand
mediante las API CreateFeatureGroup o UpdateFeatureGroup o mediante la interfaz de usuario de la consola. Para obtener más información sobre cómo usar la IU de la consola, consulte Uso del Almacén de características de Amazon SageMaker en la consola.
A continuación, se describe cómo puede aumentar o disminuir el rendimiento de RCU y WCU de sus grupos de características cuando el modo Provisioned
está habilitado.
Aumento del rendimiento aprovisionado
Puede aumentar las RCU o WCU tantas veces como sea necesario mediante la API UpdateFeatureGroup o la interfaz de usuario de la consola.
Reducción de rendimiento aprovisionado
Puede reducir las RCU y las WCU (o ambas) para los grupos de características mediante la API UpdateFeatureGroup o la interfaz de usuario de la consola.
Existe una cuota predeterminada del número de reducciones de la capacidad Provisioned
que puede realizar en su grupo de características por día. Un día se define según la hora universal coordinada (UTC). En un día determinado, puede empezar realizando hasta cuatro disminuciones en una hora, siempre que no haya realizado todavía ninguna otra disminución durante ese día. Posteriormente, puede realizar una disminución adicional por hora siempre que no haya habido disminuciones en la hora anterior. Esto efectivamente aumenta el número máximo de reducciones a 27 al día (4 reducciones en la primera hora y 1 reducción en cada hora posterior durante un día).
Métricas del modo de rendimiento
Un grupo de características en modo On-demand
emitirá métricas ConsumedReadRequestsUnits
y ConsumedWriteRequestsUnits
. Un grupo de características en modo Provisioned
emitirá métricas ConsumedReadCapacityUnits
y ConsumedWriteCapacityUnits
. Para obtener más información acerca de las métricas del Almacén de características, consulte Métricas del Almacén de características de Amazon SageMaker.
Límites del modo de rendimiento
Cada Cuenta de AWS tiene límites o cuotas de servicio predeterminados que se aplican para garantizar la disponibilidad y administrar los riesgos de facturación. Para obtener más información acerca de los límites y cuotas predeterminados, consulte Cuotas, reglas de nomenclatura y tipos de datos.
En algunos casos, estos límites pueden ser inferiores a lo que se indica en la documentación. Si necesita límites más elevados, puede enviar una solicitud de aumento. Es recomendable hacerlo antes de alcanzar los límites actuales para evitar interrupciones en el trabajo. Para obtener más información acerca de las cuotas de servicio y cómo solicitar un aumento de cuota, consulte AWS service quotas.