Modos de throughput - Amazon SageMaker

Modos de throughput

A Amazon SageMaker Feature Store oferece dois modelos de preços para você escolher: modo throughput sob demanda (On-demand) e provisionada (Provisioned). On-demand funciona melhor para tráfego menos previsível, enquanto Provisioned funciona melhor para tráfego consistente e previsível.

Você tem a opção de alternar entre os modos On-demand e Provisioned do throughput para um determinado grupo de atributos, para acomodar períodos nos quais os padrões de tráfego da aplicação estão mudando ou são menos previsíveis. Você só pode atualizar o modo de throughput do grupo de atributos para On-demand uma vez em um período de 24 horas. O modo de throughput pode ser atualizado programaticamente usando a API UpdateFeatureGroup ou por meio da interface do console. Para obter mais informações sobre como usar o console, consulte Usar o Amazon SageMaker Feature Store no console.

Você pode usar o modo de throughput Provisioned com grupos de atributos somente offline ou grupos de atributos com o tipo de armazenamento Standard. Para outras configurações de armazenamento, o modo On-demand da throughput é usado. Para obter informações sobre as configurações de armazenamento on-line e offline, consulte Armazenamento on-line e Armazenamento offline, respectivamente.

Para obter mais detalhes sobre a definição de preços, consulte Definição de preços do Amazon SageMaker.

Modo de throughput sob demanda

O modo de throughput On-demand (padrão) funciona melhor quando você usa grupos de atributos com workload desconhecido, tráfego de aplicações imprevisível e não consegue prever os requisitos de capacidade.

O modo On-demand cobra pelas leituras e gravações que a aplicação realiza nos grupos de atributos. Não é necessário especificar o throughput de leitura e gravação que você espera que sua aplicação execute, pois o Feature Store acomoda instantaneamente o crescimento e a redução dos workloads. Você paga apenas pelo que usa, que é medido em ReadRequestsUnits e WriteRequestsUnits.

Você pode ativar o modo de throughput On-demand usando as APIs CreateFeatureGroup ou UpdateFeatureGroup ou por meio da interface de usuário do console. Para obter mais informações sobre como usar a interface do console, consulte Usar o Amazon SageMaker Feature Store no console.

Importante

Você só pode atualizar o modo de throughput do grupo de atributos para On-demand uma vez em um período de 24 horas.

Modo de throughput provisionada

O modo de throughput Provisioned funciona melhor quando você usa grupos de atributos com workloads previsíveis e pode prever os requisitos de capacidade para controlar os custos. Isso pode reduzir o custo para determinadas workloads, nas quais você pode antecipar os requisitos de throughput.

Quando você define um grupo de atributos para o modo Provisioned, você especifica as unidades de capacidade que uma aplicação pode consumir de um grupo de atributos. Se a aplicação exceder sua capacidade de throughput Provisioned, ele estará sujeito à controle de utilização de solicitações.

Veja a seguir informações sobre as unidades de capacidade de leitura e gravação.

  • Recuperar um único registro de até 4 KB usando a API GetRecord consumirá pelo menos 1 RCU (unidade de capacidade de leitura). A recuperação de cargas úteis maiores pode demorar mais. O número total de unidades de capacidade de leitura necessárias varia de acordo com o tamanho do item, incluindo um pequeno metadado por registro adicionado pelo Feature Store.

  • Uma única solicitação de gravação com uma carga útil de 1 kB usando a API PutRecord consumirá pelo menos 1 WCU (unidade de capacidade de gravação), com cargas fracionárias arredondadas para o kB mais próximo. Pode consumir mais dependendo da hora do evento, do status de exclusão do registro e do status do tempo de vida (TTL). Para mais informações sobre TTL, consulte Duração do tempo de vida (TTL) dos registros.

Importante

Ao definir suas unidades de capacidade, considere o seguinte:

  • Você será cobrado pelas capacidades de leitura e gravação provisionadas para seu grupo de atributos, mesmo que não utilize totalmente a capacidade de Provisioned.

  • Se você definir uma capacidade de leitura ou gravação muito baixa, suas solicitações poderão sofrer controle de utilização.

  • Em alguns casos, os registros podem consumir uma unidade de capacidade extra devido aos metadados em nível de registro adicionados pelo Feature Store para ativar vários atributos.

  • Recuperar somente um subconjunto de atributos usando a API GetRecord ou BatchGetRecord ainda consumirá a RCU correspondente a todo o registro.

  • Para capacidade de gravação, você deve provisionar o dobro da capacidade de pico recente para evitar controle de utilização ao realizar preenchimentos ou ingestão em massa, o que pode resultar em um grande número de gravações históricas de registros. Isso ocorre porque a gravação de registros históricos consome mais capacidade de gravação.

  • Atualmente, o Feature Store não oferece apoio ao ajuste de escala automático para o modo Provisioned.

Você pode ativar o modo de throughput On-demand usando as APIs CreateFeatureGroup ou UpdateFeatureGroup ou por meio da interface de usuário do console. Para obter mais informações sobre como usar a interface do console, consulte Usar o Amazon SageMaker Feature Store no console.

A seguir, descrevemos como você pode aumentar ou diminuir o throughput de RCU e WCU para seus grupos de atributos quando o modo Provisioned está ativado.

Aumentar a throughput provisionada

Você pode aumentar a RCU ou a WCU sempre que necessário usando a API UpdateFeatureGroup ou a interface do console.

Diminuir a throughput provisionada

Você pode diminuir a RCU e a WCU (ou ambas) para grupos de atributos usando a API UpdateFeatureGroup ou a interface do console.

Há uma cota padrão para o número de reduções de capacidade Provisioned que você pode realizar no grupo de atributos por dia. Um dia é definido de acordo com o Tempo Universal Coordenado (UTC). Em determinado dia, você pode começar realizando até quatro reduções dentro de uma hora, desde que ainda não tenha realizado nenhuma outra redução durante esse dia. Posteriormente, você pode realizar uma redução adicional por hora, desde que não haja reduções na hora anterior. Isso leva o número máximo de diminuições em um dia para 27 vezes (4 diminuições na primeira hora e 1 diminuição para cada uma das janelas de 1 hora subsequentes em um dia).

Métricas do modo de throughput

Um grupo de atributos no modo On-demand emitirá ConsumedReadRequestsUnits e métricas ConsumedWriteRequestsUnits. Um grupo de atributos no modo Provisioned emitirá ConsumedReadCapacityUnits e métricas ConsumedWriteCapacityUnits. Para obter mais informações sobre métricas do Feature Store, consulte Métricas da Amazon SageMaker Feature Store.

Limites do modo de throughput

Cada Conta da AWS tem cotas ou limites de serviço padrão que são aplicados para ajudar a garantir a disponibilidade e gerenciar os riscos de cobrança. Para obter mais informações sobre limites e cotas padrão, consulte Cotas, regras de nomenclatura e tipos de dados.

Em alguns casos, esses limites podem ser menores do que o indicado na documentação. Se você precisar aumentar esse limite, pode enviar uma solicitação. É uma boa ideia fazer isso antes de atingir os limites atuais para evitar interrupções no trabalho. Para obter mais informações sobre service quotas e como solicitar um aumento de cota, consulte Service quotas da AWS.