Reservas de capacidade sob demanda e blocos de capacidade para ML
As reservas de capacidade permitem que você reserve capacidade computacional para as instâncias do Amazon EC2 em uma determinada zona de disponibilidade. Há dois tipos de reserva de capacidade, que atendem a casos de uso diferentes.
Tipos de reserva de capacidade
Estes são alguns casos de uso comuns de reservas de capacidade sob demanda:
-
Eventos de escalação: você pode criar reservas de capacidade sob demanda antes de eventos críticos para os negócios de modo a garantir que possa escalar quando necessário.
-
Requisitos regulamentares e recuperação de desastres: use reservas de capacidade sob demanda para atender aos requisitos regulamentares de alta disponibilidade e reserve capacidade para recuperação de desastres em uma outra zona ou região de disponibilidade.
Estes são alguns casos de uso comuns de reservas de capacidade:
-
Treinamento e ajuste fino de modelo de machine learning (ML): tenha acesso ininterrupto às instâncias de GPU que você reservou para concluir o treinamento e o ajuste fino do modelo de ML.
-
Experimentos e protótipos de ML: executar experimentos e desenvolver protótipos que exigem instâncias de GPU por períodos curtos.
Quando usar reserva de capacidade sob demanda
Use reservas de capacidade sob demanda se você tiver requisitos rígidos de capacidade e se suas workloads essenciais para os negócios, atuais ou futuras, exigirem garantia de capacidade. Com as reservas de capacidade sob demanda, você garante que sempre terá acesso à capacidade do Amazon EC2 que reservou, pelo tempo que precisar.
Quando usar blocos de capacidade para ML
Use blocos de capacidade para ML quando precisar garantir acesso ininterrupto às instâncias de GPU por um período de tempo definido, a partir de uma data futura. Os blocos de capacidade são ideais para treinar e ajustar modelos de ML, fazer pequenas execuções experimentais e lidar com picos temporários de demanda inferida no futuro. Com blocos de capacidade, você pode garantir que terá acesso aos recursos de GPU em uma data específica para executar as workloads de ML.