Lista de verificação para execução em escala - AWS Batch

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Lista de verificação para execução em escala

Antes de executar uma grande workload em 50 mil ou mais vCPUs, considere a lista de verificação a seguir.

nota

Se você planeja executar uma grande workload em um milhão ou mais vCPUs, ou precisa de orientação para execução em grande escala, entre em contato com sua equipe AWS.

  • Verifique suas cotas do Amazon EC2: verifique suas cotas do Amazon EC2 (também conhecidas como limites) no painel Service Quotas do AWS Management Console. Se necessário, solicite um aumento de cota para seu número máximo de instâncias do Amazon EC2. Lembre-se de que o Amazon EC2 Spot e as instâncias sob demanda têm cotas separadas. Para obter mais informações, consulte Conceitos Básicos de Service Quotas.

  • Verifique sua cota do Amazon Elastic Block Store para cada Região: cada instância utiliza um volume GP2 ou GP3 para o sistema operacional. Por padrão, a cota para cada Região da AWS é de 300 TiB. No entanto, cada instância utiliza contagens de uso como parte dessa cota. Portanto, certifique-se de levar isso em consideração ao verificar sua cota do Amazon Elastic Block Store para cada Região. Se sua cota for alcançada, você não poderá criar mais instâncias. Para obter mais informações, consulte Endpoints e Cotas do Amazon Elastic Block Store

  • Utilize o Amazon S3 para armazenamento: o Amazon S3 fornece alta taxa de transferência e ajuda a eliminar a suposição sobre quanto armazenamento provisionar baseado no número de trabalhos e instâncias em cada Zona de Disponibilidade. Para obter mais informações, consulte Padrões de Design de Práticas Recomendadas: Otimizando a Performance do Amazon S3.

  • Escale gradualmente para identificar gargalos com antecedência: Para um trabalho em execução em um milhão ou mais de vCPUs, comece menor e aumente gradualmente para que você possa identificar gargalos mais cedo. Por exemplo, comece executando em 50 mil vCPUs. Em seguida, aumente a contagem para 200 mil vCPUs, depois 500 mil vCPUs, e assim por diante. Em outras palavras, continue aumentando gradualmente a contagem de vCPUs até alcançar o número de vCPUs desejado.

  • Monitore para identificar possíveis problemas com antecedência: Para evitar possíveis interrupções e problemas ao executar em escala, certifique-se de monitorar seu aplicativo e sua arquitetura. Podem ocorrer interrupções mesmo ao escalar de 1 mil para 5 mil vCPUs. Você pode utilizar o Amazon CloudWatch Logs para analisar dados de log ou utilizar o CloudWatch Embedded Metrics, com uma biblioteca de cliente. Para obter mais informações, consulte Referência do Atendente do CloudWatch Logs e aws-embedded-metrics