PERF02-BP02 Entender a configuração e os recursos de computação disponíveis
Entenda as opções de configuração e os recursos disponíveis para seu serviço de computação a fim de ajudar a provisionar a quantidade certa de recursos e melhorar a eficiência de performance.
Práticas comuns que devem ser evitadas:
-
Não avaliar as opções de computação ou as famílias de instâncias disponíveis em relação às características da workload.
-
Provisionar recursos de computação em excesso para atender aos requisitos de pico de demanda.
Benefícios de implementar esta prática recomendada: familiarizar-se com os atributos e as configurações de computação da AWS a fim de poder usar uma solução de computação otimizada para atender às características e às necessidades da workload.
Nível de risco exposto se esta prática recomendada não for estabelecida: Médio
Orientação para implementação
Cada solução de computação tem configurações e recursos exclusivos disponíveis para acomodar diferentes características e requisitos das workloads. Saiba como essas opções complementam sua workload e determine quais opções de configuração são melhores para sua aplicação. Exemplos dessas opções são famílias de instâncias, tamanhos, recursos (GPU, E/S), expansão, tempos limite, tamanhos de função, instâncias de contêineres e simultaneidade. Se a workload estiver usando a mesma opção de computação há mais de quatro semanas, e se a previsão for de que as características permanecerão as mesmas no futuro, você poderá usar o AWS Compute Optimizer
Etapas de implementação
-
Entenda os requisitos da workload (como necessidade de CPU, memória e latência).
-
Analise a documentação e as práticas recomendadas da AWS para saber mais sobre as opções de configuração indicadas que podem ajudar a melhorar a performance da computação. Aqui estão algumas das principais opções de configuração a serem consideradas:
Opção de configuração Exemplos Tipo de instância -
As instâncias otimizadas para computação
são ideais para workloads que exigem uma proporção maior de vCPU/memória. -
As instâncias otimizadas para memória
entregam grandes quantidades de memória para oferecer compatibilidade com as workloads com uso intenso de memória. -
As instâncias otimizadas para armazenamento
são projetadas para workloads que exigem alta leitura sequencial e acesso de gravação (IOPS) no armazenamento local.
Modelo de definição de preços -
As instâncias sob demanda
permitem usar a capacidade de computação por hora ou segundo sem uma confirmação de longo prazo. Essas instâncias são ideais para expansões acima das necessidades de performance da linha de base. -
Os Savings Plans
oferecem economias significativas em relação às instâncias sob demanda em troca do compromisso de usar uma quantidade específica de potência computacional por um período de um ou três anos. -
As instâncias spot
permitem que você aproveite a capacidade de instância não utilizada com um desconto para as workloads sem estado e tolerantes a falhas.
Auto Scaling Use a configuração de Auto Scaling para combinar recursos computacionais com padrões de tráfego. Dimensionamento -
Use o Compute Optimizer
para obter uma recomendação de machine learning sobre a configuração de computação que corresponde melhor às características da computação. -
Use o AWS Lambda Power Tuning para selecionar a melhor configuração para a função do Lambda.
Aceleradores de computação baseados em hardware -
As instâncias com computação acelerada executam funções como processamento gráfico ou correspondência de padrões de dados com mais eficiência do que as alternativas baseadas em CPU.
-
Para workloads de machine learning, utilize hardware específico para sua workload, como AWS Trainium
, AWS Inferentia e Amazon EC2 DL1
-
Recursos
Documentos relacionados:
Vídeos relacionados:
-
AWS re:Invent 2023: AWS Graviton: a melhor performance de preço para suas workloads da AWS
-
AWS re:Invent 2023: Novos recursos de IA generativa do Amazon EC2 no AWS Management Console
-
AWS re:Invent 2023: Economias inteligentes: estratégias de otimização de custos com o Amazon EC2
-
AWS re:Invent 2021: Capacitar o Amazon EC2 da próxima geração: mergulho profundo no Nitro System
-
AWS re:Invent 2022: Otimizar o Amazon EKS para performance e custo na AWS
Exemplos relacionados: