As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Remediação automática de alertas pelo AMS
Após a verificação, o AWS Managed Services (AMS) corrige automaticamente determinados alertas de acordo com condições e processos específicos descritos nesta seção.
| Nome do alerta | Description | Limites | Ação |
|---|---|---|---|
Falha na verificação de status |
Possíveis falhas de hardware ou um estado de falha da instância. |
O sistema detectou um status de falha pelo menos uma vez nos últimos 15 minutos. |
A remediação automática do AMS primeiro valida se a instância está acessível. Se a instância estiver inacessível, ela será interrompida e reiniciada. O stop and start permite que a instância migre para um novo hardware subjacente. Para obter mais informações, consulte a seção a seguir “Automação de remediação de falhas na verificação de status do EC2”. |
AMSLinuxDiskUsage |
Acione quando o uso do disco de 1 ponto de montagem (espaço designado em um volume) em sua instância do EC2 estiver sendo preenchido. |
O limite está acima do valor definido 6 vezes nos últimos 30 minutos. |
A remediação automática do AMS primeiro exclui os arquivos temporários. Se isso não liberar espaço em disco suficiente, ele estende o volume para evitar tempo de inatividade se o volume ficar cheio. |
AMSWindowsDiskUsage |
Quando o uso do disco de 1 ponto de montagem (espaço designado em um volume) em sua instância do EC2 está se esgotando. |
O limite está acima do valor definido 6 vezes nos últimos 30 minutos. |
A remediação automática do AMS primeiro exclui os arquivos temporários. Se isso não liberar espaço em disco suficiente, ele estende o volume para evitar tempo de inatividade se o volume ficar cheio. |
RDS-EVENT-0089 |
A instância de banco de dados consumiu mais de 90% do armazenamento alocado. |
O armazenamento é mais de 90% alocado. |
A remediação automática do AMS primeiro valida se o banco de dados está em um estado modificável e disponível ou com armazenamento cheio. Em seguida, ele tenta aumentar o armazenamento alocado, o IOPS e a taxa de transferência de armazenamento por meio de um conjunto de alterações. CloudFormation Se o desvio da pilha já for detectado, ele retornará à API do RDS para evitar o tempo de inatividade. Esse recurso pode ser desativado adicionando a seguinte tag à instância de banco de dados do RDS: |
RDS-EVENT-0007 |
O armazenamento alocado para a instância de banco de dados foi esgotado. Para resolver, aloque armazenamento adicional. |
O armazenamento é 100% alocado. |
A remediação automática do AMS primeiro valida se o banco de dados está em um estado modificável e disponível ou com armazenamento cheio. Em seguida, ele tenta aumentar o armazenamento alocado, o IOPS e a taxa de transferência de armazenamento por meio de um conjunto de alterações. CloudFormation Se o desvio da pilha já for detectado, ele retornará à API do RDS para evitar o tempo de inatividade. Esse recurso pode ser desativado adicionando a seguinte tag à instância de banco de dados do RDS: |
RDS-EVENT-0224 |
O armazenamento alocado solicitado atinge ou excede o limite máximo de armazenamento configurado. |
O limite máximo de armazenamento para a instância de banco de dados foi esgotado ou é maior ou igual ao armazenamento alocado solicitado. |
A remediação automática do AMS primeiro valida se a quantidade solicitada de armazenamento do RDS ultrapassará o limite máximo de armazenamento. Se confirmado, o AMS tentará aumentar o limite máximo de armazenamento em 30% com um CloudFormation conjunto de alterações ou uma API direta do RDS se os recursos não forem provisionados. CloudFormation Esse recurso pode ser desativado adicionando a seguinte tag à instância de banco de dados do RDS: |
Capacidade de armazenamento RDS |
Restam menos de 1 GB no armazenamento alocado para a instância de banco de dados. |
O armazenamento é alocado em 99%. |
A remediação automática do AMS primeiro valida se o banco de dados está em um estado modificável e disponível ou com armazenamento cheio. Em seguida, ele tenta aumentar o armazenamento alocado, o IOPS e a taxa de transferência de armazenamento por meio de um conjunto de alterações. CloudFormation Se o desvio da pilha já for detectado, ele retornará à API do RDS para evitar o tempo de inatividade. Esse recurso pode ser desativado adicionando a seguinte tag à instância de banco de dados do RDS: |
AMSFSXONTAPVolumeCapacityUtilization |
O volume do Amazon FSx for NetApp ONTAP consumiu mais do que o armazenamento alocado padrão (80%). |
FSx para ONTAP, a utilização da capacidade de volume é superior a 80% por duas horas (valor padrão). |
A remediação automática do AMS primeiro valida se o estado do ciclo de vida do volume está em um estado modificável e, em seguida, amplia o tamanho do volume em 10% enquanto verifica a capacidade máxima do sistema de arquivos. Se o sistema de arquivos não tiver capacidade de armazenamento suficiente para a expansão do volume, tanto o volume quanto o sistema de arquivos serão expandidos juntos. Essa expansão é limitada a um máximo de três vezes em qualquer período de sete dias. O limite máximo de armazenamento para o qual o AMS Automation se expande é 5120 GiB. notaSe o LUN iSCSI estiver configurado na parte superior do volume, expanda o LUN iSCSI no nível do sistema operacional. Para obter mais informações, consulte Por que meu LUN FSx para ONTAP está no modo somente leitura |
Falha na verificação de status do EC2: notas de automação de remediação
Como a remediação automática do AMS funciona com problemas de falha na verificação de status do EC2:
Se sua instância do Amazon EC2 estiver inacessível, a instância deverá ser interrompida e iniciada novamente para que possa ser migrada para um novo hardware e recuperada.
Se a raiz do problema estiver no sistema operacional (dispositivos ausentes no fstab, corrupção do kernel etc.), a automação não conseguirá recuperar sua instância.
Se sua instância pertencer a um grupo de Auto Scaling, a automação não tomará nenhuma ação — a ação de AutoScalingGroup escalabilidade substitui a instância.
Se sua instância tiver o EC2 Auto Recovery ativado, a correção não será executada.
Automação de remediação de uso de volume do EC2
Como a remediação automática do AWS Managed Services (AMS) funciona com problemas de uso de volume do EC2:
A automação primeiro valida se a expansão do volume é necessária e se ela pode ser executada. Se a expansão for considerada apropriada, a automação pode aumentar a capacidade do volume. Esse processo automatizado equilibra a necessidade de crescimento com uma expansão controlada e limitada.
Antes de estender um volume, a automação executa tarefas de limpeza (Windows: Disk Cleaner, Linux: Logrotate + Simple Service Manager Agent Log, remoção do log) na instância para tentar liberar espaço.
nota
As tarefas de limpeza não são executadas em instâncias da família “T” do EC2 devido à dependência de créditos de CPU para funcionalidade contínua.
No Linux, a automação suporta apenas a extensão de sistemas de arquivos do tipo EXT2 EXT3, EXT4 e XFS.
No Windows, a automação só oferece suporte ao New Technology File System (NTFS) e ao Resilient File System (ReFS).
A automação não estende os volumes que fazem parte do Logical Volume Manager (LVM) ou de uma matriz RAID.
A automação não amplia os volumes de armazenamento de instâncias.
A automação não age se o volume afetado já for maior que 2 TiB.
A expansão por meio da automação é limitada a um máximo de três vezes por semana e cinco vezes no total durante a vida útil do sistema.
A automação não expande o volume se a expansão anterior ocorreu nas últimas seis horas.
Quando essas regras impedem a automação de agir, o AMS entra em contato com você por meio de uma solicitação de serviço de saída para determinar as próximas ações a serem tomadas.
Automação de remediação de eventos de baixo armazenamento do Amazon RDS
Como a remediação automática do AWS Managed Services (AMS) funciona com problemas de eventos de baixo armazenamento do Amazon RDS:
Antes de tentar estender o armazenamento da instância do Amazon RDS, a automação executa várias verificações para garantir que a instância do Amazon RDS esteja em um estado modificável e disponível, ou com armazenamento cheio.
Quando o desvio da CloudFormation pilha é detectado, a remediação ocorre por meio da API do Amazon RDS.
-
Dependendo do evento desencadeador, a remediação modifica as propriedades
MaxAllocatedStorage,,,AllocatedStorageou.IopsStorageThroughputOutras propriedades da instância do Amazon RDS não são modificadas. Para obter mais informações, consulte Configurações para instâncias de banco de dados. A ação de remediação não é executada nos seguintes cenários:
O status da instância do Amazon RDS não é “disponível” ou “com armazenamento cheio”.
O armazenamento da instância do Amazon RDS não é modificável no momento (como quando o armazenamento foi modificado nas últimas seis horas).
A instância do Amazon RDS tem armazenamento com escalabilidade automática habilitado.
A remediação é limitada a uma expansão por seis horas e não mais do que três expansões em um período contínuo de quatorze dias.
Quando esses cenários ocorrem, o AMS entra em contato com você com um incidente de saída para determinar as próximas ações.
Automação de remediação de capacidade de volume ONTAP
Como a remediação automática do AWS Managed Services (AMS) funciona com problemas de capacidade de volume do ONTAP:
Antes de estender o volume, a automação valida se o estado do ciclo de vida do volume está em um estado modificável.
A automação amplia o tamanho do volume em 10% enquanto verifica a capacidade máxima do sistema de arquivos.
Se o sistema de arquivos não tiver capacidade de armazenamento suficiente para acomodar a expansão do volume, tanto o volume quanto a capacidade do sistema de arquivos serão expandidos.
A remediação é limitada a no máximo três atualizações em um período de sete dias.
O limite máximo de armazenamento para o qual o AMS Automation se expande é 5120 GiB.
Se o LUN iSCSI estiver configurado na parte superior do volume, você deverá expandir manualmente o LUN iSCSI no nível do sistema operacional após a conclusão da correção automática. Para obter mais informações, consulte Por que meu LUN FSx para ONTAP está no modo somente leitura
?