オートメーションを大規模に制御する - AWS Systems Manager

オートメーションを大規模に制御する

同時実行値とエラーのしきい値を指定することで、AWS リソースのフリート全体でオートメーションのデプロイを制御できます。同時実行数とエラーのしきい値は、まとめてレート制御と呼ばれます。

同時実行

Concurrency (同時実行) を使用すると、オートメーションを同時に実行できるリソースの数を指定できます。同時実行数は、オートメーションを処理する際のリソースへの影響やダウンタイムを制限するのに役立ちます。リソースの絶対数 (20 など) またはターゲットセットのパーセント数 (10% など) を指定できます。

キューシステムにより、オートメーションは 1 つのリソースに送信され、この最初の呼び出しが完了するのを待ってから、さらに 2 つのリソースにオートメーションが送信されます。同時実行値の値に達するまで、システムはオートメーションをより多くのリソースに指数関数的に送信します。

エラーしきい値

エラーしきい値を使用すると、AWS Systems Manager が他のリソースへオートメーションの送信を停止するまでの、オートメーションの失敗の許容量を決定できます。エラーの絶対数 (10 など) またはターゲットセットのパーセント数 (10% など) を指定できます。

たとえば、エラーの絶対数として 3 を指定すると、4 番目のエラーを受信した際に、システムはオートメーションの実行を停止します。値として 0 を指定した場合、最初のエラー結果が返されると、システムから他のターゲットでオートメーションが実行されなくなります。

たとえば、50 のインスタンスにオートメーションを送信し、エラーしきい値を 10% に設定した場合、5 番目のエラーが受信されると、システムから他のインスタンスにコマンドが送信されなくなります。エラーのしきい値に達したときに既にオートメーションを実行中の呼び出しについては、完了を許可されますが、これらのオートメーションも失敗する可能性があります。エラーのしきい値に指定された数より多くのエラーが発生しないようにする必要がある場合は、[Concurrency (同時実行数)] 値を 1 に設定して、オートメーションを 1 つずつ進めるようにします。