Auto Scaling ポリシー - Amazon ElastiCache

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Auto Scaling ポリシー

スケーリングポリシーには、次のコンポーネントがあります。

  • ターゲットメトリクス – Valkey または Redis OSS Auto Scaling ElastiCache でスケーリングするタイミングと量を決定するために使用される CloudWatch メトリクス。

  • 最小容量と最大容量 – スケーリングに使用されるシャードまたはレプリカの最小数および最大数。

    重要

    Auto Scaling ポリシーの作成中に、現在のキャパシティが設定された最大キャパシティよりも大きい場合、ポリシーの作成 MaxCapacity 中に scaleIn に移動します。同様に、現在の容量が設定された最小容量よりも低い場合は、 scaleOut に移動します MinCapacity。

  • クールダウン期間 – スケールインまたはスケールアウトアクティビティが完了してから別のスケールアウトアクティビティが開始されるまでの時間 (秒)。

  • サービスにリンクされたロール – 特定の AWS サービスにリンクされた AWS Identity and Access Management (IAM) ロール。サービスにリンクされたロールには、サービスがユーザーに代わって他の AWS サービスを呼び出すために必要なすべてのアクセス許可が含まれます。Valkey または Redis OSS Auto Scaling ElastiCache を使用するとAWSServiceRoleForApplicationAutoScaling_ElastiCacheRG、このロール が自動的に生成されます。

  • スケールインアクティビティの有効化または無効化 - ポリシーに対してスケールインアクティビティを有効化または無効化できます。

Auto Scaling のターゲットメトリックス

このタイプのポリシーでは、事前定義されたメトリクスまたはカスタムメトリクスとメトリクスのターゲット値は、ターゲット追跡スケーリングポリシー設定で指定されます。Valkey または Redis OSS Auto Scaling ElastiCache では、スケーリングポリシーをトリガーする CloudWatch アラームを作成して管理し、メトリクスとターゲット値に基づいてスケーリング調整を計算します。スケーリングポリシーは、指定されたターゲット値、またはそれに近い値にメトリクスを維持するため、必要に応じてシャード/レプリカを追加または削除します。メトリクスをターゲット値に近い値に維持することに加えて、ターゲット追跡スケーリングポリシーは、変化するワークロードによるメトリクスの変動に適応します。そのようなポリシーは、クラスターに使用可能なシャード/レプリカ数の急速な変動の最小化もします。

たとえば、事前定義された平均 ElastiCachePrimaryEngineCPUUtilization メトリクスを使用するスケーリングポリシーを考慮してください。このようなポリシーでは、CPU使用率を 70% などの指定された使用率に維持したり、近くに維持したりできます。

注記

各クラスターについては、各ターゲットメトリクスに対して 1 つの Auto Scaling ポリシーのみを作成できます。

最小容量と最大容量

シャード

Valkey または Redis OSS 自動スケーリング ElastiCache を使用して、 でスケーリングできるシャードの最大数を指定できます。この値は、250 以下で、最小 1 である必要があります。自動スケーリングで管理されるシャードの最小数を指定することもできます。この値は 1 以上で、最大シャードで指定された値である 250 以下である必要があります。

レプリカ

Valkey または Redis OSS 自動スケーリング ElastiCache で が管理するレプリカの最大数を指定できます。この値は、1 以下にする必要があります。自動スケーリングで管理されるレプリカの最小数を指定することもできます。この値は 1 以上で、最大レプリカで指定された値である 5 以下である必要があります。

通常のトラフィックに必要なシャード/レプリカの最小数と最大数を決定するには、モデルに対するトラフィックの予想レートで Auto Scaling の設定をテストします。

注記

ElastiCache Valkey または Redis OSS 自動スケーリングポリシーを使用すると、定義された最大サイズに達するまで、またはサービス制限が適用されるまで、クラスターの容量が増加します。この制限の拡大をリクエストするには、「AWS のサービスの制限」を参照し、制限タイプとして [Nodes per cluster per instance type (インスタンスタイプごとのクラスターあたりのノード)] を選択します。

重要

トラフィックがないときにスケールインする バリアントのトラフィックがゼロになると、 ElastiCache Valkey または Redis OSSは自動的に指定されたインスタンスの最小数にスケールインされます。

クールダウン期間

クラスターのスケールインやスケールアウトに影響するクールダウン期間を追加することで、ターゲット追跡スケーリングポリシーの応答性を調整できます。クールダウン期間を設定すると、その期間が過ぎるまでその後のスケールインやスケールアウトのリクエストがブロックされます。これにより、スケールインリクエスト用の Valkey または Redis OSSクラスター ElastiCache を使用した のシャード/レプリカの削除、およびスケールアウトリクエスト用のシャード/レプリカの作成が遅くなります。以下のクールダウン期間を指定できます。

  • スケールインアクティビティは、クラスター内のシャード/レプリカの数を減らします。スケールインのクールダウン期間は、スケールインアクティビティが完了してから別のスケールインアクティビティが開始されるまでの時間 (秒) を指定します。

  • スケールアウトアクティビティは、クラスター内のシャード/レプリカの数を増やします。スケールアウトのクールダウン期間は、スケールアウトアクティビティが完了してから別のスケールアウトアクティビティが開始されるまでの時間 (秒) を指定します。

スケールインやスケールアウトのクールダウン期間が指定されない場合、スケールアウトのデフォルトは 600 秒で、スケールインのデフォルトは 900 秒です。

スケールインアクティビティの有効化または無効化

ポリシーに対してスケールインアクティビティを有効化または無効化できます。スケールインアクティビティを有効にすると、スケーリングポリシーはシャード/レプリカを削除できます。スケールインアクティビティが有効な場合、スケーリングポリシーのスケールインのクールダウン期間がスケールインアクティビティに適用されます。スケールインアクティビティを無効にすると、スケーリングポリシーはシャード/レプリカを削除できなくなります。

注記

スケールアウトアクティビティは常に有効になっており、スケーリングポリシーは必要に応じて Valkey または Redis OSS シャード/レプリカ ElastiCache で を作成できます。