FSx for Windows File Server でのストレージの管理 - Amazon FSx for Windows File Server

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

FSx for Windows File Server でのストレージの管理

ファイルシステムのストレージ設定には、プロビジョニングされたストレージ容量、ストレージタイプ、ストレージタイプがソリッドステートドライブ (SSD) の場合は SSD の量が含まれますIOPS。これらのリソースは、ファイルシステムの作成時および作成後に、ファイルシステムのスループットキャパシティとともに設定して、ワークロードに必要なパフォーマンスを実現できます。、、および でのリモート管理FSxCLI用の Amazon を使用して AWS Management Console、ファイルシステムのストレージとストレージ関連のパフォーマンスを管理する方法については AWS CLI、以下のトピック PowerShell を参照してください。

ストレージコストの最適化

FSx for Windows で使用可能なストレージ設定オプションを使用して、ストレージコストを最適化できます。

Windows File Server FSxのストレージタイプオプションには、ハードディスクドライブ (HDD) とソリッドステートドライブ (SSD) の 2 つのストレージタイプがあり、ワークロードのニーズに合わせてコスト/パフォーマンスを最適化できます。HDD ストレージは、ホームディレクトリ、ユーザーと部門の共有、コンテンツ管理システムなど、幅広いワークロード向けに設計されています。SSD ストレージは、データベース、メディア処理ワークロード、データ分析アプリケーションなど、最もパフォーマンスが高く、レイテンシーの影響を受けやすいワークロード向けに設計されています。ストレージタイプとファイルシステムのパフォーマンスの詳細については、「」を参照してくださいFSx for Windows File Server のパフォーマンス

データ重複排除 — 大規模なデータセットには冗長なデータが含まれていることが多く、データストレージコストが増加します。例えば、ユーザーのファイル共有には、複数のユーザーによって保存された同じファイルのコピーが複数存在する場合があります。ソフトウェア開発共有には、ビルドごとに変更されないままの多くのバイナリを含めることができます。ファイルシステムの データ重複排除 を有効にすることで、データストレージのコストを削減することができます。重複排除機能を有効にすると、データセットの重複した部分を一度だけ保存することで、冗長データを自動的に削減または排除します。データ重複排除の詳細と、Amazon FSx ファイルシステムに対して簡単に有効にする方法については、「」を参照してくださいデータ重複排除によるストレージコストの削減

ストレージ容量の管理

ストレージ要件の変化に応じてFSx、 for Windows ファイルシステムのストレージ容量を増やすことができます。これを行うには、Amazon FSxコンソール、Amazon FSx API、または AWS Command Line Interface () を使用しますAWS CLI。ストレージ容量の増加を計画する際に考慮すべき要因には、ストレージ容量を増やす必要があるタイミングを把握すること、Amazon がストレージ容量の増加FSxを処理する方法を理解すること、ストレージの増加リクエストの進行状況を追跡することなどがあります。ファイルシステムのストレージ容量は増やすことができ、ストレージ容量を減らすことはできません。

注記

2019 年 6 月 23 日より前に作成されたファイルシステムや、2019 年 6 月 23 日より前に作成されたファイルシステムに属するバックアップから復元されたファイルシステムでは、ストレージ容量を増やすことはできません。

Amazon FSx ファイルシステムのストレージ容量を増やすと、Amazon はバックグラウンドでファイルシステムに新しい大きなディスクセットFSxを追加します。FSx 次に、Amazon はストレージ最適化プロセスをバックグラウンドで実行し、古いディスクから新しいディスクにデータを透過的に移行します。ストレージの最適化には、ストレージタイプやその他の要因に応じて数時間から数日かかることがあり、ワークロードのパフォーマンスへの影響は最小限に抑えられます。この最適化では、古いストレージボリュームと新しいストレージボリュームの両方がファイルシステムレベルのバックアップに含まれるため、バックアップの使用量が一時的に高くなります。ストレージスケーリングアクティビティ中であっても Amazon がバックアップを正常に取得および復元できるようにFSx、両方のストレージボリュームのセットが含まれています。以前のストレージボリュームがバックアップ履歴に含まれていない場合、バックアップの使用量は、以前のベースラインレベルに戻ります。新しいストレージ容量が利用可能になると、新しいストレージ容量に対してのみ請求されます。

次の図は、ファイルシステムのストレージ容量を増やすときに Amazon がFSx使用するプロセスの主な 4 つのステップを示しています。

ストレージスケーリングプロセスの 4 つのステップを示す図。

Amazon FSxコンソール、、または を使用して、ストレージの最適化、SSDストレージ容量の増加、CLIまたはSSDIOPS更新の進行状況をいつでも追跡できますAPI。詳細については、「ストレージ容量の拡張をモニタリングする」を参照してください。

ファイルシステムのストレージ容量の増加について知っておくべきこと

ストレージ容量を増やすときに考慮すべき重要な事項をいくつか挙げます。

  • 増加のみ - ファイルシステムのストレージ容量は増加することのみ可能で、ストレージ容量は減らせません。

  • 増加最小値 - 各ストレージ容量の増加は、ファイルシステムの現在のストレージ容量の最低 10% で、最大許容値 65,536 GiB までである必要があります。

  • 最小スループットキャパシティ - ストレージ容量を増やすには、ファイルシステムの最小スループットキャパシティが 16 MB / 秒である必要があります。これは、ストレージの最適化ステップがスループットを大量に消費するプロセスであるためです。

  • 拡張するまでの時間 - 最後の拡張がリクエストされてから 6 時間経過するか、ストレージの最適化プロセスが完了するか、どちらが長い方は終わるまでは、ファイルシステムのストレージ容量をさらに増やすことはできません。ストレージの最適化には数時間から数日かかります。ストレージの最適化が完了するまでの時間を最小限に抑えるには、ストレージ容量を増やす前にファイルシステムのスループットキャパシティを増やし (ストレージのスケーリング完了後にスループットキャパシティは元に戻せます)、ファイルシステムのトラフィックが最小である場合はストレージ容量を増やすことをお勧めします。

注記

特定のファイルシステムイベントは、次の例のように、ディスク I/O のパフォーマンスリソースを消費する可能性があります。

ストレージ容量のスケーリングの最適化フェーズでは、ディスクスループットが向上し、パフォーマンス警告が発生する可能性があります。詳細については、「パフォーマンスの警告と推奨事項」を参照してください。

ストレージ容量を増やすタイミングを知る

空きストレージ容量が不足している場合は、ファイルシステムのストレージ容量を増やします。FreeStorageCapacity CloudWatch メトリクスを使用して、ファイルシステムで使用可能な空きストレージの量をモニタリングします。このメトリクスで Amazon CloudWatch アラームを作成し、特定のしきい値を下回ると通知を受け取ることができます。詳細については、「Amazon によるモニタリング CloudWatch」を参照してください。

ファイルシステムには、少なくとも 10% の空きストレージ容量を常に維持することをお勧めします。ストレージ容量をすべて使用するとパフォーマンスに悪影響が生じ、データの不整合が生じる可能性があります。

空きストレージ容量が定義済みしきい値を下回った際にファイルシステムのストレージ容量を自動的に増やすことができます。 AWSが開発したカスタム AWS CloudFormation テンプレートを使用して、自動化ソリューションの実装に必要なすべてのコンポーネントをデプロイします。詳細については、「ストレージ容量を動的に増やす」を参照してください。

ストレージ容量の拡張とファイルシステムのパフォーマンス

ほとんどのワークロードでは、新しいストレージ容量が利用可能になった後に Amazon がバックグラウンドでストレージ最適化プロセスFSxを実行する間、パフォーマンスへの影響は最小限に抑えられます。大規模なアクティブデータセットを使用する書き込みの多いアプリケーションでは、一時的に書き込みパフォーマンスが最大で半分に低下する可能性があります。このような場合には、ストレージ容量を増やす 前に、まずファイルシステムのスループットキャパシティを増やすことができます。これにより、アプリケーションのパフォーマンスニーズを満たすために、同じレベルのスループットを提供し続けることができます。詳細については、「FSx for Windows File Server ファイルシステムのスループットキャパシティの管理」を参照してください。

ファイルシステムのストレージタイプの管理

AWS Management Console および SSDを使用して、ファイルシステムのストレージタイプを から HDDに変更できます AWS CLI。ストレージタイプを に変更する場合SSD、最後の更新がリクエストされてから 6 時間後、またはストレージ最適化プロセスが完了するまで、どちらか長い方までファイルシステム設定を再度更新できないことに注意してください。ストレージの最適化には数時間から数日かかります。この時間を最小限に抑えるために、ファイルシステムのトラフィックが最小のときにストレージタイプを更新することをお勧めします。詳細については、「FSx for Windows ファイルシステムのストレージタイプの更新」を参照してください。

ファイルシステムのストレージタイプを から SSDに変更することはできませんHDD。ファイルシステムのストレージタイプを から SSD に変更する場合はHDD、ストレージを使用するように設定した新しいファイルシステムにファイルシステムのバックアップを復元する必要がありますHDD。詳細については、「新しいファイルシステムへのバックアップの復元」を参照してください。

ストレージタイプについて

for FSx Windows File Server ファイルシステムは、ソリッドステートドライブ (SSD) またはマグネティックハードディスクドライブ (HDD) ストレージタイプを使用するように設定できます。

SSD ストレージは、パフォーマンス要件が高く、レイテンシーの影響を受けやすいほとんどの本稼働ワークロードに適しています。これらのワークロードの例としては、データベース、データ分析、メディア処理、ビジネスアプリケーションなどがあります。また、多数のエンドユーザー、高レベルの I/O、または多数の小さなファイルを含むデータセットを含むユースケースSSDにもお勧めします。最後に、シャドウコピーを有効にする場合は、SSDストレージを使用することをお勧めします。SSD ストレージのあるファイルシステムSSDIOPSには設定とスケーリングができますが、HDDストレージは設定できません。

HDD ストレージは、ホームディレクトリ、ユーザーおよび部門のファイル共有、コンテンツ管理システムなど、幅広いワークロード向けに設計されています。HDD ストレージはSSDストレージに比べて低コストですが、レイテンシーが高く、ストレージ単位IOPSあたりのディスクスループットとディスクレベルが低くなります。I/O 要件の低い汎用ユーザー共有やホームディレクトリ、データの取得頻度の低い大規模なコンテンツ管理システム (CMS)、またはサイズの大きいファイルの少ないデータセットに適しています。

詳細については、「ストレージ構成とパフォーマンス」を参照してください。

の管理 SSD IOPS

SSD ストレージで設定されたファイルシステムの場合、 の量は、キャッシュ内のデータではなく、ファイルシステムがディスクとの間でデータを読み書きする必要がある場合に使用可能なディスク I/O の量SSDIOPSを決定します。ストレージ容量とはSSDIOPS無関係に、 の量を選択してスケーリングできます。プロビジョニングSSDIOPSできる最大値は、ファイルシステム用に選択したストレージ容量とスループット容量によって異なります。スループットキャパシティでサポートされている制限SSDIOPSを超えて を引き上げようとすると、そのレベルの SSD を取得するためにスループットキャパシティを増やす必要がある場合がありますIOPS。詳細については、「FSx for Windows File Server のパフォーマンス」および「FSx for Windows File Server ファイルシステムのスループットキャパシティの管理」を参照してください。

ファイルシステムのプロビジョニングされた の更新について知っておくべき重要な項目を以下に示しますSSDIOPS。

  • IOPS モードの選択 – 次の 2 つのIOPSモードから選択できます。

    • 自動 – このモードを選択すると、Amazon FSxはストレージ容量を GiB SSDIOPSあたり 3 つ、ファイルシステムSSDIOPSあたり最大 400,000 つまで維持SSDIOPSするように を自動的にスケーリングします。

    • ユーザープロビジョニング – このモードを選択すると、96~400,000 SSDIOPSの範囲内の の数を指定できます。Amazon AWS リージョン がFSx利用可能なすべての のストレージ容量 1 GiB IOPSあたり 3~50 の数値、または米国東部 (バージニア北部)、米国西部 (オレゴン)、米国東部 (オハイオ)、欧州 (アイルランド)、アジアパシフィック (東京)、アジアパシフィック (シンガポール) のストレージ容量 1 GiB IOPSあたり 3~500 の数値を指定します。ユーザープロビジョニングモードを選択し、SSDIOPS指定した の量が GiB IOPSあたり少なくとも 3 個でない場合、リクエストは失敗します。プロビジョニングされた のレベルが高い場合はSSDIOPS、ファイルシステムあたり GiB IOPSあたり 3 IOPSを超える平均に対して支払います。

  • ストレージ容量の更新 – ファイルシステムのストレージ容量を増やし、デフォルトで必要な容量SSDIOPSが現在のユーザープロビジョニングSSDIOPSレベルを超えると、Amazon FSxは自動的にファイルシステムを自動モードに切り替え、ファイルシステムのストレージ容量は GiB SSDIOPSあたり 3 以上になります。

  • スループットキャパシティの更新 – スループットキャパシティを増やし、新しいスループットキャパシティでSSDIOPSサポートされる最大がユーザープロビジョニングSSDIOPSレベルよりも高い場合、Amazon は自動的にファイルシステムを自動モードに切り替えFSxます。

  • SSD IOPS 増加の頻度 – 最後のSSDIOPS増加がリクエストされてから 6 時間後、またはストレージ最適化プロセスが完了するまで、どちらか長い方の時間まで、ファイルシステムでさらに増加、スループットキャパシティの増加、またはストレージタイプの更新を行うことはできません。ストレージの最適化には数時間から数日かかります。ストレージの最適化が完了するまでにかかる時間を最小限に抑えるため、ファイルシステム上のトラフィックが最小限に抑えられているSSDIOPS場合はスケーリングすることをお勧めします。

注記

4,608 MBps以上のスループットキャパシティレベルは、 AWS リージョン米国東部 (バージニア北部)、米国西部 (オレゴン)、米国東部 (オハイオ)、欧州 (アイルランド)、アジアパシフィック (東京)、アジアパシフィック (シンガポール) の でのみサポートされることに注意してください。

FSx for Windows File Server ファイルシステムSSDIOPS用にプロビジョニングされた の量を更新する方法の詳細については、「」を参照してくださいファイルシステムの の更新 SSD IOPS

データ重複排除によるストレージコストの削減

データ重複排除は、多くの場合 Dedup for short と呼ばれ、ストレージ管理者が重複データに関連するコストを削減するのに役立ちます。FSx for Windows File Server を使用すると、Microsoft Data Deduplication を使用して冗長データを特定して排除できます。大規模なデータセットは冗長なデータを持つことが多く、データストレージのコストが増加します。例:

  • ユーザーファイル共有には、同じファイルまたは類似のファイルの多くのコピーが含まれる場合があります。

  • ソフトウェア開発共有には、ビルドごとに変更されないバイナリが多数あります。

ファイルシステムのデータ重複排除を有効にすることで、データストレージコストを削減できます。データ重複除外 はデータセットの重複した部分を 1 回のみ保存することで、冗長データを削減または排除します。データ重複排除を有効にすると、データ圧縮はデフォルトで有効になり、重複排除後にデータを圧縮してさらに節約できます。データ重複排除は、データの忠実度や整合性を損なうことなく、冗長性を最適化します。データ重複除外は、ファイルシステムを継続的に自動的にスキャンして最適化するバックグラウンドプロセスとして実行され、ユーザーや接続されたクライアントに対して透過的に実行されます。

データ重複除外によって達成できるストレージの節約は、ファイル間で重複する量など、データセットの性質によって異なります。一般的な汎用ファイル共有では、平均 50~60% 削減されます。共有内では、ユーザードキュメントの 30~50% からソフトウェア開発データセットの 70~80% が節約範囲です。重複排除の潜在的な節約は、以下で説明するMeasure-FSxDedupFileMetadataリモート PowerShell コマンドを使用して測定できます。

また、特定のストレージニーズに合わせてデータ重複除外をカスタマイズすることもできます。例えば、特定のファイルタイプでのみ実行するように重複除外を設定したり、カスタムジョブスケジュールを作成したりできます。重複排除ジョブはファイルサーバーリソースを消費するため、 を使用して重複排除ジョブのステータスをモニタリングすることをお勧めしますGet-FSxDedupStatus

ファイルシステムでのデータ重複排除の設定については、「」を参照してくださいデータ重複除外の管理

データ重複排除に関連する問題の解決については、「」を参照してください

データ重複除外の詳細については、Microsoft の「データ重複除外について」ドキュメントを参照してください。

警告

特定の Robocopy コマンドをデータ重複除外で実行することは推奨されません。これらのコマンドはチャンクストアのデータ整合性に影響を与える可能性があるためです。詳細については、Microsoft のデータ重複除外の相互運用性に関するドキュメントを参照してください。

データ重複排除を使用する際のベストプラクティス

ここでは、Data Deduplication を使用するためのいくつかのベストプラクティスを以下に示します。

  • ファイルシステムがアイドル状態のときに実行するデータ重複排除ジョブをスケジュールする: デフォルトのスケジュールには、毎週土曜日の 2:45 UTCにGarbageCollectionジョブが含まれます。ファイルシステムで大量のデータが流出している場合、完了するまでに数時間かかることがあります。この時間がワークロードにとって理想的でない場合は、ファイルシステムのトラフィックが少ないと予想される時間にこのジョブを実行するようにスケジュールします。

  • Data Deduplication を完了するのに十分なスループットキャパシティを設定する: スループットキャパシティが大きいほど、メモリのレベルが高くなります。Microsoft では、Data Deduplication を実行するには、論理データの 1 TB あたり 1 GB のメモリを用意することを推奨します。Amazon FSxパフォーマンステーブルを使用して、ファイルシステムのスループットキャパシティに関連付けられているメモリを決定し、メモリリソースがデータのサイズに十分であることを確認します。

  • Data Deduplication の設定をカスタマイズして、特定のストレージのニーズを満たし、パフォーマンス要件を緩和する: 特定のファイルタイプまたはフォルダーで実行するように最適化を制限したり、最適化のための最小ファイルサイズと経過時間を設定したりできます。詳細については、「データ重複排除によるストレージコストの削減」を参照してください。