サポートされているストレージクラスとフォーマット - Amazon Macie

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

サポートされているストレージクラスとフォーマット

Amazon Simple Storage Service (Amazon S3) データエステート内の機密データを検出できるように、Amazon Macie は、ほとんどの Amazon S3 ストレージクラスと、さまざまなファイルおよびストレージ形式をサポートします。このサポートは、S3 オブジェクトを分析するためのマネージドデータ識別子およびカスタムデータ識別子の使用に適用されます。

Macie が S3 オブジェクトを分析するには、サポートされているストレージクラスを使用してオブジェクトを Amazon S3 の汎用バケットに保存する必要があります。オブジェクトは、サポートされているファイルまたはストレージ形式を使用する必要があります。このセクションのトピックでは、Macie が現在サポートしているストレージクラス、ファイルおよびストレージ形式を一覧表示しています。

ヒント

Macie は Amazon S3 向けに最適化されていますが、現在別の場所に保存されているリソース内の機密データを検出するために使用できます。これを行うには、データを Amazon S3 に一時的または永続的に移動します。例えば、Amazon Relational Database Service または Amazon Aurora のスナップショットを Apache Parquet 形式で Amazon S3 にエクスポートします。あるいは、Amazon DynamoDB テーブルを Amazon S3 にエクスポートします。その後、機密データ検出ジョブを作成して Amazon S3 内のデータを分析できます。

サポートされている Amazon S3 ストレージクラス

機密データを検出するために、Amazon Macie は次の Amazon S3 ストレージクラスをサポートしています。

  • 低冗長性 (RRS)

  • S3 Glacier Instant Retrieval

  • S3 Intelligent‐Tiering

  • S3 1 ゾーン - 低頻度アクセス (S3 1 ゾーン -IA)

  • S3 Standard

  • S3 標準 - 低頻度アクセス (S3 標準 IA)

Macie は、S3 Glacier Deep Archive や S3 Express One Zone など、他の Amazon S3 ストレージクラスを使用する S3 オブジェクトを分析しません。さらに、Macie は S3 ディレクトリバケットに保存されているオブジェクトを分析しません。

サポートされている Amazon S3 ストレージクラスを使用しない S3 オブジェクトを分析する機密データ検出ジョブを設定する場合、Macie はジョブの実行時にそれらのオブジェクトをスキップします。Macie はオブジェクト内のデータを取得または分析しようとはしません。オブジェクトは分類できないオブジェクトとして扱われます。分類できないオブジェクトとは、サポートされているストレージクラスと、サポートされているファイルまたはストレージ形式を使用していないオブジェクトです。Macie は、サポートされているストレージクラスと、サポートされているファイルまたはストレージ形式を使用するオブジェクトのみを分析します。

同様に、機密データの自動検出を実行するように Macie を設定した場合、分類できないオブジェクトは選択と分析の対象にはなりません。Macie は、サポートされている Amazon S3 ストレージクラスと、サポートされているファイルまたはストレージ形式を使用するオブジェクトのみを選択します。

分類不可能なオブジェクトを保存する S3 バケットを識別するには、S3 バケットインベントリ をフィルタリングします。インベントリ内の各バケットには、バケット内の分類できないオブジェクトの数と合計ストレージサイズを報告するフィールドがあります。

Amazon S3 が提供するストレージクラスの詳細については、Amazon Simple Storage Service ユーザーガイドAmazon S3 ストレージクラスの使用を参照してください。

サポートされているファイルおよびストレージ形式

Amazon Macie が S3 オブジェクトを分析すると、Macie は Amazon S3 からオブジェクトの最新バージョンを取得し、オブジェクトのコンテンツを詳細に検査します。この検査では、データのファイルまたはストレージ形式が考慮されます。Macie は、一般的に使用される圧縮形式やアーカイブ形式など、さまざまな形式でデータを分析できます。

Macie が圧縮ファイルまたはアーカイブファイル内のデータを分析するとき、Macie は完全なファイルとファイルの内容の両方を検査します。ファイルの内容を検査するために、Macie はファイルを解凍し、次にサポートされている形式を使用する各抽出ファイルを検査します。Macie は、最大 1,000,000 個までのファイルに対して、最大 10 レベルのネストされた深さまでこれを行うことができます。機密データ検出に適用される追加のクォータの詳細については、Macie のクォータを参照してください。

次のテーブルでは、Macie が機密データを検出するために分析できるファイルおよびストレージ形式のタイプをリスト化して説明します。サポートされているタイプごとに、表には該当するファイル名拡張子もリスト化されています。

ファイルまたはストレージタイプ 説明 ファイル名拡張子

ビッグデータ

Apache Avro オブジェクトコンテナおよび Apache Parquet ファイル

.avro、.parquet

圧縮またはアーカイブ

GNU 圧縮アーカイブ、TARアーカイブ、ZIP圧縮アーカイブを圧縮する

.gz、.gzip、.tar、.zip

ドキュメント

Adobe Portable Document Format ファイル、Microsoft Excel ワークブック、および Microsoft Word ドキュメント

.doc、.docx、.pdf、.xls、.xlsx

E メールメッセージ

コンテンツが 2822 などの E メールメッセージの で指定された要件に準拠している IETF RFC E メールファイル RFC

.eml

Text (テキスト)

非バイナリテキストファイル。例としては、カンマ区切り値 (CSV) ファイル、拡張マークアップ言語 (XML) ファイル、ハイパーテキストマークアップ言語 (HTML) ファイル、 JavaScript オブジェクト表記 (JSON) ファイル、JSON行ファイル、プレーンテキストドキュメント、タブ区切り値 (TSV) ファイル、 YAML ファイルなどがあります。

非バイナリテキストファイルのタイプに応じて: .csv、.htm、.html、.json、.jsonl、.tsv、.txt、.xml、.yaml、.yml など

Macie は、画像または音声、動画、その他のマルチメディアコンテンツのデータを分析しません。

機密データ検出ジョブを設定して、サポートされているファイルまたはストレージ形式を使用しない S3 オブジェクトを分析すると、Macie はジョブの実行時にそれらのオブジェクトをスキップします。Macie はオブジェクト内のデータを取得または分析しようとはしません。オブジェクトは分類できないオブジェクトとして扱われます。分類不可能オブジェクトは、サポートされている Amazon S3 ストレージクラスを使用しないか、サポートされているファイルまたはストレージ形式のファイル名拡張子を持たないオブジェクトです。Macie は、サポートされているストレージクラスと、サポートされているファイルまたはストレージ形式を使用するオブジェクトのみを分析します。

同様に、機密データの自動検出を実行するように Macie を設定した場合、分類できないオブジェクトは選択と分析の対象にはなりません。Macie は、サポートされている Amazon S3 ストレージクラスと、サポートされているファイルまたはストレージ形式を使用するオブジェクトのみを選択します。

分類できないオブジェクトを保存する S3 バケットを識別するには、S3 バケットインベントリ をフィルタリングします。インベントリ内の各バケットには、バケット内の分類できないオブジェクトの数と合計ストレージサイズを報告するフィールドがあります。