本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
為了協助您探索 Amazon Simple Storage Service (Amazon S3) 資料資產中的敏感資料,Amazon Macie 支援大多數 Amazon S3 儲存類別和各種檔案和儲存格式。此支援適用於使用受管資料識別符,以及使用自訂資料識別符來分析 S3 物件。
若要讓 Macie 分析 S3 物件,必須使用支援的儲存類別將物件存放在 Amazon S3 一般用途儲存貯體中。物件也必須使用支援的檔案或儲存格式。本節中的主題會列出 Macie 目前支援的儲存類別以及檔案和儲存格式。
提示
雖然 Macie 已針對 Amazon S3 進行最佳化,但您可以使用它來探索您目前存放在其他地方之資源中的敏感資料。您可以暫時或永久將資料移至 Amazon S3 來執行此操作。例如,以 Apache Parquet 格式將 Amazon Relational Database Service 或 Amazon Aurora 快照匯出至 Amazon S3。或將 Amazon DynamoDB 資料表匯出至 Amazon S3。然後,您可以建立敏感資料探索任務,以分析 Amazon S3 中的資料。
支援的 Amazon S3 儲存類別
對於敏感資料探索,Amazon Macie 支援下列 Amazon S3 儲存類別:
-
降低備援 (RRS)
-
S3 Glacier Instant Retrieval
-
S3 Intelligent‐Tiering
-
S3 單區域-不常存取 (S3 單區域-IA)
-
S3 Standard
-
S3 標準不常存取 (S3 標準 IA)
Macie 不會分析使用其他 Amazon S3 Amazon S3儲存類別的 S3 物件,例如 S3 Glacier Deep Archive 或 S3 Express One Zone。此外,Macie 不會分析存放在 S3 目錄儲存貯體中的物件。
如果您設定敏感資料探索任務來分析未使用支援 Amazon S3 儲存類別的 S3 物件,Macie 會在任務執行時略過這些物件。 Amazon S3 Macie 不會嘗試擷取或分析物件中的資料,物件會被視為無法分類的物件。無法分類的物件是不使用支援的儲存類別或支援的檔案或儲存格式的物件。Macie 只會分析使用支援的儲存類別和支援的檔案或儲存格式的物件。
同樣地,如果您將 Macie 設定為執行自動敏感資料探索,則無法分類的物件不符合選取和分析的資格。Macie 只會選取使用支援的 Amazon S3 儲存類別和支援的檔案或儲存格式的物件。
若要識別存放無法分類物件的 S3 儲存貯體,您可以篩選 S3 儲存貯體庫存。對於您庫存中的每個儲存貯體,有欄位會報告儲存貯體中無法分類物件的數量和總儲存體大小。
如需 Amazon S3 提供的儲存類別的詳細資訊,請參閱《Amazon Simple Storage Service 使用者指南》中的使用 Amazon S3 儲存類別。
支援的檔案和儲存格式
當 Amazon Macie 分析 S3 物件時,Macie 會從 Amazon S3 擷取物件的最新版本,然後執行物件內容的深度檢查。此檢查會考量資料的檔案或儲存格式。Macie 可以分析許多不同格式的資料,包括常用的壓縮和封存格式。
當 Macie 分析壓縮或封存檔案中的資料時,Macie 會檢查完整檔案和檔案的內容。若要檢查檔案的內容,Macie 會解壓縮檔案,然後檢查每個使用支援格式的解壓縮檔案。Macie 最多可以執行 1,000,000 個檔案,以及高達 10 個層級的巢狀深度。如需適用於敏感資料探索的其他配額資訊,請參閱Macie 配額。
下表列出並說明 Macie 可以分析的檔案和儲存格式類型,以偵測敏感資料。對於每個支援的類型,資料表也會列出適用的檔案名稱副檔名。
檔案或儲存類型 | 描述 | 檔案名稱副檔名 |
---|---|---|
大數據 |
Apache Avro 物件容器和 Apache Parquet 檔案 |
.avro、.parquet |
壓縮或存檔 |
GNU Zip 壓縮封存、TAR 封存和 ZIP 壓縮封存 |
.gz、.gzip、.tar、.zip |
文件 |
Adobe 可攜式文件格式檔案、Microsoft Excel 工作手冊和 Microsoft Word 文件 |
.doc、.docx、.pdf、.xls、.xlsx |
電子郵件訊息 |
電子郵件檔案的內容符合 IETF RFC 為電子郵件訊息指定的要求,例如 RFC 2822 |
.eml |
文字 |
非二進位文字檔案。範例包括:逗號分隔值 (CSV) 檔案、可擴展標記語言 (XML) 檔案、超文字標記語言 (HTML) 檔案、JavaScript 物件標記 (JSON) 檔案、JSON 行檔案、純文字文件、標籤分隔值 (TSV) 檔案和 YAML 檔案 |
根據非二進位文字檔案的類型:.csv、.htm、.html、.json、.jsonl、.tsv、.txt、.xml、.yaml、.yml 等 |
Macie 不會分析影像中的資料,也不會分析音訊、影片和其他類型的多媒體內容。
如果您設定敏感資料探索任務來分析不使用支援檔案或儲存格式的 S3 物件,Macie 會在任務執行時略過這些物件。Macie 不會嘗試擷取或分析物件中的資料,物件會被視為無法分類的物件。無法分類的物件是不使用支援的 Amazon S3 儲存類別或支援的檔案或儲存格式的物件。Macie 只會分析使用支援的儲存類別和支援的檔案或儲存格式的物件。
同樣地,如果您將 Macie 設定為執行自動敏感資料探索,則無法分類的物件不符合選取和分析的資格。Macie 只會選取使用支援的 Amazon S3 儲存類別和支援的檔案或儲存格式的物件。
若要識別存放不可分類物件的 S3 儲存貯體,您可以篩選 S3 儲存貯體庫存。對於您庫存中的每個儲存貯體,有欄位會報告儲存貯體中無法分類物件的數量和總儲存體大小。