

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 中的資料 AWS Data Exchange
<a name="data-sets"></a>

 AWS Data Exchange 使用三個建置區塊在 中組織資料：
+ **[資產](#assets)** – 資料片段 
+ **[修訂](#revisions)** – 一或多個資產的容器
+ **[資料集](#data-sets-concept)** – 一系列的一或多個修訂

這三個建置區塊構成您使用 AWS Data Exchange 主控台或 AWS Data Exchange API 管理之產品的基礎。

若要建立、檢視、更新或刪除資料集，您可以使用 AWS Data Exchange 主控台、 AWS Command Line Interface (AWS CLI)、您自己的 REST 用戶端或其中一個 AWS SDKs。如需以程式設計方式管理 AWS Data Exchange 資料集的詳細資訊，請參閱 [AWS Data Exchange API 參考](https://docs.aws.amazon.com/data-exchange/latest/apireference)。

## 資產
<a name="assets"></a>

資產是其中*的資料* AWS Data Exchange。

資產類型定義如何透過資料集、資料授權或包含它們的產品，將資料交付給接收者或訂閱者。

資產可以是下列任何一項：
+ 儲存在本機電腦上的檔案
+ 在 Amazon Simple Storage Service (Amazon S3) 中儲存為物件的檔案
+ 在 Amazon API Gateway 中建立的 REST API
+ Amazon Redshift 資料集
+  AWS Lake Formation 資料許可 （預覽）
+ Amazon S3 資料存取資料集

### 資產結構
<a name="assets-structure"></a>

資產具有下列參數：
+ `DataSetId` – 包含此資產的資料集 ID。
+ `RevisionId` – 包含此資產的修訂版 ID。
+ `Id` – 建立資產時產生的唯一 ID。
+ `Arn` – AWS 資源名稱的唯一識別符。
+ `CreatedAt` 和 `UpdatedAt` – 建立和上次更新資產的日期和時間戳記。
+ `AssetDetails` – 資產的相關資訊。
+ `AssetType` – Amazon S3 物件、Amazon API Gateway API、Amazon Redshift 資料集或 Amazon S3 資料集的快照。

**Example 資產資源**  

```
{
    "Name": "automation/cloudformation.yaml",
    "Arn": "arn:aws:dataexchange:us-east-1::data-sets/29EXAMPLE24b82c6858af3cEXAMPLEcf/revisions/bbEXAMPLE74c02f4745c660EXAMPLE20/assets/baEXAMPLE660c9fe7267966EXAMPLEf5",
    "Id": "baEXAMPLE660c9fe7267966EXAMPLEf5",
    "CreatedAt": "2019-10-17T21:31:29.833Z",
    "UpdatedAt": "2019-10-17T21:31:29.833Z",
    "AssetType": "S3_SNAPSHOT",
    "RevisionId": "bbEXAMPLE74c02f4745c660EXAMPLE20",
    "DataSetId": "29EXAMPLE24b82c6858af3cEXAMPLEcf",
    "AssetDetails": {
        "S3SnapshotAsset": {
            "Size": 9423
        }
    }
}
```

### 資產類型
<a name="asset-types"></a>

**Topics**
+ [檔案資料集](#s3-asset-type)
+ [API 資產](#API-asset-type)
+ [Amazon Redshift 資料共用資產](#RS-asset-type)
+ [AWS Lake Formation 資料許可 （預覽）](#LF-asset-type)
+ [Amazon S3 資料存取](#S3-access-asset-type)

#### 檔案資料集
<a name="s3-asset-type"></a>

使用檔案，訂閱者可以存取資料集的複本做為具備權限的資料集，並匯出資產。

資料集擁有者可以使用 AWS Data Exchange 主控台、透過程式設計方式 AWS CLI、自己的 REST 應用程式或其中一個 AWS SDKs 來匯入和匯出檔案。如需匯入 Amazon S3 資產的詳細資訊，請參閱[從 S3 儲存貯體匯入 AWS Data Exchange 資產](importing-from-s3.md)。如需匯出資產的詳細資訊，請參閱 [將 AWS Data Exchange 資產匯出至 S3 儲存貯體](exporting-from-s3.md)。

#### API 資產
<a name="API-asset-type"></a>

透過 API 資產，資料接收者或訂閱者可以檢視 API，並將 API 規格下載為具備權限的資料集。您也可以對受管端點進行 API AWS Data Exchange呼叫，然後代理至 API 擁有者端點。

擁有現有 Amazon API Gateway API 的資料集擁有者可以使用 AWS Data Exchange 主控台、透過 AWS CLI或其中一個 AWS SDKs 以程式設計方式新增 API 資產。如需匯入 API 資產的詳細資訊，請參閱 [從 Amazon API Gateway API 匯入 AWS Data Exchange 資產](import-API-asset.md)。

**注意**  
目前，下列 SDKs 不支援 `SendApiAsset`操作：  
適用於 .NET 的 SDK
適用於 C\$1\$1 的 AWS SDK
適用於 Java 2.x 的 SDK

沒有現有 Amazon API Gateway API 的資料集擁有者必須先建立一個，才能將 API 資產新增至其產品。如需詳細資訊，請參閱《Amazon [API Gateway 開發人員指南》中的在 API Gateway 中開發 REST](https://docs.aws.amazon.com/apigateway/latest/developerguide/rest-api-develop.html) API。 *Amazon API Gateway *

#### Amazon Redshift 資料共用資產
<a name="RS-asset-type"></a>

 使用 Amazon Redshift 資料共用資產，收件人可以取得唯讀存取權，在 Amazon Redshift 中查詢資料，而無需擷取、轉換和載入資料。

 如需匯入 Amazon Redshift 資料共用資產的詳細資訊，請參閱[從 Amazon Redshift AWS Data Exchange 的資料共用匯入 AWS Data Exchange 資產](import-RS-asset.md)。

#### AWS Lake Formation 資料許可 （預覽）
<a name="LF-asset-type"></a>

透過 AWS Lake Formation 資料許可資產，收件人或訂閱者可以存取和查詢與指定標籤相關聯的所有資料庫、資料表或資料欄。

資料集擁有者必須先建立和標記其資料，才能匯入標籤做為 AWS Data Exchange 資產的一部分。如需匯入 Lake Formation 資料許可資產的詳細資訊，請參閱 [從 匯入 AWS Data Exchange 資產 AWS Lake Formation （預覽）](import-LF-asset.md)。

#### Amazon S3 資料存取
<a name="S3-access-asset-type"></a>

透過 Amazon S3 資料存取資產，收件人或訂閱者可以直接存取和使用提供者的資料，而無需建立或管理資料副本。資料集擁有者可以在現有的 Amazon S3 儲存貯體上 AWS Data Exchange 設定 Amazon S3，以共用對整個 S3 儲存貯體或特定字首和 Amazon S3 物件的直接存取。

## 修訂
<a name="revisions"></a>

修訂是一或多個資產的*容器*。

您可以使用修訂來更新 Amazon S3 中的資料。例如，您可以將 .csv 檔案的集合或單一 .csv 檔案和字典分組以建立修訂。當有新資料可用時，您可以建立修訂並新增資產。使用 AWS Data Exchange 主控台建立和完成修訂之後，訂閱者即可立即取得該修訂。如需詳細資訊，請參閱[在 中發佈新產品 AWS Data Exchange](publishing-products.md)。

請謹記以下幾點：
+ 若要完成，修訂必須至少包含一個資產。
+ 在您完成修訂之前，您有責任確保資產正確無誤。
+ 發佈至至少一個資料授權或產品的最終修訂無法以任何方式取消最終化或變更。（除非透過撤銷修訂程序）
+ 修訂完成後，它會自動發佈到您的資料授權或產品。

### 修訂結構
<a name="revisions-structure"></a>

修訂具有下列參數：
+ `DataSetId` – 包含此修訂的資料集 ID。
+ `Comment` – 有關修訂的註解。此欄位長度可為 128 個字元。
+ `Finalized` – true 或 false。用來指示是否完成修訂。
+ `Id` – 建立修訂時所產生修訂的唯一識別符。
+ `Arn` – AWS 資源名稱的唯一識別符。
+ `CreatedAt` – 建立修訂的日期和時間戳記。授權修訂會在發佈時建立。
+ `UpdatedAt` – 上次更新修訂的日期和時間戳記。
+ `Revoked` – 狀態，指出訂閱者對修訂的存取權已撤銷。
+ `RevokedAt` – 日期和時間戳，指出何時撤銷訂閱者對修訂的存取。
+ `RevocationComment` – 通知訂閱者撤銷其存取修訂之原因的必要註解。所需字元長度下限為 10。此欄位長度可以介於 10 到 512 個字元之間。
+ `SourceID` – 所擁有修訂的修訂 ID，對應於正在檢視的已授權修訂。當修訂擁有者正在檢視其擁有修訂的有權限副本時，會傳回此參數。

**Example 修訂資源**  

```
        {
            "UpdatedAt": "2019-10-11T14:13:31.749Z",
            "DataSetId": "1EXAMPLE404460dc9b005a0d9EXAMPLE2f",
            "Comment": "initial data revision",
            "Finalized": true,
            "Id": "e5EXAMPLE224f879066f9999EXAMPLE42",
            "Arn": "arn:aws:dataexchange:us-east-1:123456789012:data-sets/1EXAMPLE404460dc9b005a0d9EXAMPLE2f/revisions/e5EXAMPLE224f879066f9999EXAMPLE42",
            "CreatedAt": "2019-10-11T14:11:58.064Z"
        }
```

## 資料集
<a name="data-sets-concept"></a>

中的資料集 AWS Data Exchange 是可隨時間變更**的資料收集。

當收件人或訂閱者存取檔案資料集時，他們會存取資料集中的特定修訂。此結構可讓提供者在一段時間內變更資料集中的可用資料，而不必擔心歷史資料的變更。

當收件人或訂閱者存取 API 資料集時，他們會存取包含 API 資產的資料集，讓訂閱者能夠對 AWS Data Exchange受管端點進行 API 呼叫，然後透過供應商端點代理。

當收件人或訂閱者存取 Amazon Redshift 資料集時，他們會存取 AWS Data Exchange Amazon Redshift 的資料共用。此資料共用可讓訂閱者唯讀存取資料擁有者新增至資料共用的結構描述、資料表、檢視和使用者定義函數。

當收件人或訂閱者存取 AWS Lake Formation 資料許可資料集時，他們會存取標記有資料集擁有者所指定 LF 標籤的資料庫、資料表和/或資料欄。

當收件人或訂閱者存取 Amazon S3 資料存取資料集時，會授予他們對提供者 Amazon S3 儲存貯體中託管的共用 Amazon S3 物件的唯讀存取權。收件人或訂閱者可以直接將此資料與其他 搭配使用 AWS 服務。

若要建立、檢視、更新或刪除資料集，供應商可以使用 AWS Data Exchange 主控台、 AWS CLI、您自己的 REST 用戶端或其中一個 AWS SDKs。如需以程式設計方式管理 AWS Data Exchange 資料集的詳細資訊，請參閱 [AWS Data Exchange API 參考](https://docs.aws.amazon.com/data-exchange/latest/apireference/welcome.html)。

**Topics**
+ [擁有的資料集](#owned-data-sets)
+ [已授權的資料集](#entitled-data-sets)
+ [資料集類型](#data-set-types)
+ [Amazon S3 資料存取資料集](#s3-data-set-type)
+ [AWS Lake Formation 資料集 （預覽）](#LF-data-set-type)
+ [AWS 區域 和 資料集](#data-set-regions)
+ [資料集結構](#data-set-structure)
+ [資料集最佳實務](#data-set-best-practices)

### 擁有的資料集
<a name="owned-data-sets"></a>

資料集是由建立資料集的帳戶所擁有。您可以使用 參數識別擁有的資料集，該`origin`參數設定為 `OWNED`。

### 已授權的資料集
<a name="entitled-data-sets"></a>

具備權限的資料集是寄件者擁有的資料集的唯讀檢視。授權的資料集會在資料授予建立或產品發佈時建立，並提供給擁有有效資料授予或產品訂閱的收件人或訂閱者。您可以使用 參數來識別具備權限的資料集，該`origin`參數設為 `ENTITLED`。

身為收件人，您可以使用 API 或在 AWS Data Exchange 主控台中檢視並與您的授權資料集 AWS Data Exchange 互動。

身為資料集擁有者，您也可以存取收件人或訂閱者看到的具備權限的資料集檢視。您可以使用 AWS Data Exchange API，或在 AWS Data Exchange 主控台的資料授予或產品頁面中選擇資料集名稱。

### 資料集類型
<a name="data-set-types"></a>

支援以下資料集類型 AWS Data Exchange：
+ [檔案資料集](#S3-object-data-set-type)
+ [API 資料集](#api-data-set-type)
+ [Amazon Redshift 資料集](#RS-data-set-type)
+ [Amazon S3 資料存取資料集](#s3-data-set-type)
+ [AWS Lake Formation 資料集 （預覽）](#LF-data-set-type)

#### 檔案資料集
<a name="S3-object-data-set-type"></a>

檔案資料集是包含 Amazon S3 允許之一般檔案的資料集。

身為收件人或訂閱者，您可以將資料匯出至本機 （下載至您的電腦） 或 Amazon S3 儲存貯體。

身為資料集擁有者，您可以從 Amazon S3 儲存貯體匯入任何類型的一般檔案，並將其新增至資料集。

#### API 資料集
<a name="api-data-set-type"></a>

API 資料集是包含 API 資產的資料集。API 資產可讓收件人或訂閱者對 AWS Data Exchange受管端點進行 API 呼叫，然後代理至資料集擁有者端點。

身為資料集擁有者，您可以在 Amazon API Gateway 中建立 API，並將其新增至資料集，以在資料授予建立或訂閱時授權存取您的 API。

#### Amazon Redshift 資料集
<a name="RS-data-set-type"></a>

Amazon Redshift 資料集包含 Amazon Redshift AWS Data Exchange 的資料共用。當您使用資料共用訂閱資料集時，系統會將您新增為資料共用的取用者。這可讓您唯讀存取資料集擁有者新增至資料共用的結構描述、資料表、檢視和使用者定義函數。

身為資料集擁有者，您可以從 Amazon Redshift 中的資料共用建立資料庫，然後查詢即時資料，而無需擷取、轉換和載入檔案。當您的資料授予或訂閱啟用時，您會自動獲得資料共用的存取權，並在其中任一個過期後失去存取權。

身為資料集擁有者，您可以在 Amazon Redshift 中建立資料共用，並將其新增至資料集，以在資料授予建立或訂閱時授權對資料共用的存取。

### Amazon S3 資料存取資料集
<a name="s3-data-set-type"></a>

使用 AWS Data Exchange for Amazon S3 資料存取，資料接收者或訂閱者可以直接從資料集擁有者的 Amazon S3 儲存貯體存取第三方資料檔案。

當您訂閱 AWS Data Exchange for Amazon S3 資料存取產品時， AWS Data Exchange 會自動執行下列動作：
+ 佈建 Amazon S3 存取點。Amazon S3 存取點是 Amazon S3 的一項功能，可簡化與 Amazon S3 儲存貯體的資料共用。
+ 更新 S3 存取點資源政策，以授予您唯讀存取。

使用 AWS Data Exchange for Amazon S3，資料集擁有者可以直接存取整個 Amazon S3 儲存貯體或特定字首和 Amazon S3 物件。此外， AWS Data Exchange 可用於自動管理資料授權、訂閱、權利、帳單和付款。

### AWS Lake Formation 資料集 （預覽）
<a name="LF-data-set-type"></a>

 AWS Lake Formation 資料集是包含 AWS Lake Formation 資料許可資產的資料集。

身為資料接收者或訂閱者，您可以管理 中提供給您的資料 AWS Lake Formation。在 中建立資源連結後 AWS Lake Formation，您可以使用 Amazon Athena 等分析服務來查詢資料。

身為資料集擁有者，您可以在 中使用 LF 標籤來標記資料， AWS Lake Formation 並在建立資料集時將這些標籤匯入為資產。

### AWS 區域 和 資料集
<a name="data-set-regions"></a>

您的資料集可以位於任何支援的 中 AWS 區域，但單一資料授權或產品中的所有資料集都必須位於相同的 中 AWS 區域。

### 資料集結構
<a name="data-set-structure"></a>

資料集具有下列參數：
+ `Name` – 資料集的名稱。此值的長度上限為 256 個字元。
+ `Description` – 資料集的描述。此值的長度上限為 16，348 個字元。
+ `AssetType` – 定義資料集包含的資產類型。
+ `Origin` – 由帳戶 （適用於提供者） 或`Entitled`帳戶 （適用於訂閱者） `Owned` 將資料集定義為 的屬性。
+ `Id` – 唯一識別資料集的 ID。資料集 IDs會在建立資料集時產生。具備權限的資料集具有與原始擁有的資料集不同的 ID。
+ `Arn` – AWS 資源名稱的唯一識別符。
+ `CreatedAt` 和 `UpdatedAt` – 建立和上次更新資料集的日期和時間戳記。

**注意**  
身為資料集擁有者，您可以變更一些擁有的資料集屬性，例如**名稱**或**描述**。更新 擁有的資料集中的屬性不會更新對應具備權限資料集中的屬性。

**Example 資料集資源**  

```
{
    "Origin": "OWNED", 
    "AssetType": "S3_SNAPSHOT", 
    "Name": "MyDataSetName", 
    "CreatedAt": "2019-09-09T19:31:49.704Z", 
    "UpdatedAt": "2019-09-09T19:31:49.704Z", 
    "Id": "fEXAMPLE1fd9a5c8b0d2e6fEXAMPLEe1", 
    "Arn": "arn:aws:dataexchange:us-east-2:123456789109:data-sets/fEXAMPLE1fd9a5c8b0d2e6fEXAMPLEe1", 
    "Description": "This is my data set's description that describes the contents of the data set."
}
```

### 資料集最佳實務
<a name="data-set-best-practices"></a>

身為資料集擁有者，當您建立和更新資料集時，請記住下列最佳實務：
+ 資料集的名稱會顯示在 目錄中的資料授予或產品詳細資訊中。我們建議您選擇簡潔的描述性名稱，以便客戶輕鬆了解資料集的內容。
+ 對產品進行作用中資料授予或訂閱的收件人或訂閱者可以看到此描述。我們建議您包含涵蓋範圍資訊，以及資料集的功能和優點。

## Tags (標籤)
<a name="data-set-tags"></a>

您可以將標籤新增至您擁有的資料集及其修訂。使用標記時，您也可以在 AWS Identity and Access Management (IAM) 政策中使用標籤型存取控制來控制對這些資料集和修訂的存取。

無法標記具備權限的資料集。擁有的資料集及其修訂的標籤不會傳播到其對應的授權版本。具體而言，有權讀取資料集和修訂的收件人或訂閱者不會看到原始擁有資料集的標籤。

**注意**  
目前，資產和任務不支援標記。