

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# ステップ 1: Amazon S3 にドキュメントを追加する
<a name="tutorial-reviews-add-docs"></a>

Amazon Comprehend 分析ジョブを開始するには、カスタマーレビューのサンプルデータセットを Amazon Simple Storage Service (Amazon S3) に保存しておく必要があります。Amazon S3 は、バケットと呼ばれるコンテナにデータを保存します。Amazon Comprehend は、バケットに保存されているドキュメントを分析し、その分析結果をバケットに送信します。このステップでは、S3 バケットを作成して、バケットに入出力フォルダを作成し、バケットにサンプルデータセットをアップロードします。

**Topics**
+ [前提条件](#tutorial-reviews-add-docs-prereqs)
+ [サンプルデータをダウンロードする](#tutorial-reviews-add-docs-download)
+ [Amazon S3 バケットを作成する](#tutorial-reviews-add-docs-bucket)
+ [フォルダーを作成する (コンソールのみ)](#tutorial-reviews-add-docs-folders)
+ [入力データをアップロードする](#tutorial-reviews-add-docs-upload)

## 前提条件
<a name="tutorial-reviews-add-docs-prereqs"></a>

この手順を開始するにあたっては、[チュートリアル:Amazon Comprehend を使用してカスタマーレビューからインサイトを分析する](tutorial-reviews.md) を確認して前提条件を完了しておいてください。

## サンプルデータをダウンロードする
<a name="tutorial-reviews-add-docs-download"></a>

次のサンプルデータセットには、より大きなデータセット「Amazon reviews-Full」から取得した Amazon レビューが含まれています。このデータセットは、「Character-level Convolutional Networks for Text Classification」(Xiang Zhang その他、2015 年) という記事と共に公開されたものです。データセットをコンピュータにダウンロードします。　

**サンプルデータを取得する**

1. zip ファイル [tutorial-reviews-data.zip](samples/tutorial-reviews-data.zip) をコンピューターにダウンロードします。

1. コンピューター上の zip ファイルを解凍します。2 つのファイルがあります。ファイル `THIRD_PARTY_LICENSES.txt` は Xiang Zhang その他が公開したデータセットのオープンソースライセンスです。ファイル `amazon-reviews.csv` は、チュートリアルで分析するデータセットです。

## Amazon S3 バケットを作成する
<a name="tutorial-reviews-add-docs-bucket"></a>

サンプルデータセットをダウンロードしたら、入出力データを保存するための Amazon S3 バケットを作成します。S3 バケットは、Amazon S3 コンソールまたは AWS Command Line Interface (AWS CLI) を使用して作成できます。

### Amazon S3 バケットを作成する (コンソール)
<a name="tutorial-reviews-add-docs-bucket-console"></a>

Amazon S3 コンソールで、すべて AWSにおいて一意の名前でバケットを作成します。

**S3 バケットを作成する (コンソール)**

1. にサインイン AWS マネジメントコンソール し、[https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/) で Amazon S3 コンソールを開きます。

1. **[Buckets]** (バケット) で、**[Create bucket]** (バケットの作成) を選択します。

1. **[バケット名]** では、バケットの目的を説明するグローバルに一意の名前を入力します。

1. **リージョン** で、バケットを作成する AWS リージョンを選択します。選択するリージョンは Amazon Comprehend に対応している必要があります。レイテンシーを減らすには、Amazon Comprehend でサポートされている地理的な場所に最も近い AWS リージョンを選択します。Amazon Comprehend に対応しているリージョンについては、『グローバル・インフラストラクチャー・ガイド』の 「[リージョン表](https://aws.amazon.com/about-aws/global-infrastructure/regional-product-services/)」 を参照してください。

1. [**Object Ownership**]、[**Bucket settings for Block Public Access**]、 [**Bucket Versioning**] および [**Tags**] にデフォルトの設定を使用します。

1. **[Default encryption]** (デフォルトの暗号化) には、**[Disable]** (無効) を選択します。
**ヒント**  
このチュートリアルでは暗号化を使用しませんが、重要なデータを分析する場合は暗号化を使用することもできます。エンドツーエンドの暗号化では、バケットに保管中のデータばかりでなく、分析ジョブの実行時のデータも暗号化することができます。による暗号化の詳細については AWS、「 *AWS Key Management Service デベロッパーガイド*」の[「What is AWS Key Management Service?](https://docs.aws.amazon.com/kms/latest/developerguide/overview.html)」を参照してください。

1. バケットの設定を確認して、**[バケットの作成]**を選択します。

### Amazon S3 バケットを作成する (AWS CLI)
<a name="tutorial-reviews-add-docs-bucket-cli"></a>

を開くと AWS CLI、 `create-bucket` コマンドを実行して、入力データと出力データを保存するバケットを作成します。

**Amazon S3 バケットを作成するには (AWS CLI)**

1. バケットを作成するには、 AWS CLIで次のコマンドを実行します。amzn-s3-demo-bucket を、すべての で一意のバケットの名前に置き換えます AWS。

   ```
   aws s3api create-bucket --bucket amzn-s3-demo-bucket
   ```

   デフォルトでは、 `create-bucket` コマンドは `us-east-1` AWS リージョンにバケットを作成します。`us-east-1` 以外の AWS リージョン でバケットを作成するには、 `LocationConstraint` パラメーターを追加してリージョンを指定します。たとえば、次のコマンドは `us-west-2` リージョンにファイルシステムを作成しています。

   ```
   aws s3api create-bucket --bucket amzn-s3-demo-bucket
   --region us-west-2 --create-bucket-configuration LocationConstraint=us-west-2
   ```

   Amazon Comprehend に対応しているリージョンは限られていることに注意してください。Amazon Comprehend に対応しているリージョンについては、『グローバル・インフラストラクチャー・ガイド』の 「[リージョン表](https://aws.amazon.com/about-aws/global-infrastructure/regional-product-services/)」 を参照してください。

1. バケットが正常に作成されたことを確認するには、次のコマンドを使用します。このコマンドは、アカウントに関連付けられているすべての S3 バケットを一覧表示します。

   ```
   aws s3 ls
   ```

## フォルダーを作成する (コンソールのみ)
<a name="tutorial-reviews-add-docs-folders"></a>

次に S3 バケットに 2 つのフォルダを作成します。最初のフォルダは入力データ用です。2 つ目のフォルダは、Amazon Comprehend が分析結果の送信先になる場所です。Amazon S3 コンソールを使用する場合は、フォルダを手動で作成する必要があります。を使用する場合は AWS CLI、サンプルデータセットをアップロードするか、分析ジョブを実行するときにフォルダを作成できます。このため、ここではコンソールユーザー専用にフォルダを作成する手順を説明します。 AWS CLI を使用する場合は、[入力データをアップロードする](#tutorial-reviews-add-docs-upload) および [ステップ 3: Amazon S3 上のドキュメントに対する分析ジョブの実行](tutorial-reviews-analysis.md) にフォルダを作成します。

**S3 バケットにフォルダーを作成する (コンソール)**

1. Amazon S3 コンソール ([https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/)) を開きます。

1. [**バケット**] のバケットリストからバケットを選択します。

1. [**概要**] タブで [**フォルダーの作成**] を選択します。

1. 新しいフォルダ名に、`input` を入力します。

1. 暗号化設定では、[**なし (バケット設定を使用)**] を選択します。

1. **[保存]** を選択します。

1. ステップ 3 ～ 6 を繰り返して分析ジョブの出力用の別のフォルダーを作成します。ただし、ステップ 4 では新しいフォルダー名として `output` を入力します。

## 入力データをアップロードする
<a name="tutorial-reviews-add-docs-upload"></a>

バケットを作成しましたから、これでサンプルデータセット `amazon-reviews.csv` をアップロードできます。Amazon S3 コンソールまたは AWS CLIを使用して、S3 バケットにデータをアップロードできます。

### サンプルドキュメントをバケットにアップロードする(コンソール)
<a name="tutorial-reviews-add-docs-upload-console"></a>

Amazon S3 コンソールで、サンプルデータセットファイルを入力フォルダにアップロードします。

**サンプルドキュメントをアップロードする (コンソール)**

1. Amazon S3 コンソール ([https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/)) を開きます。

1. [**バケット**] のバケットリストからバケットを選択します。

1. `input` フォルダーを選択し、[**アップロード**] を選択します。

1. [**ファイルを追加**] を選択して、コンピューター上のファイル `amazon-reviews.csv` を選択します。

1. その他の設定はデフォルト値のままにしておきます。

1. **アップロード** を選択します。

### サンプルドキュメントをバケットにアップロードする (AWS CLI)
<a name="tutorial-reviews-add-docs-upload-cli"></a>

S3 バケットに入力フォルダを作成し、`cp` コマンドを使用してデータセットファイルをそのフォルダにアップロードします。

**サンプルドキュメントをアップロードする (AWS CLI)**

1. バケット内の新しいフォルダに`amazon-reviews.csv`ファイルをアップロードするには、次の AWS CLI コマンドを実行します。amzn-s3-demo-bucket を のバケット名に置き換えます。Amazon S3 は末尾にパス `/input/` を追加することで、バケットに自動的に `input` という名前の新しいフォルダを作成し、そのフォルダにデータセットファイルをアップロードします。

   ```
   aws s3 cp amazon-reviews.csv s3://amzn-s3-demo-bucket/input/
   ```

1. バケットが正常にアップロードされたことを確認するには、次のコマンドを使用します。このコマンドは、バケットの `input` フォルダー内容を一覧表示します。

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/input/
   ```

これで、`input` という名前のフォルダに `amazon-reviews.csv` ファイルを含む S3 バケットが作成されました。コンソールを使用した場合は、バケットに `output` フォルダも作成されます。を使用した場合は AWS CLI、Amazon Comprehend 分析ジョブの実行時に出力フォルダを作成します。