Amazon ML での Amazon S3 の使用 - Amazon Machine Learning

Amazon Machine Learning サービスの更新や、その新しいユーザーの受け入れは行っていません。このドキュメントは既存のユーザー向けに提供されていますが、更新は終了しています。詳細については、「Amazon Machine Learning とは」を参照してください。

Amazon ML での Amazon S3 の使用

Amazon Simple Storage Service(Amazon S3)は、インターネット用のストレージです。Simple Storage Service (Amazon S3) を使用すると、いつでもウェブ上の任意の場所から任意の量のデータを保存および取得できます。Amazon ML はプライマリデータのリポジトリとして以下のタスクで Amazon S3 を使用します。

  • 入力ファイルにアクセスして、ML モデルのトレーニングおよび評価用のデータソースオブジェクトを作成する。

  • 入力ファイルにアクセスしてバッチ予測を生成する。

  • ML モデルを使用してバッチ予測を生成する際、指定した S3 バケットに予測ファイルを出力する。

  • Amazon Redshift または Amazon Relational Database Service (Amazon RDS) に保存したデータを .csv ファイルにコピーして、Amazon S3 にアップロードする。

Amazon ML がこれらのタスクを実行するには、Amazon S3 データにアクセスするためのアクセス権限を Amazon ML に付与する必要があります。

注記

サーバー側の暗号化ファイルのみを受け入れる S3 バケットにバッチ予測ファイルを出力することはできません。リクエストに Deny ヘッダーがない場合、ポリシーに s3:PutObject アクションの s3:x-amz-server-side-encryption 効果が含まれていないことを確認することにより、バケットポリシーが暗号化されていないファイルのアップロードを許可することを確認してください。S3 サーバー側の暗号化バケットポリシーの詳細については、「Amazon Simple Storage Service ユーザーガイド」の「サーバー側の暗号化を使用したデータの保護」を参照してください。

Amazon S3 へのデータのアップロード

Amazon ML は Amazon S3の場所からデータを読み取るため、Amazon Simple Storage Service (Amazon S3) に入力データをアップロードする必要があります。データを Amazon S3 に直接アップロードする (例えば、コンピュータなどから)、または、Amazon ML が Amazon Redshift または Amazon Relational Database Service (RDS) に保存してあるデータを .csv ファイルにコピーして Amazon S3 にアップロードすることができます。

Amazon Redshift または Amazon RDS からのデータのコピーの詳細については、「Amazon ML での Amazon Redshift の使用」または「Amazon ML での Amazon RDS の使用」をそれぞれ参照してください。

このセクションの残りの部分では、入力データをコンピュータから直接 Amazon S3 にアップロードする方法について説明します。このセクションの手順を開始する前に、データを .csv ファイルで持っている必要があります。Amazon ML で使用できるように .csv ファイルを正しくフォーマットする方法の詳細については、「Amazon ML のデータ形式を理解する」を参照してください。

データをコンピュータから Amazon S3 にアップロードするには
  1. AWS マネジメントコンソールにサインインして Amazon S3 コンソール (https://console.aws.amazon.com/s3/) を開きます。

  2. バケットを作成するか、既存のバケットを選択します。

    1. バケットを作成するには、[バケットの作成] を選択します。バケットに名前を付け、リージョンを選択 (使用可能な任意のリージョンを選択) した後、[作成] を選択します。詳細については、Amazon Simple Storage 入門ガイドの「バケットの作成」を参照してください。

    2. 既存のバケットを使用するには、[すべてのバケット] のリストでバケットを選択することによりバケットを検索します。バケット名が表示されたら、それを選択して、[アップロード] を選択します。

  3. [アップロード] ダイアログボックスで、[ファイルを追加] を選択します。

  4. 入力データの .csv ファイルを含むフォルダに移動し、[開く] を選択します。

許可

Amazon ML がいずれかの S3 バケットにアクセスするためのアクセス権限を付与するため、バケットポリシーを編集する必要があります。

Amazon ML に Amazon S3 内のバケットからデータを読み込むためのアクセス権限を付与することの詳細については、「Amazon S3 からデータを読み込むためのアクセス許可を Amazon ML に付与する」を参照してください。

Amazon ML に Amazon S3 内のバケットへバッチ予測結果を出力するためのアクセス許可の付与の詳細については、「Amazon S3 に予測を出力するためのアクセス許可を Amazon ML に付与する」を参照してください。

Amazon S3 リソースへのアクセス権限の管理の詳細については、「Amazon S3 開発者ガイド」を参照してください。