

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# ラベル付けするデータを選択する
<a name="sms-data-filtering"></a>

Amazon SageMaker AI コンソールを使用して、データセットの一部をラベル付けに選択できます。データは Amazon S3 バケットに保存されている必要があります。次の 3 つの選択肢があります。
+ 完全なデータセットを使用する。
+ ランダムに選択されたサンプルデータセットを選択する。
+ クエリを使用してデータセットのサブセットを指定する。

次のオプションは、**[ラベリングジョブの作成]** を選択した後、[SageMaker AI コンソール](https://console.aws.amazon.com/sagemaker/groundtruth)の **[ラベリングジョブ]** セクションに表示されます。コンソールでラベル付けジョブを作成する方法については、「[開始方法: Ground Truth を使用して境界ボックスラベル付けジョブを作成する](sms-getting-started.md)」を参照してください。ラベル付けに使用するデータセットを設定するには、**[ジョブの概要]** セクションで **[追加の設定]** を選択します。

## 完全なデータセットを使用する
<a name="sms-full-dataset"></a>

**完全なデータセット**の使用を選択した場合、データオブジェクトのマニフェストファイルを指定する必要があります。マニフェストファイルを含む Amazon S3 バケットのパスを指定するか、SageMaker AI コンソールを使用してそのファイルを作成できます。コンソールを使用してマニフェストファイルを作成するには、「[ラベル付けジョブのデータ設定を自動化する](sms-console-create-manifest-file.md)」を参照してください。

## ランダムサンプルを選択する
<a name="sms-random-dataset"></a>

データのランダムなサブセットにラベル付けする場合は、**[Random sample)]** (ランダムサンプル) を選択します。このデータセットは、**[Input dataset location]** (入力データセットの場所) フィールドに指定された Amazon S3 バケットに保存されます。

サンプルに含めるデータオブジェクトの割合を指定したら、**[Create subset]** (サブセットの作成) を選択します。SageMaker AI によって、ラベル付けジョブ用のデータオブジェクトがランダムに選択されます。オブジェクトが選択されたら、**[Use this subset]** (このサブセットを使用する) を選択します。

SageMaker AI によって、選択したデータオブジェクトのマニフェストファイルが作成されます。また、新しいマニフェストファイルを参照するように、**[Input dataset location]** (入力データセットの場所) フィールドの値を変更します。

## サブセットを指定する
<a name="sms-select-dataset"></a>

**Amazon S3 Select**  
新規のお客様への Amazon S3 Select の提供は終了しました。Amazon S3 Select をご利用の既存のお客様は、今後も通常どおり使用できます。詳細については、[「How to optimize querying your data in Amazon S3」](https://aws.amazon.com/blogs/storage/how-to-optimize-querying-your-data-in-amazon-s3/)を参照してください。

オブジェクトファイル名を対象とする Amazon S3 `SELECT` クエリを使用して、データオブジェクトのサブセットを指定できます。

SQL クエリの `SELECT` ステートメントが自動的に定義されます。返されるデータオブジェクトを指定するには、`WHERE` 句を指定します。

Amazon S3 `SELECT` ステートメントの詳細については、「[オブジェクトからのコンテンツの選択](https://docs.aws.amazon.com/AmazonS3/latest/dev/selecting-content-from-objects.html)」を参照してください。

選択処理を開始するために **[Create subset]** (サブセットを作成する) を選択してから、選択されたデータを使用するために **[Use this subset]** (このサブセットを使用する) を選択します。

SageMaker AI によって、選択したデータオブジェクトのマニフェストファイルが作成されます。また、新しいマニフェストファイルを参照するように、**[Input dataset location (入力データセットの場所)]** フィールドの値を更新します。