ランダムサンプル - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ランダムサンプル

SageMaker Canvas はランダムサンプリング方法を使用してデータセットをサンプリングします。ランダムサンプリング法では、サンプルに選択される確率はすべての行で等しくなります。プレビューで列を選択すると、ランダムサンプルの要約統計 (平均やモードなど) を取得できます。

デフォルトでは、 SageMaker Canvas は 20,000 行を超えるデータセットに対して、データセットから 20,000 行のランダムサンプルサイズを使用します。20,000 行未満のデータセットの場合、デフォルトのサンプルサイズはデータセットの全行数になります。 SageMaker Canvas アプリケーションのビルドタブでランダムサンプルを選択して、サンプルサイズを増減できます。スライダーを使用して目的のサンプルサイズを選択し、[更新] を選択してサンプルサイズを変更します。データセットに選択できる最大サンプルサイズは 40,000 行で、最小サンプルサイズは 500 行です。サンプルサイズを大きくすると、データセットのプレビューと要約統計が再度読み込まれるまでに時間がかかることがあります。

[モデルの構築] ページには、データセットの 100 行のプレビューが表示されます。サンプルサイズがデータセットと同じサイズの場合、プレビューではデータセットの最初の 100 行が使用されます。それ以外の場合、プレビューではランダムサンプルの最初の 100 行が使用されます。