翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
バッチ予測データセットの要件
バッチ予測を行うには、データセットが「データセットを作成する」で説明されている要件を満たしていることを確認します。データセットが 5 GB を超える場合、Canvas では Amazon EMR Serverless を使用してデータを処理し、より小さなバッチに分割します。データが分割されると、Canvas は SageMaker AI バッチ変換を使用して予測を行います。バッチ予測の実行後に、これらのサービスの両方から料金が発生する場合があります。詳細については、「Canvas の料金
一部のデータセットが互換性のないスキーマを持っている場合、予測を実行できないことがあります。スキーマとは組織構造のことです。表形式のデータセットの場合は、列の名前と列内のデータのデータ型がスキーマになります。互換性のないスキーマは、次のような理由から発生することがあります。
-
予測に使用するデータセットの列数が、モデルの構築に使用するデータセットよりも少ない。
-
データセットの構築に使用した列のデータ型が、予測に使用するデータセットのデータ型と異なる。
-
予測に使用するデータセットとモデルの構築に使用したデータセットに、一致しない列名がある。列名では大文字と小文字が区別されます。
Column1
とcolumn1
は区別されます。
バッチ予測を正常に行うには、バッチ予測データセットのスキーマを、モデルのトレーニングに使用したデータセットと一致させます。
注記
バッチ予測では、モデルの構築時にいずれかの列をドロップすると、Canvas は削除された列を予測結果に戻します。ただし、Canvas はドロップされた列を時系列モデルのバッチ予測に追加しません。