バッチ予測データセットの要件 - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

バッチ予測データセットの要件

バッチ予測を行うには、データセットが「データセットを作成する」で説明されている要件を満たしていることを確認します。データセットが 5 GB を超える場合、Canvas では Amazon EMR Serverless を使用してデータを処理し、より小さなバッチに分割します。データが分割されると、Canvas は SageMaker AI バッチ変換を使用して予測を行います。バッチ予測の実行後に、これらのサービスの両方から料金が発生する場合があります。詳細については、「Canvas の料金」を参照してください。

一部のデータセットが互換性のないスキーマを持っている場合、予測を実行できないことがあります。スキーマとは組織構造のことです。表形式のデータセットの場合は、列の名前と列内のデータのデータ型がスキーマになります。互換性のないスキーマは、次のような理由から発生することがあります。

  • 予測に使用するデータセットの列数が、モデルの構築に使用するデータセットよりも少ない。

  • データセットの構築に使用した列のデータ型が、予測に使用するデータセットのデータ型と異なる。

  • 予測に使用するデータセットとモデルの構築に使用したデータセットに、一致しない列名がある。列名では大文字と小文字が区別されます。Column1column1 は区別されます。

バッチ予測を正常に行うには、バッチ予測データセットのスキーマを、モデルのトレーニングに使用したデータセットと一致させます。

注記

バッチ予測では、モデルの構築時にいずれかの列をドロップすると、Canvas は削除された列を予測結果に戻します。ただし、Canvas はドロップされた列を時系列モデルのバッチ予測に追加しません。