使用に関する注意事項
CREATE MODEL を使用するときは、次の点を考慮してください。
CREATE MODEL ステートメントは非同期モードで動作し、Amazon S3 へのトレーニングデータのエクスポート時に戻ります。Amazon SageMaker AI でのトレーニングの残りのステップは、バックグラウンドで行われます。トレーニングが進行している間は、対応する推論関数が表示されますが、実行することはできません。STV_ML_MODEL_INFO にクエリを実行して、トレーニングの状態を確認できます。
トレーニングはバックグラウンドで最大 90 分間実行できますが、デフォルトでは自動モデルで実行し、延長することもできます。DROP MODEL コマンドを実行するだけで、トレーニングをキャンセルできます。
モデルの作成に使用する Amazon Redshift クラスターと、トレーニングデータとモデルアーティファクトのステージングに使用される Amazon S3 バケットは、同じ AWS リージョンに置かれている必要があります。
モデルトレーニング中に、Amazon Redshift と SageMaker AI は、指定された Amazon S3 バケットに中間アーティファクトを保存します。Amazon Redshift のデフォルトでは、CREATE MODEL オペレーションの最後にガベージコレクションが実行されます。Amazon Redshift は、Amazon S3 からこれらのオブジェクトを削除します。これらのアーティファクトを Amazon S3 で保持するには、S3_GARBAGE COLLECT OFF オプションを設定します。
FROM 句で提供されるトレーニングデータには、少なくとも 500 行を使用する必要があります。
CREATE MODEL ステートメントを使用する場合、FROM { table_name | ( select_query ) } 句には、最大 256 個の特徴 (入力) 列しか指定できません。
AUTO ON の場合、トレーニングセットとして使用できる列タイプは、SMALLINT、INTEGER、BIGINT、DECIMAL、REAL、DOUBLE、BOOLEAN、CHAR、VARCHAR、DATE、TIME、TIMMETZ、TIMETZ TIMESTAMP、TIMESTAMPTZ です。AUTO OFF の場合、トレーニングセットとして使用できる列タイプは、SMALLINT、INTEGER、BIGINT、DECIMAL、REAL、DOUBLE、BOOLEAN です。
ターゲット列のデータ型として、DECIMAL、DATE、TIME、TIMETZ、TIMESTAMP、TIMESTAMPTZ、GEOMETRY、GEOGRAPHY、HLLSKETCH、SUPER、または VARBYTE を使用することはできません。
モデルの精度を上げるには、以下のいずれかを実行します。
FROM 句でトレーニングデータを指定するときに、CREATE MODEL コマンドに関連する列をできるだけ多く追加します。
MAX_RUNTIME と MAX_CELLS にはより大きな値を使用してください。このパラメータの値を大きくすると、モデルのトレーニングにかかるコストが増加します。
トレーニングデータが計算され、Amazon S3 バケットにエクスポートされるとすぐに CREATE MODEL ステートメントの実行が返されます。その後、SHOW MODEL コマンドを使用して、トレーニングのステータスを確認できます。バックグラウンドでトレーニングされているモデルに障害が発生した場合は、SHOW MODEL を使用してエラーを確認できます。失敗したモデルを再試行することはできません。DROP MODEL を使用すると、失敗したモデルを削除し、新しいモデルを再作成できます。SHOW MODEL の詳細については、「SHOW MODEL」を参照してください。
ローカル BYOM は、Amazon Redshift ML が BYOM 以外の場合にサポートするのと同じ種類のモデルをサポートします。Amazon Redshift は、プレーンな XGBoost (XGBoost バージョン 1.0 以降を使用)、プリプロセッサを使用しない KMEANS モデル、Amazon SageMaker AI Autopilot によってトレーニングされた XGBoost/MLP/線形学習モデルをサポートします。後者は、Autopilot で指定されたプリプロセッサに Amazon SageMaker AI Neo も対応している場合に、サポートされます。
Amazon Redshift クラスターで仮想プライベートクラウド (VPC) に対して拡張ルーティングが有効になっている場合は、クラスターが配置されている VPC 用の Amazon S3 VPC エンドポイントと SageMaker AI VPC エンドポイントを作成してください。これにより、CREATE MODEL の実行中にトラフィックがこれらのサービス間で VPC を通過できるようになります。詳細については、「SageMaker AI Clarify Job Amazon VPC Subnets and Security Groups」を参照してください。