使用に関する注意事項 - Amazon Redshift

使用に関する注意事項

CREATE MODEL を使用するときは、次の点を考慮してください。

  • CREATE MODEL ステートメントは非同期モードで動作し、Amazon S3 へのトレーニングデータのエクスポート時に戻ります。Amazon SageMaker AI でのトレーニングの残りのステップは、バックグラウンドで行われます。トレーニングが進行している間は、対応する推論関数が表示されますが、実行することはできません。STV_ML_MODEL_INFO にクエリを実行して、トレーニングの状態を確認できます。

  • トレーニングはバックグラウンドで最大 90 分間実行できますが、デフォルトでは自動モデルで実行し、延長することもできます。DROP MODEL コマンドを実行するだけで、トレーニングをキャンセルできます。

  • モデルの作成に使用する Amazon Redshift クラスターと、トレーニングデータとモデルアーティファクトのステージングに使用される Amazon S3 バケットは、同じ AWS リージョンに置かれている必要があります。

  • モデルトレーニング中に、Amazon Redshift と SageMaker AI は、指定された Amazon S3 バケットに中間アーティファクトを保存します。Amazon Redshift のデフォルトでは、CREATE MODEL オペレーションの最後にガベージコレクションが実行されます。Amazon Redshift は、Amazon S3 からこれらのオブジェクトを削除します。これらのアーティファクトを Amazon S3 で保持するには、S3_GARBAGE COLLECT OFF オプションを設定します。

  • FROM 句で提供されるトレーニングデータには、少なくとも 500 行を使用する必要があります。

  • CREATE MODEL ステートメントを使用する場合、FROM { table_name | ( select_query ) } 句には、最大 256 個の特徴 (入力) 列しか指定できません。

  • AUTO ON の場合、トレーニングセットとして使用できる列タイプは、SMALLINT、INTEGER、BIGINT、DECIMAL、REAL、DOUBLE、BOOLEAN、CHAR、VARCHAR、DATE、TIME、TIMMETZ、TIMETZ TIMESTAMP、TIMESTAMPTZ です。AUTO OFF の場合、トレーニングセットとして使用できる列タイプは、SMALLINT、INTEGER、BIGINT、DECIMAL、REAL、DOUBLE、BOOLEAN です。

  • ターゲット列のデータ型として、DECIMAL、DATE、TIME、TIMETZ、TIMESTAMP、TIMESTAMPTZ、GEOMETRY、GEOGRAPHY、HLLSKETCH、SUPER、または VARBYTE を使用することはできません。

  • モデルの精度を上げるには、以下のいずれかを実行します。

    • FROM 句でトレーニングデータを指定するときに、CREATE MODEL コマンドに関連する列をできるだけ多く追加します。

    • MAX_RUNTIME と MAX_CELLS にはより大きな値を使用してください。このパラメータの値を大きくすると、モデルのトレーニングにかかるコストが増加します。

  • トレーニングデータが計算され、Amazon S3 バケットにエクスポートされるとすぐに CREATE MODEL ステートメントの実行が返されます。その後、SHOW MODEL コマンドを使用して、トレーニングのステータスを確認できます。バックグラウンドでトレーニングされているモデルに障害が発生した場合は、SHOW MODEL を使用してエラーを確認できます。失敗したモデルを再試行することはできません。DROP MODEL を使用すると、失敗したモデルを削除し、新しいモデルを再作成できます。SHOW MODEL の詳細については、「SHOW MODEL」を参照してください。

  • ローカル BYOM は、Amazon Redshift ML が BYOM 以外の場合にサポートするのと同じ種類のモデルをサポートします。Amazon Redshift は、プレーンな XGBoost (XGBoost バージョン 1.0 以降を使用)、プリプロセッサを使用しない KMEANS モデル、Amazon SageMaker AI Autopilot によってトレーニングされた XGBoost/MLP/線形学習モデルをサポートします。後者は、Autopilot で指定されたプリプロセッサに Amazon SageMaker AI Neo も対応している場合に、サポートされます。

  • Amazon Redshift クラスターで仮想プライベートクラウド (VPC) に対して拡張ルーティングが有効になっている場合は、クラスターが配置されている VPC 用の Amazon S3 VPC エンドポイントと SageMaker AI VPC エンドポイントを作成してください。これにより、CREATE MODEL の実行中にトラフィックがこれらのサービス間で VPC を通過できるようになります。詳細については、「SageMaker AI Clarify Job Amazon VPC Subnets and Security Groups」を参照してください。