機械学習
Amazon Redshift 機械学習 (Amazon Redshift ML) は、どの技術レベルのアナリストやデータサイエンティストでも、機械学習のテクノロジーを簡単に使用できる堅牢なクラウドベースのサービスです。Amazon Redshift ML はモデルを使用して結果を生成します。モデルは以下のように使用できます。
Amazon Redshift へのデータ入力に関連付けられた、モデルとメタデータをトレーニングするデータを指定します。それを受けて Amazon Redshift ML が、入力データのパターンを捉えるモデルを Amazon SageMaker AI で作成します。モデルに独自のデータを使用することで、Amazon Redshift ML を使用して、顧客の離反予測、ライフタイムバリュー、収益予測などのデータの傾向を特定できます。これらのモデルを使用して、追加のコストを発生させることなく、新しい入力データの予測を生成できます。
Claude や Amazon Titan など、Amazon Bedrock が提供する基盤モデル (FM) のいずれかを使用できます。Amazon Bedrock を使用すると、大規模言語モデル (LLM) のパワーと Amazon Redshift の分析データを少ない手順で組み合わせることができます。外部の大規模言語モデル (LLM) を使用すると、Amazon Redshift を使用して、データに対して自然言語処理 (NLP) を実行できます。NLP は、テキスト生成、感情分析、翻訳などのアプリケーションに使用できます。Amazon Bedrock と Amazon Redshift の連携については、「Amazon Redshift ML と Amazon Bedrock の統合」を参照してください。
注記
サービス改善のためのデータ使用をオプトアウトする
Amazon Bedrock モデルを使用していて、サービス改善のために AWS でデータを処理しない場合は、Amazon Bedrock のオプトアウトポリシーを有効にする必要があります。
注記
LLM は、不正確または不完全な情報を生成する可能性があります。LLM が生成する情報を検証して、正確性と完全性を確認することをお勧めします。
Amazon Redshift ML と Amazon SageMaker AI の連携の仕組み
Amazon Redshift は Amazon SageMaker AI Autopilot と連携して、最適なモデルを自動的に取得し、Amazon Redshift で予測関数を利用できるようにします。
次の図は、Amazon Redshift 機械学習の仕組みを示しています。

一般的なワークフローは次のとおりです。
-
Amazon Redshift は、トレーニングデータを Amazon S3 にエクスポートします。
-
Amazon SageMaker AI Autopilot がトレーニングデータを前処理します。前処理では、欠損値の補完などの重要な機能を担います。特定の列がカテゴリ (郵便番号など) であることを認識し、トレーニング用に適切にフォーマットし、他の多くのタスクを実行します。トレーニングデータセットに最適なプリプロセッサを選ぶこと自体が 1 つの課題ですが、Amazon SageMaker AI Autopilot はその解決を自動化します。
-
Amazon SageMaker AI Autopilot が、最も予測精度の高いモデルを実現するアルゴリズムとアルゴリズムハイパーパラメータを見つけます。
-
Amazon Redshift は、予測関数を SQL 関数として Amazon Redshift クラスターに登録します。
-
CREATE MODEL ステートメントを実行すると、Amazon Redshift はトレーニングに Amazon SageMaker AI を使用します。したがって、モデルのトレーニングには関連するコストがかかります。これは、AWS の請求書に Amazon SageMaker AI の明細項目として別途記載されます。また、トレーニングデータを保存するために Amazon S3 で使用されるストレージについてもお支払いいただきます。Redshift クラスター上でコンパイルと実行が可能な、CREATE MODEL で作成されたモデルを使用した推論に対しては課金されません。Amazon Redshift ML を使用する場合 Amazon Redshift の追加料金は発生しません。