コンソールでの Amazon SageMaker Feature Store の使用 - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

コンソールでの Amazon SageMaker Feature Store の使用

重要

Amazon SageMaker Studio または Amazon SageMaker Studio Classic が Amazon SageMaker リソースを作成できるようにするカスタムIAMポリシーは、それらのリソースにタグを追加するアクセス許可も付与する必要があります。Studio と Studio Classic は、作成したリソースに自動的にタグ付けするため、リソースにタグを追加するアクセス許可が必要です。IAM ポリシーで Studio と Studio Classic がリソースの作成を許可しているが、タグ付けが許可されていない場合、リソースの作成を試みるとAccessDenied「」エラーが発生する可能性があります。詳細については、「リソースにタグ付けするための SageMakerアクセス許可を提供する」を参照してください。

AWS Amazon のマネージドポリシー SageMaker SageMaker リソースを作成するアクセス許可を付与する には、これらのリソースの作成中にタグを追加するアクセス許可が既に含まれています。

コンソールで Amazon SageMaker Feature Store を使用して、特徴量グループを作成、表示、更新、モニタリングできます。このガイドのモニタリングには、パイプラインの実行と特徴量グループの系統の表示が含まれます。このガイドでは、コンソールからこれらのタスクを実行する方法について説明します。

Amazon SageMaker APIs と を使用する Feature Store の例とリソースについては AWS SDK for Python (Boto3)、「」を参照してくださいAmazon SageMaker Feature Store リソース

コンソールから特徴量グループを作成する

特徴量グループの作成プロセスには次の 4 つのステップがあります。

  1. 特徴量グループ情報を入力します。

  2. 特徴量定義を入力します。

  3. 必要な特徴量を入力します。

  4. 特徴量グループタグを入力します。

ユースケースに合ったオプションを次から選択してください。

  • オンラインストア、オフラインストア、またはその両方を作成します。オンラインストアとオフラインストアの違いの詳細については、「」を参照してくださいFeature Store の概念

  • デフォルト AWS Key Management Service キーまたは独自のKMSキーを使用します。デフォルトのキーはAWS KMS キー (SSE-KMS) です。オフラインストアの Amazon S3 バケットで Amazon S3 バケットキーの使用を設定することで、 AWS KMS リクエストコストを削減できます。特徴量グループにバケットを使用する前に、Amazon S3 バケットキーを有効にする必要があります。Amazon S3 バケットキーを使用してコストを削減する方法の詳細については、Amazon S3 バケットキーを使用した SSE-KMS のコスト削減」を参照してください。

    オンラインストアとオフラインストアの両方で同じキーを使うか、それぞれに一意のキーを持つことができます。の詳細については AWS KMS、「」を参照してくださいAWS Key Management Service

  • オフラインストアを作成する場合:

    • Amazon S3 バケットを作成するか既存のバケットを使用するかを決めます。既存のバケットを使用する場合は、Amazon S3 バケットURL名または該当する場合は Amazon S3 バケット名とデータセットディレクトリ名を知っておく必要があります。

    • IAM ロールを指定するために使用する Amazon リソースネーム (ARN) を選択します。ロールとアタッチされたポリシーを検索する方法の詳細については、「」を参照してくださいIAM ロールへのポリシーの追加

    • (デフォルト) または AWS Glue を使用するかどうかを決定します。Apache Iceberg テーブル形式。ほとんどのユースケースでは、Apache Iceberg テーブル形式。テーブル形式の詳細については、「」を参照してくださいSDK for Python (Boto3) で Feature Store を使用する

コンソールを使用して、特徴量グループの系統を表示できます。コンソールで Feature Store を使用する手順は、 を有効にしたかAmazon SageMaker Studio、デフォルトのエクスペリエンスAmazon SageMaker Studio Classicとして有効にしたかによって異なります。

  1. の指示に従って Studio コンソールを開きますAmazon SageMaker Studio を起動する

  2. 左側のナビゲーションペインからデータを選択して、ドロップダウンリストを展開します。

  3. ドロップダウンリストから [Feature Store]を選択します。

  4. [Create feature group] (特徴グループを作成) を選択します。

  5. [特徴量グループの詳細] に、特徴量グループ名を入力します。

  6. (オプション) 特徴量グループの説明を入力します。

  7. Feature Group ストレージ設定 で、ドロップダウンリストからストレージ設定を選択します。ストレージ設定の詳細については、「」を参照してくださいFeature Store のストレージ設定

  8. オンラインストレージの有効化を選択した場合:

    1. オンラインストレージのみを有効にする場合は、ドロップダウンリストからストレージタイプを選択できます。オンラインストアのストレージタイプの詳細については、「」を参照してくださいオンラインストア

    2. (オプション) スイッチをオンに切り替え、Time to Live の期間値と単位を指定して、Time to Live (TTL) を適用します。 これにより、特徴量グループの作成後に特徴量グループに追加されたすべてのレコードのデフォルトのTTL期間を更新します。の詳細についてはTTL、「」を参照してくださいレコードの存続期間 (TTL)

  9. オフラインストレージの有効化を選択した場合:

    1. Amazon S3 バケット名 の下に、新しいバケット名を入力するかURL、既存のバケット を手動で入力します。

    2. [テーブル形式] ドロップダウンリストから、テーブル形式を選択します。ほとんどの場合、Apache Iceberg テーブル形式。テーブル形式の詳細については、「」を参照してくださいSDK for Python (Boto3) で Feature Store を使用する

    3. IAM ロール ARNで、この機能グループにアタッチARNするIAMロールを選択します。ロールとアタッチされたポリシーを検索する方法の詳細については、「」を参照してくださいIAM ロールへのポリシーの追加

    4. データカタログ で、オフラインストレージテーブル形式 と AWS Glue (デフォルト) テーブル形式 を有効にすることを選択した場合は、次の 2 つのオプションのいずれかを選択できます。

      • のデフォルト値を使用します AWS Glue Data Catalog

      • 既存の データカタログ名、テーブル名、データベース名を指定して、既存の を拡張します AWS Glue Data Catalog。

  10. オンラインストアの暗号化キーまたはオフラインストアの暗号化キードロップダウンリストで、次のいずれかのオプションを選択します。

    • AWS マネージド AWS KMS key 型 (デフォルト) を使用する

    • AWS KMS key ARN を入力し、オフラインストア暗号化 AWS KMS キー ARNにキーを入力します。 ARNの詳細については AWS KMS、AWS 「 Key Management Service」を参照してください。

  11. 該当する場合、スループットモードを選択するオプションがあり、請求方法に影響します。スループットモード で、ドロップダウンリストからモードを選択し、使用可能な場合は読み取り容量と書き込み容量を入力します。モードを適用できるタイミングやキャパシティーユニットなど、スループットモードの詳細については、「」を参照してくださいスループットモード

  12. 必要な情報をすべて指定すると、続行ボタンが使用可能になります。[Continue](続行) を選択します。

  13. 機能定義の指定 では、機能のスキーマを提供する 2 つのオプションがあります。JSONエディタまたはテーブルエディタです。

    • JSON エディタ: JSONタブで、機能定義を JSON形式で入力またはコピーして貼り付けます。

    • テーブルエディタ: テーブルタブで、特徴量名を入力し、特徴量グループ内の各特徴量に対応するデータ型を選択します。[+ 特徴量定義を追加] を選択すると、さらに多くの特徴量を含めることができます。特徴量グループから特徴量定義を削除することはできません。ただし、特徴量グループの作成後に特徴量定義を追加および更新することはできます。

    特徴量グループには、レコード識別子とイベント時間を表す少なくとも 2 つの特徴量が必要です。

    • レコード特徴量タイプは、文字列、小数、または整数にすることができます。

    • イベント時間の特徴量タイプは、文字列または小数である必要があります。ただし、Iceberg テーブル形式。イベント時間は文字列である必要があります。

  14. すべての機能を含めたら、「続行」を選択します。

  15. 必須機能の選択 で、レコード識別子とイベント時間機能を指定する必要があります。これを行うには、それぞれレコード識別子特徴量名とイベント時間特徴量名ドロップダウンリストで特徴量名を選択します。

  16. レコード識別子とイベント時間機能を選択したら、「続行」を選択します。

  17. (オプション) 特徴量グループのタグを追加するには、新しいタグの追加 を選択します。次に、キー と値 にそれぞれタグキー対応する値を入力します。

  18. [Continue](続行) を選択します。

  19. [特徴量グループを確認] で、特徴量グループの情報を確認します。ステップを編集するには、そのステップに対応する編集ボタンを選択します。今度は対応する編集手順に進みます。ステップ 5 に戻るまで [続行] をクリックします。

  20. 特徴量グループのセットアップが完了したら、特徴量グループの作成 を選択します。

    セットアップ中に問題が発生した場合、ページの下部にポップアップアラートメッセージが表示され、問題を解決するためのヒントが表示されます。前のステップに戻って問題を修正するには、競合のあるステップの編集を選択します。

    特徴量グループが正常に作成されると、ページの下部に緑色のポップアップメッセージが表示されます。新しい特徴量グループは、特徴量グループカタログにも表示されます。

コンソールから特徴量グループの詳細を表示する

Feature Store で特徴量グループが正常に作成された後、特徴量グループの詳細を表示できます。

コンソールまたは Amazon SageMaker Feature Store を使用してAPI、特徴量グループの詳細を表示できます。コンソールで Feature Store を使用する手順は、 または をデフォルトのエクスペリエンスAmazon SageMaker StudioAmazon SageMaker Studio Classicとして有効にしているかどうかによって異なります。

  1. の指示に従って Studio コンソールを開きますAmazon SageMaker Studio を起動する

  2. 左側のナビゲーションペインでデータを選択して、ドロップダウンリストを展開します。

  3. ドロップダウンリストから [Feature Store]を選択します。

  4. (オプション) 機能グループを表示するには、マイアカウント を選択します。共有特徴量グループを表示するには、クロスアカウント を選択します。

  5. [特徴量グループカタログ] タブの下で、リストから特徴量グループ名を選択します。特徴量グループが開きます。

  6. [特徴量] タブには、すべての特徴量のリストが表示されます。フィルターを使用してリストを絞り込みます。[特徴量] を選択して、詳細を表示します。

  7. Details タブと Information サブタブで、特徴量グループ情報を確認できます。これには、最新の実行 オフラインストレージ設定 オンラインストレージ設定 などが含まれます。

  8. Details タブと Tags サブタブで、特徴量グループタグを確認できます。[新しいタグを追加] を選択して新しいタグを追加するか、[削除] を選択してタグを削除します。

  9. Pipeline Executions タブで、特徴量グループの関連するパイプラインまたはパイプライン実行を表示できます。

  10. Lineage タブでは、特徴量グループの系統を表示できます。

コンソールから特徴量グループを更新する

Feature Store で特徴量グループが正常に作成された後に、特徴量グループを更新できます。

コンソールまたは Amazon SageMaker Feature Store を使用して、特徴量グループAPIを更新できます。コンソールで Feature Store を使用する手順は、 または をデフォルトのエクスペリエンスAmazon SageMaker StudioAmazon SageMaker Studio Classicとして有効にしているかどうかによって異なります。

  1. の指示に従って Studio コンソールを開きますAmazon SageMaker Studio を起動する

  2. 左側のナビゲーションペインでデータを選択し、ドロップダウンリストを展開します。

  3. ドロップダウンリストから [Feature Store]を選択します。

  4. (オプション) 機能グループを表示するには、マイアカウント を選択します。共有特徴量グループを表示するには、クロスアカウント を選択します。

  5. [特徴量グループカタログ] タブの下で、特徴量グループ名を検索してリストから選択します。特徴量グループが開きます。

  6. [特徴量グループを更新] を選択します。

  7. (オプション) 該当する場合は、スループットモードを変更できます。これにより、請求方法に影響が及びます。スループットモード で、ドロップダウンリストからモードを選択し、使用可能な場合は読み取り容量と書き込み容量を入力します。モードを適用できるタイミングやキャパシティーユニットなど、スループットモードの詳細については、「」を参照してくださいスループットモード

  8. (オプション) 機能グループがオンラインストアを使用している場合は、デフォルトの Time to Live (TTL) を更新できます。機能グループで が有効になっていTTLない場合は、Time to Live (TTL) のスイッチボタンを On に切り替えます。TTL 値と単位は、存続期間 で指定できます。これにより、特徴量グループが更新された後に特徴量グループに追加されたすべてのレコードのデフォルトのTTL期間を更新します。

  9. (オプション) 特徴量グループに特徴量定義を追加することはできますが、特徴量グループから特徴量定義を削除できないことに注意してください。特徴量定義を追加するには、+ 特徴量定義を追加 を選択し、名前列で新しい特徴量定義名を指定し、特徴量タイプ列で特徴量タイプを選択します。

  10. [Save changes] (変更の保存) をクリックします。

  11. 変更を確認するには、「確認」を選択します。

コンソールからパイプライン実行を表示する

パイプライン実行 で、特徴または特徴グループの最新のパイプライン実行情報を表示できます。また、パイプライン、実行、コード、その他の便利な実行情報へのリンクを取得することもできます。

コンソールを使用して、パイプラインの実行を表示できます。コンソールで Feature Store を使用する手順は、 または をデフォルトのエクスペリエンスAmazon SageMaker StudioAmazon SageMaker Studio Classicとして有効にしているかどうかによって異なります。

  1. の指示に従って Studio コンソールを開きますAmazon SageMaker Studio を起動する

  2. 左側のナビゲーションペインでデータを選択し、ドロップダウンリストを展開します。

  3. ドロップダウンリストから [Feature Store]を選択します。

  4. (オプション) 機能グループを表示するには、マイアカウント を選択します。共有特徴量グループを表示するには、クロスアカウント を選択します。

  5. 特徴グループまたは特徴を選択して、パイプラインの実行を表示します。

  6. [パイプラインの実行] タブを選択します。

  7. [パイプラインを選択] ドロップダウンリストからパイプラインを検索します。

  8. パイプライン、実行、コードの詳細のリンクを表示できます。実行所有者、ステータス、日付、期間を表示することもできます。

コンソールから系統を表示する

特徴量グループのリネージを表示できます。リネージには、特徴量処理ワークフローの実行コード、使用されたデータソース、特徴量グループまたはフ特徴量への取り込み方法に関する情報が含まれます。

コンソールを使用して、特徴量グループの系統を表示できます。コンソールで Feature Store を使用する手順は、 Amazon SageMaker Studioを有効にしたか、デフォルトのエクスペリエンスAmazon SageMaker Studio Classicとして有効にしたかによって異なります。

  1. の指示に従って Studio コンソールを開きますAmazon SageMaker Studio を起動する

  2. 左側のナビゲーションペインからデータを選択して、ドロップダウンリストを展開します。

  3. ドロップダウンリストから [Feature Store]を選択します。

  4. (オプション) 機能グループを表示するには、マイアカウント を選択します。共有特徴量グループを表示するには、クロスアカウント を選択します。

  5. 特徴グループまたは特徴を選択して、系統の詳細を表示します。

  6. [リネージ] タブを選択します。

  7. 特徴量グループまたはパイプラインノードを選択してノードを展開します。これには、特徴量グループまたはパイプラインに関する詳細情報が含まれます。

  8. 画面の左下にあるボタンを使用して、リネージグラフを拡大、縮小、または中心位置の調整をすることができます。

  9. 画面を選択してドラッグすると、系統マップを移動できます。ノードを焦点として使用して系統マップを移動するには、Tab または Shift+Tab を押してノードを切り替えることができます。

  10. 必要に応じて、系統のアップストリーム (左、前) またはダウンストリーム (右、最新) をナビゲートできます。これを行うには、ノードを選択し、クエリアップストリーム系統 またはクエリダウンストリーム系統 を選択します。