コンソールでの Amazon SageMaker 特徴量ストアの使用 - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

コンソールでの Amazon SageMaker 特徴量ストアの使用

重要

Amazon SageMaker Studio または Amazon SageMaker Studio Classic に Amazon SageMaker リソースの作成を許可するカスタム IAM ポリシーでは、これらのリソースにタグを追加するアクセス許可も付与する必要があります。Studio と Studio Classic は、作成したリソースに自動的にタグ付けするため、リソースにタグを追加するアクセス許可が必要になります。IAM ポリシーで Studio と Studio Classic によるリソースの作成が許可されていても、タグ付けが許可されていない場合は、リソースを作成しようとしたときに「AccessDenied」エラーが発生する可能性があります。詳細については、「SageMaker AI リソースにタグ付けするためのアクセス許可を提供する」を参照してください。

SageMaker リソースを作成するためのアクセス許可を付与する AWS Amazon SageMaker AI の マネージドポリシー には、それらのリソースの作成中にタグを追加するためのアクセス許可もあらかじめ含まれています。

コンソールで Amazon SageMaker 特徴量ストアを使用して、特徴量グループを作成、表示、更新、モニタリングできます。このガイドのモニタリングには、パイプライン実行と特徴量グループのリネージの表示が含まれます。このガイドでは、コンソールからこのようなタスクを実行する方法について説明します。

Amazon SageMaker APIs「」を参照してくださいAmazon SageMaker Feature Store リソース。 AWS SDK for Python (Boto3)

コンソールから特徴量グループを作成する

特徴量グループの作成プロセスには次の 4 つのステップがあります。

  1. 特徴量グループ情報を入力します。

  2. 特徴量定義を入力します。

  3. 必要な特徴量を入力します。

  4. 特徴量グループタグを入力します。

以下のオプションのうち、どのオプションがユースケースに最も適しているかを検討します。

  • オンラインストア、オフラインストア、またはその両方を作成します。オンラインストアとオフラインストアの違いについては、「Feature Store の概念」を参照してください。

  • デフォルト AWS Key Management Service キーまたは独自の KMS キーを使用します。デフォルトキーは AWS KMS キー (SSE-KMS) です。オフラインストアの Amazon S3 バケットで Amazon S3 バケットキーの使用を設定することで、 AWS KMS リクエストコストを削減できます。特徴量グループにバケットを使用する前に、Amazon S3 バケットキーを有効にする必要があります。Amazon S3 バケットキーを使用したコスト削減の詳細については、「Amazon S3 バケットキーを使用した SSE−KMS のコストの削減」を参照してください。

    オンラインストアとオフラインストアの両方で同じキーを使うか、それぞれに一意のキーを持つことができます。詳細については AWS KMS、「」を参照してくださいAWS Key Management Service

  • オフラインストアを作成する場合:

    • Amazon S3 バケットを作成するか既存のバケットを使用するかを決めます。既存のバケットを使用する場合は、Amazon S3 バケット URL または Amazon S3 バケット名とデータセットディレクトリ名 (該当する場合) を把握しておく必要があります。

    • IAM ロールを指定するために使用する Amazon リソースネーム (ARN) を選択します。ロールとアタッチされたポリシーを検索する方法の詳細については、「IAM ロールにポリシーを追加する」を参照してください。

    • AWS Glue (デフォルト) 形式とApache Icebergテーブル形式のどちらを使用するかを決定します。ほとんどのユースケースでは、Apache Iceberg テーブル形式を使用します。テーブル形式の詳細については、「SDK for Python (Boto3) での Feature Store の使用」を参照してください。

コンソールを使用して、特徴量グループのリネージを表示できます。コンソールで特徴量ストアを使用する手順は、デフォルトのエクスペリエンスとして有効にしたのが、Amazon SageMaker StudioAmazon SageMaker Studio Classic かによって異なります。

  1. Amazon SageMaker Studio を起動する」の手順に従って、Studio コンソールを開きます。

  2. 左側のナビゲーションペインから [データ] を選択して、ドロップダウンリストを展開します。

  3. ドロップダウンリストから [Feature Store]を選択します。

  4. [Create feature group] (特徴グループを作成) を選択します。

  5. [特徴量グループの詳細] に、特徴量グループ名を入力します。

  6. (オプション) 特徴量グループの説明を入力します。

  7. [特徴量グループのストレージ設定] で、ドロップダウンリストからストレージタイプを選択します。ストレージの設定の詳細については、「Feature Store のストレージ設定」を参照してください。

  8. オンラインストレージの有効化を選択した場合:

    1. オンラインストレージのみを有効にしている場合は、ドロップダウンリストから [ストレージタイプ] を選択できます。オンラインストアのストレージタイプの詳細については、「オンラインストア」を参照してください。

    2. (オプション) スイッチを [オン] に切り替えて、[Time to Live 期間] の値と単位を指定し、[Time to Live (TTL)] を適用します。これにより、特徴量グループの作成後に特徴量グループに追加されたすべてのレコードのデフォルトの TTL 期間が更新されます。TTL の詳細については、「レコードの有効期限 (TTL)」を参照してください。

  9. オフラインストレージの有効化を選択した場合:

    1. [Amazon S3 バケット名] の下で新しいバケット名を入力するか、既存のバケット URL を手動で入力します。

    2. [テーブル形式] ドロップダウンリストから、テーブル形式を選択します。ほとんどのユースケースでは、Apache Iceberg テーブル形式を使用する必要があります。テーブル形式の詳細については、「SDK for Python (Boto3) での Feature Store の使用」を参照してください。

    3. [IAM ロール の ARN] で、この特徴量グループにアタッチする IAM ロール ARN を選択します。ロールとアタッチされたポリシーを検索する方法の詳細については、「IAM ロールにポリシーを追加する」を参照してください。

    4. オフラインストレージテーブル形式と AWS Glue (デフォルト) テーブル形式を有効にするように選択した場合は、データカタログで、次の 2 つのオプションのいずれかを選択できます。

      • AWS Glue Data Catalogのデフォルト値を使用します。

      • 既存の データカタログ名、テーブル名、データベース名を指定して、既存の AWS Glue Data Catalogを拡張します。

  10. [オンラインストアの暗号化キー] ドロップダウンリストまたは [オフラインストアの暗号化キー] ドロップダウンリストで、以下のいずれかのオプションを選択します。

    • AWS managed AWS KMS key (デフォルト) を使用する

    • AWS KMS key ARN を入力し、オフラインストア暗号化 AWS KMS キー ARN の下にキー ARN を入力します。 詳細については AWS KMS、AWS 「 Key Management Service」を参照してください。

  11. 該当する場合は、スループットモードを選択するオプションがあります。このオプションは、料金に影響があります。[スループットモード] で、ドロップダウンリストからモードを選択します。利用できる場合は、読み取り容量と書き込み容量を入力します。モードを適用できるタイミングやキャパシティユニットなどのスループットモードの詳細については、「スループットモード」を参照してください。

  12. 必要な情報をすべて指定すると、[続行] ボタンが利用できるようになります。[Continue](続行) を選択します。

  13. [特徴量定義の指定] には、特徴量のスキーマを提供する JSON エディタとテーブルエディタの 2 つのオプションがあります。

    • JSON エディタ: [JSON] タブに特徴量定義を JSON 形式で入力するか、コピーして貼り付けます。

    • テーブルエディタ: [テーブル] タブで特徴量名を入力して、特徴量グループ内の各特徴量に対応するデータタイプを選択します。[+ 特徴量定義を追加] を選択すると、さらに多くの特徴量を含めることができます。特徴量グループから特徴量定義を削除することはできません。ただし、特徴量グループの作成後に特徴量定義を追加したり更新したりすることはできます。

    特徴量グループには、レコード識別子とイベント時刻を表す特徴量が少なくとも 2 つ必要です。

    • レコード [特徴量タイプ] では、文字列、分数、または整数を使用できます。

    • イベント時刻 [特徴量タイプ] は文字列か分数である必要があります。ただし、Iceberg テーブル形式を選択した場合のイベント時刻は、文字列にする必要があります。

  14. すべての特徴量を追加したら、[続行] をクリックします。

  15. [必要な特徴量の選択] で、レコード識別子の特徴量とイベント時刻の特徴量を指定する必要があります。これを行うには、[レコード識別子の特徴量名] ドロップダウンリストと [イベント時刻の特徴量名] ドロップダウンリストでそれぞれの特徴量名を選択します。

  16. レコード識別子の特徴量とイベント時刻の特徴量を選択したら、[続行] をクリックします。

  17. (オプション) この特徴量グループにタグを追加するには、[新しいタグを追加] をクリックします。次に、[キー][値] にそれぞれタグキーと対応する値を入力します。

  18. [Continue](続行) を選択します。

  19. [特徴量グループを確認] で、特徴量グループの情報を確認します。いずれかのステップを編集するには、そのステップに対応する [編集] ボタンをクリックします。今度は対応する編集手順に進みます。ステップ 5 に戻るまで [続行] をクリックします。

  20. 特徴量グループの設定が完了したら、[特徴量グループを作成] をクリックします。

    設定中に問題が発生した場合は、問題を解決するためのヒントを記載したポップアップアラートメッセージがページの下部に表示されます。競合が発生したステップで [編集] をクリックすると、以前のステップに戻って問題を修正できます。

    特徴量グループの作成が正常に完了すると、ページの下部に緑色のポップアップメッセージが表示されます。新しい特徴量グループは、特徴量グループカタログにも表示されます。

コンソールから特徴量グループの詳細を表示する

特徴量ストアでの特徴量グループの作成が正常に完了すると、特徴量グループの詳細を表示できます。

コンソールまたは Amazon SageMaker 特徴量ストア API を使用して、特徴量グループの詳細を表示できます。コンソールから特徴量ストアを使用する手順は、デフォルトのエクスペリエンスとして有効にしたのが、Amazon SageMaker StudioAmazon SageMaker Studio Classic かによって異なります。

  1. Amazon SageMaker Studio を起動する」の手順に従って、Studio コンソールを開きます。

  2. 左側のナビゲーションペインで [データ] を選択して、ドロップダウンリストを展開します。

  3. ドロップダウンリストから [Feature Store]を選択します。

  4. (オプション) 特徴量グループを表示するには、[アカウント] をクリックします。共有特徴量グループを表示するには、[クロスアカウント] をクリックします。

  5. [特徴量グループカタログ] タブの下で、リストから特徴量グループ名を選択します。特徴量グループが開きます。

  6. [特徴量] タブには、すべての特徴量のリストが表示されます。フィルターを使用してリストを絞り込みます。[特徴量] を選択して、詳細を表示します。

  7. [詳細] タブと [情報] サブタブで、特徴量グループの情報を確認できます。これには、[最新の実行][オフラインストレージ設定][オンラインストレージ設定] などがあります。

  8. [詳細] タブと [情報] サブタブでは、特徴量グループのタグを確認できます。[新しいタグを追加] を選択して新しいタグを追加するか、[削除] を選択してタグを削除します。

  9. [パイプライン実行] タブでは、特徴量グループの関連するパイプラインまたはパイプラインの実行を確認できます。

  10. [リネージ] タブでは、特徴量グループのリネージを確認できます。

コンソールから特徴量グループを更新する

特徴量ストアでの特徴量グループの作成が正常に完了すると、特徴量グループを更新できます。

コンソールまたは Amazon SageMaker 特徴量ストア API を使用して、特徴量グループを更新できます。コンソールから特徴量ストアを使用する手順は、デフォルトのエクスペリエンスとして有効にしたのが、Amazon SageMaker StudioAmazon SageMaker Studio Classic かによって異なります。

  1. Amazon SageMaker Studio を起動する」の手順に従って、Studio コンソールを開きます。

  2. 左側のナビゲーションペインで [データ] を選択して、ドロップダウンリストを展開します。

  3. ドロップダウンリストから [Feature Store]を選択します。

  4. (オプション) 特徴量グループを表示するには、[アカウント] をクリックします。共有特徴量グループを表示するには、[クロスアカウント] をクリックします。

  5. [特徴量グループカタログ] タブの下で、特徴量グループ名を検索してリストから選択します。特徴量グループが開きます。

  6. [特徴量グループを更新] を選択します。

  7. (オプション) 該当する場合は、スループットモードを変更できます。変更により、料金に影響が及びます。[スループットモード] で、ドロップダウンリストからモードを選択します。利用できる場合は、読み取り容量と書き込み容量を入力します。モードを適用できるタイミングやキャパシティユニットなどのスループットモードの詳細については、「スループットモード」を参照してください。

  8. (オプション) 特徴量グループがオンラインストアを使用している場合は、デフォルトの [有効期限 (TTL)] を更新できます。特徴量グループで TTL が有効になっていない場合は、[有効期限 (TTL)] の下にある切り替えボタンを [オン] に切り替えます。TTL 値と単位は [有効期限の期間] で指定できます。これにより、特徴量グループの更新後に特徴量グループに追加されたすべてのレコードのデフォルトの TTL 期間が更新されます。

  9. (オプション) 特徴量グループに特徴量定義を追加することはできますが、特徴量グループから特徴量定義を削除できないことに注意してください。特徴量定義を追加するには、[+ 特徴量定義を追加] をクリックして、[名前] 列で新しい特徴量定義名を指定し、[特徴量タイプ] 列で特徴量タイプを選択します。

  10. [Save changes] (変更の保存) をクリックします。

  11. [確認] をクリックして、変更を確認します。

コンソールからパイプライン実行を表示する

[パイプライン実行] では、特徴量または特徴量グループの最新のパイプライン実行情報を表示できます。パイプライン、実行、コード、その他の便利な実行情報へのリンクも取得できます。

パイプライン実行を表示するには、コンソールを使用できます。コンソールから特徴量ストアを使用する手順は、デフォルトのエクスペリエンスとして有効にしたのが、Amazon SageMaker StudioAmazon SageMaker Studio Classic かによって異なります。

  1. Amazon SageMaker Studio を起動する」の手順に従って、Studio コンソールを開きます。

  2. 左側のナビゲーションペインで [データ] を選択して、ドロップダウンリストを展開します。

  3. ドロップダウンリストから [Feature Store]を選択します。

  4. (オプション) 特徴量グループを表示するには、[アカウント] をクリックします。共有特徴量グループを表示するには、[クロスアカウント] をクリックします。

  5. パイプライン実行を表示する特徴量グループまたは特徴量を選択します。

  6. [パイプラインの実行] タブを選択します。

  7. [パイプラインを選択] ドロップダウンリストからパイプラインを検索します。

  8. パイプライン、実行、コードの詳細などのリンクを表示できます。実行所有者、ステータス、日付、期間も確認できます。

コンソールからリネージを表示する

特徴量グループのリネージを表示できます。リネージには、特徴量処理ワークフローの実行コード、使用されたデータソース、特徴量グループまたはフ特徴量への取り込み方法に関する情報が含まれます。

コンソールを使用して、特徴量グループのリネージを表示できます。コンソールから特徴量ストアを使用する手順については、デフォルトのエクスペリエンスとして有効にしたのが、Amazon SageMaker StudioAmazon SageMaker Studio Classic かによって異なります。

  1. Amazon SageMaker Studio を起動する」の手順に従って、Studio コンソールを開きます。

  2. 左側のナビゲーションペインから [データ] を選択して、ドロップダウンリストを展開します。

  3. ドロップダウンリストから [Feature Store]を選択します。

  4. (オプション) 特徴量グループを表示するには、[アカウント] をクリックします。共有特徴量グループを表示するには、[クロスアカウント] をクリックします。

  5. リネージの詳細を表示する特徴量グループまたは特徴量を選択します。

  6. [リネージ] タブを選択します。

  7. 特徴量グループまたはパイプラインノードを選択してノードを展開します。これには、特徴量グループまたはパイプラインに関する詳細情報が含まれます。

  8. 画面の左下にあるボタンを使用して、リネージグラフを拡大、縮小、または中心位置の調整をすることができます。

  9. 画面を選択してドラッグすると、リネージマップ内を移動できます。ノードを焦点として使用してリネージマップ内を移動するには、Tab キーまたは Shift+Tab キーを押してノード間で切り替えます。

  10. 該当する場合は、リネージを上流 (左、以前) または下流 (右、最新) に移動できます。これを行うには、ノードを選択してから、[上流リネージのクエリ] または [下流リネージのクエリ] を選択します。