系統追跡エンティティ - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

系統追跡エンティティ

追跡エンティティは、 end-to-end 機械学習ワークフローのすべての要素の表現を維持します。この表現を使用すると、モデルガバナンスの確立、ワークフローの再現、作業履歴の記録の保持を行うことができます。

Amazon は、処理 SageMaker ジョブ、トレーニングジョブ、バッチ変換ジョブなどのジョブを作成すると、トライアルコンポーネントおよび関連するトライアルと実験の追跡エンティティ SageMaker を自動的に作成します。自動追跡以外にも、「追跡エンティティを手動で作成する」でワークフローのカスタムステップをモデル化できます。詳細については、「Studio Classic で Amazon SageMaker Experiments を管理する」を参照してください。

SageMaker は、ワークフロー内の他のステップの追跡エンティティを自動的に作成し、ワークフローをエンドツーエンドで追跡できるようにします。詳細については、「Amazon SageMakerが作成した追跡エンティティ」を参照してください。

追加のエンティティを作成して、 によって作成されたエンティティを補足できます SageMaker。詳細については、「追跡エンティティを手動で作成する」を参照してください。

SageMaker は、新しいエンティティを作成するのではなく、既存のエンティティを再利用します。例えば、固有の SourceUri を持つアーティファクトは 1 つしか存在しません。

系統クエリの主要な概念
  • 系統 - ML ワークフロー内のさまざまなエンティティ間の関係を追跡するメタデータ。

  • QueryLineage – 系統を検査し、エンティティ間の関係を検出するアクション。

  • 系統エンティティ - 系統を構成するメタデータ要素。

  • クロスアカウントの系統 - ML ワークフローは、複数のアカウントにまたがることがあります。クロスアカウント系統では、共有エンティティリソース間に系統の関連付けを自動的に作成するように複数のアカウントを設定できます。 QueryLineage その後、これらの共有アカウントからエンティティを返すことができます。

以下の追跡エンティティが定義されます。

実験エンティティ
  • トライアルコンポーネント - 機械学習トライアルのステージ。処理ジョブ、トレーニングジョブ、バッチ変換ジョブが含まれます。

  • トライアル - 一般的にモデルを作成するトライアルコンポーネントの組み合わせ。

  • 実験 - 一般的に特定のユースケースの解決に焦点を当てた一連のトライアル。

系統エンティティ
  • トライアルコンポーネント - 系統内の処理、トレーニング、変換のジョブを表します。実験管理の一部にもなります。

  • コンテキスト - 他の追跡エンティティや実験エンティティの論理グループ化を提供します。概念的に、実験とトライアルはコンテキストになります。エンドポイントやモデルパッケージなどが例として挙げられます。

  • アクション - アクションまたはアクティビティを表します。一般に、アクションには、少なくとも 1 つの入力アーティファクトか出力アーティファクトが含まれます。ワークフローステップやモデルのデプロイなどが例として挙げられます。

  • アーティファクト — URIアドレス可能なオブジェクトまたはデータを表します。通常、アーティファクトはトライアルコンポーネントやアクションへの入力またはそれらからの出力になります。例としては、データセット (S3 バケット URI) やイメージ (Amazon ECRレジストリパス) などがあります。

  • 関連付け - トレーニングデータの場所とトレーニングジョブの関連付けのように、他の追跡エンティティや実験エンティティをリンクします。

    関連付けにはオプションの AssociationType プロパティがあります。以下の値は、各タイプで推奨される使用法とともに使用できます。 SageMaker は、それらの使用に制限はありません。

    • ContributedTo - ソースがターゲットに貢献した、またはターゲットの有効化に関与した。例えば、トレーニングジョブに貢献したトレーニングデータ。

    • AssociatedWith - ソースがターゲットに接続されている。例えば、モデルデプロイに関連付けられた承認ワークフロー。

    • DerivedFrom - ターゲットは、ソースを変更したものである。例えば、元の入力から派生、処理ジョブのチャネル入力のダイジェスト出力。

    • Produced - ソースがデスティネーションを生成した。例えば、トレーニングジョブが生成したモデルアーティファクト。

    • SameAs - 同じ系統エンティティが異なるアカウントで使用される場合。

一般的なプロパティ

  • Type プロパティ

    アクション、アーティファクト、コンテキストのエンティティにはそれぞれ、ActionTypeArtifactTypeContextType の Type プロパティがあります。このプロパティは、意味のある情報をエンティティに関連付け、リスト のフィルターとして使用できるカスタム文字列ですAPIs。

  • Source プロパティ

    アクション、アーティファクト、コンテキストのエンティティには Source プロパティがあります。このプロパティは、エンティティURIが表す基盤となる を提供します。いくつか例を挙げます。

    • UpdateEndpoint アクション。この場合、ソースは EndpointArn になります。

    • 処理ジョブのイメージアーティファクト。この場合、ソースは ImageUri になります。

    • Endpoint コンテキスト。この場合、ソースは EndpointArn になります。

  • Metadata プロパティ

    アクションエンティティとアーティファクトエンティティには、オプションの Metadata プロパティがあります。このプロパティは、以下のような情報を提供できます。

    • ProjectId – モデルが SageMaker MLOps属するプロジェクトの ID など。

    • GeneratedBy – モデルパッケージバージョンを登録した SageMaker パイプラインの実行など。

    • Repository - アルゴリズムを含むリポジトリなど。

    • CommitId - アルゴリズムバージョンのコミット ID など。