翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon SageMaker で Amazon をモニタリングするためのメトリクス CloudWatch
Amazon SageMaker を使用して Amazon をモニタリングできます。Amazon は CloudWatch生データを収集し、読み取り可能なほぼリアルタイムのメトリクスに処理します。これらの統計は 15 か月間保持されます。これらを使用すると、履歴情報にアクセスし、ウェブアプリケーションまたはサービスのパフォーマンスをより適切に把握できます。ただし、Amazon CloudWatch コンソールは、検索を過去 2 週間に更新されたメトリクスに制限します。この制限により、最新のジョブが名前空間に表示されるようになります。
検索を使用せずにメトリクスをグラフ化するには、ソースビューでその正確な名前を指定します。また、特定のしきい値をモニタリングするアラームを設定し、しきい値に達したときに通知を送信したりアクションを実行したりできます。詳細については、「Amazon CloudWatch ユーザーガイド」を参照してください。
SageMaker メトリクスとディメンション
SageMaker エンドポイント呼び出しメトリクス
AWS/SageMaker
名前空間には、 への呼び出しからの次のリクエストメトリクスが含まれます InvokeEndpoint。
メトリクスは、1 分間隔で利用できます。
次の図は、 SageMaker エンドポイントが Amazon SageMaker Runtime とやり取りする方法を示していますAPI。エンドポイントにリクエストを送信してからレスポンスを受信するまでの全体の所要時間は、次の 3 つの要素によって異なります。
-
ネットワークレイテンシー – SageMaker Runtime Runtime へのリクエストからレスポンスの受信までにかかる時間API。
-
オーバーヘッドレイテンシー - からモデルコンテナにリクエストを転送し、レスポンスを SageMaker ランタイムランタイム に戻すのにかかる時間API。
-
モデルレイテンシー — モデルコンテナがリクエストを処理してレスポンスを返すまでにかかる時間です。
総レイテンシーの詳細については、「Amazon SageMaker リアルタイム推論エンドポイントの負荷テストのベストプラクティス
エンドポイント呼び出しメトリクス
メトリクス | 説明 |
---|---|
ConcurrentRequestsPerCopy |
推論コンポーネントが受信する同時リクエストの数。推論コンポーネントのコピーごとに正規化されます。 有効な統計: 最小、最大 |
ConcurrentRequestsPerModel |
モデルが受信する同時リクエストの数。 有効な統計: 最小、最大 |
Invocation4XXErrors |
モデルが 4xx HTTPレスポンスコードを返した 単位: なし 有効な統計: 合計、平均 |
Invocation5XXErrors |
モデルが 5xx HTTPレスポンスコードを返した 単位: なし 有効な統計: 合計、平均 |
InvocationModelErrors |
2XX HTTPレスポンスに至らなかったモデル呼び出しリクエストの数。これには、4XX /5XX ステータスコード、低レベルのソケットエラー、不正な形式のHTTPレスポンス、リクエストタイムアウトが含まれます。各エラーレスポンスについて、1 が送信されます。それ以外の場合は 0 が送信されます。 単位: なし 有効な統計: 合計、平均 |
Invocations |
モデルエンドポイントに送信された モデルエンドポイントに送信されたリクエストの合計数を得るには、Sum 統計を使用します。 単位: なし 有効な統計: Sum |
InvocationsPerCopy |
推論コンポーネントのコピーごとに正規化された呼び出しの数。 有効な統計: Sum |
InvocationsPerInstance |
モデルに送信された呼び出しの数。各 単位: なし 有効な統計: Sum |
ModelLatency |
SageMaker ランタイムAPIリクエストに応答するためにモデルがかかった時間間隔。この間隔には、リクエストを送信し、モデルコンテナからレスポンスを取得するためにかかったローカル通信時間が含まれます。また、コンテナ内の推論を完了するのにかかる時間も含まれます。 単位: マイクロ秒 有効な統計: Average、Sum、Min、Max、Sample Count |
ModelSetupTime |
サーバーレスエンドポイントの新しいコンピューティングリソースを起動するのにかかる時間。時間は、モデルのサイズ、モデルのダウンロードにかかる時間、コンテナの起動時間によって異なります。 単位: マイクロ秒 有効な統計: 平均、最小、最大、サンプル数、パーセンタイル |
OverheadLatency |
オーバー SageMaker ヘッドによるクライアントリクエストへの応答にかかる時間に追加された時間間隔。この間隔は、 リクエスト SageMaker を受信してからクライアントにレスポンスを返すまで、 を引いた時間から測定されます 単位: マイクロ秒 有効な統計: Average、Sum、Min、Max、Sample Count |
エンドポイント呼び出しメトリクスのディメンション
ディメンション | 説明 |
---|---|
EndpointName, VariantName |
指定のエンドポイントおよびバリアントの |
InferenceComponentName |
推論コンポーネントの呼び出しメトリクスをフィルタリングします。 |
SageMaker 推論コンポーネントメトリクス
/aws/sagemaker/InferenceComponents
名前空間には、推論コンポーネントをホストするエンドポイント InvokeEndpointの の呼び出しから次のメトリクスが含まれます。
メトリクスは、1 分間隔で利用できます。
メトリクス | 説明 |
---|---|
CPUUtilizationNormalized |
推論コンポーネントの各コピーによってレポートされる |
GPUMemoryUtilizationNormalized |
推論コンポーネントの各コピーによってレポートされる |
GPUUtilizationNormalized |
推論コンポーネントの各コピーによってレポートされる |
MemoryUtilizationNormalized |
推論コンポーネントのコピーごとに |
推論コンポーネントメトリクスのディメンション
ディメンション | 説明 |
---|---|
InferenceComponentName |
推論コンポーネントメトリクスをフィルタリングします。 |
SageMaker マルチモデルエンドポイントメトリクス
AWS/SageMaker
名前空間には、 への呼び出しからメトリクスをロードする次のモデルが含まれます InvokeEndpoint。
メトリクスは、1 分間隔で利用できます。
CloudWatch メトリクスの保持期間については、Amazon CloudWatch API リファレンス GetMetricStatisticsの「」を参照してください。
マルチモデルエンドポイントモデルのロードメトリクス
メトリクス | 説明 |
---|---|
ModelLoadingWaitTime |
推論を実行するために、呼び出しリクエストがターゲットモデルのダウンロード、ロード、またはその両方を待機した間隔。 単位: マイクロ秒 有効な統計: Average、Sum、Min、Max、Sample Count |
ModelUnloadingTime |
コンテナの 単位: マイクロ秒 有効な統計: Average、Sum、Min、Max、Sample Count |
ModelDownloadingTime |
Amazon Simple Storage Service (Amazon S3) からモデルをダウンロードするのにかかった時間間隔。 単位: マイクロ秒 有効な統計: Average、Sum、Min、Max、Sample Count |
ModelLoadingTime |
コンテナの 単位: マイクロ秒 有効な統計: Average、Sum、Min、Max、Sample Count |
ModelCacheHit |
モデルが既にロードされているマルチモデルエンドポイントに送信された Average 統計は、モデルが既にロードされていたリクエストの比率を示します。 単位: なし 有効な統計: Average、Sum、Sample Count |
マルチモデルエンドポイントモデルのロードメトリクスのディメンション
ディメンション | 説明 |
---|---|
EndpointName, VariantName |
指定のエンドポイントおよびバリアントの |
/aws/sagemaker/Endpoints
名前空間には、 InvokeEndpointへの呼び出しからの次のインスタンスメトリクスが含まれます。
メトリクスは、1 分間隔で利用できます。
CloudWatch メトリクスの保持期間については、Amazon リファレンスGetMetricStatisticsの「」を参照してください。 CloudWatch API
マルチモデルエンドポイントモデルのインスタンスメトリクス
メトリクス | 説明 |
---|---|
LoadedModelCount |
マルチモデルエンドポイントのコンテナにロードされたモデルの数。このメトリクスはインスタンスあたりで発行されます。 1 分間の Average 統計は、ロードされたモデルのインスタンスあたりの平均数を示します。 Sum 統計は、エンドポイントのすべてのインスタンス間でロードされたモデルの総数を示します。 モデルがエンドポイントの複数のコンテナにロードされる可能性があるため、このメトリクスが追跡するモデルは必ずしも一意ではありません。 単位: なし 有効な統計: Average、Sum、Min、Max、Sample Count |
マルチモデルエンドポイントモデルのロードメトリクスのディメンション
ディメンション | 説明 |
---|---|
EndpointName, VariantName |
指定のエンドポイントおよびバリアントの |
SageMaker ジョブとエンドポイントメトリクス
/aws/sagemaker/ProcessingJobs
、/aws/sagemaker/TrainingJobs
、/aws/sagemaker/TransformJobs
、および /aws/sagemaker/Endpoints
名前空間には、トレーニングジョブとエンドポイントインスタンスの以下のメトリクスが含まれます。
メトリクスは、1 分間隔で利用できます。
注記
Amazon は高解像度のカスタムメトリクス CloudWatch をサポートしており、その最高の解像度は 1 秒です。ただし、解像度が細くなるほど、 CloudWatch メトリクスの有効期間は短くなります。1 秒の周波数解決では、 CloudWatch メトリクスは 3 時間使用できます。 CloudWatch メトリクスの解像度と有効期間の詳細については、GetMetricStatistics「Amazon CloudWatch API リファレンス」の「」を参照してください。
ヒント
100 ミリ秒 (0.1 秒) のきめ細かな解像度でトレーニングジョブをプロファイリングし、カスタム分析のためにトレーニングメトリクスを Amazon S3 に無期限に保存するには、Amazon SageMaker Debugger の使用を検討してください。 SageMaker Debugger には、一般的なトレーニング問題を自動的に検出するための組み込みルールが用意されています。ハードウェアリソースの使用率の問題 (CPU、GPU、I/O のボトルネックなど) を検出します。また、非収束モデルの問題 (オーバーフィット、勾配の消失、テンソルの爆発など) も検出します。 SageMaker デバッガーは、Studio Classic とそのプロファイリングレポートによる視覚化も提供します。デバッガーの視覚化については、SageMaker 「Debugger Insights Dashboard Walkthrough 」、「Debugger Profiling Report Walkthrough 」、およびSMDebug「 クライアントライブラリ を使用したデータの分析」を参照してください。
処理ジョブ、トレーニングジョブ、バッチ変換ジョブ、およびエンドポイントインスタンスメトリクス
メトリクス | 説明 |
---|---|
CPUReservation |
インスタンスのコンテナによってCPUs予約された の合計。値の範囲は 0%~100% です。推論コンポーネントの設定では、 |
CPUUtilization |
個々のCPUコアの使用率の合計。各コア範囲のCPU使用率は 0~100 です。例えば、 が 4 つある場合CPUs、CPUUtilization 範囲は 0%~400% です。処理ジョブの場合、値はインスタンスの処理コンテナのCPU使用率です。トレーニングジョブの場合、値はインスタンス上のアルゴリズムコンテナのCPU使用率です。 バッチ変換ジョブの場合、値はインスタンスの変換コンテナのCPU使用率です。 エンドポイントバリアントの場合、値はインスタンスのプライマリコンテナと補足コンテナのCPU使用率の合計です。 注記マルチインスタンスジョブの場合、各インスタンスはCPU使用率メトリクスをレポートします。ただし、 のデフォルトビューには、すべてのインスタンスの平均CPU使用率 CloudWatch が表示されます。 単位: パーセント |
CPUUtilizationNormalized |
個々のCPUコアの使用率の正規化された合計。値の範囲は 0%~100% です。例えば、 が 4 つありCPUs、 |
DiskUtilization |
インスタンス上のコンテナによって使用されているディスク容量の割合。この値の範囲は 0%~100% です。このメトリクスは、バッチ変換ジョブではサポートされていません。 処理ジョブの場合、値はインスタンス上の処理コンテナのディスク容量使用率です。トレーニングジョブの場合、値はインスタンス上のアルゴリズムコンテナのディスク容量使用率です。 エンドポイントのバリアントの場合、値はインスタンス上のプライマリコンテナと補足コンテナのディスク容量使用率の合計です。 単位: パーセント 注記マルチインスタンスジョブの場合、インスタンスごとにディスク使用率メトリクスがレポートされます。ただし、 のデフォルトビューには、すべてのインスタンスの平均ディスク使用率 CloudWatch が表示されます。 |
GPUMemoryUtilization |
インスタンスのコンテナによって使用されるGPUメモリの割合。値の範囲は 0~100 で、 の数を掛けますGPUs。例えば、 が 4 つある場合GPUs、 トレーニングジョブの場合、値はインスタンス上のアルゴリズムコンテナのGPUメモリ使用率です。 バッチ変換ジョブの場合、値はインスタンスの変換コンテナのGPUメモリ使用率です。 エンドポイントバリアントの場合、値はインスタンスのプライマリコンテナと補足コンテナのGPUメモリ使用率の合計です。 注記マルチインスタンスジョブの場合、各インスタンスはGPUメモリ使用率メトリクスを報告します。ただし、 のデフォルトビューには、すべてのインスタンスの平均GPUメモリ使用率 CloudWatch が表示されます。 単位: パーセント |
GPUMemoryUtilizationNormalized |
インスタンスのコンテナによって使用される正規化されたGPUメモリの割合。値の範囲は 0%~100% です。例えば、 が 4 つありGPUs、 |
GPUReservation |
インスタンスのコンテナによってGPUs予約された の合計。値の範囲は 0%~100% です。推論コンポーネントの設定では、 によってGPU予約を設定します |
GPUUtilization |
インスタンスのコンテナで使用されるGPUユニットの割合。値は 0~100 の範囲であり、 の数を掛けますGPUs。例えば、 が 4 つある場合GPUs、 トレーニングジョブの場合、値はインスタンス上のアルゴリズムコンテナのGPU使用率です。 バッチ変換ジョブの場合、値はインスタンスの変換コンテナのGPU使用率です。 エンドポイントバリアントの場合、値はインスタンスのプライマリコンテナと補足コンテナのGPU使用率の合計です。 注記マルチインスタンスジョブの場合、各インスタンスはGPU使用率メトリクスをレポートします。ただし、 のデフォルトビューには、すべてのインスタンスの平均GPU使用率 CloudWatch が表示されます。 単位: パーセント |
GPUUtilizationNormalized |
インスタンスのコンテナで使用されるGPUユニットの正規化された割合。値の範囲は 0%~100% です。例えば、 が 4 つありGPUs、 |
MemoryReservation |
インスタンスのコンテナによって予約されたメモリの合計。値の範囲は 0%~100% です。推論コンポーネントの設定では、 |
MemoryUtilization |
インスタンス上のコンテナによって使用されているメモリの割合。この値の範囲は 0%~100% です。 処理ジョブの場合、値はインスタンス上の処理コンテナのメモリ使用率です。トレーニングジョブの場合、値はインスタンス上のアルゴリズムコンテナのメモリ使用率です。 バッチ変換ジョブの場合、値はインスタンス上の変換コンテナのメモリ使用率です。 エンドポイントのバリアントの場合、値はインスタンス上のプライマリコンテナと補足コンテナのメモリ使用率の合計です。 単位: パーセント 注記マルチインスタンスジョブの場合、インスタンスごとにメモリ使用率メトリクスがレポートされます。ただし、 のデフォルトビューには、すべてのインスタンスの平均メモリ使用率 CloudWatch が表示されます。 |
処理ジョブ、トレーニングジョブおよびバッチ変換ジョブインスタンスメトリクスのディメンション
ディメンション | 説明 |
---|---|
Host |
処理ジョブの場合、このディメンションの値は トレーニングジョブの場合、このディメンションの値は バッチ変換ジョブの場合、このディメンションの値は |
SageMaker Inference Recommender ジョブのメトリクス
/aws/sagemaker/InferenceRecommendationsJobs
名前空間には、推論レコメンデーションジョブの以下のメトリクスが含まれます。
Inference Recommender メトリクス
メトリクス | 説明 |
---|---|
ClientInvocations |
Inference Recommender が確認した、モデルエンドポイントに送信された 単位: なし 有効な統計: Sum |
ClientInvocationErrors |
Inference Recommender が確認した、失敗した 単位: なし 有効な統計: Sum |
ClientLatency |
Inference Recommender が確認した、 単位: ミリ秒 有効な統計: 平均、合計、最小、最大、サンプル数、パーセンタイル |
NumberOfUsers |
モデルエンドポイントに 単位: なし 有効な統計: 最大、最小、平均 |
Inference Recommender ジョブメトリクスのディメンション
ディメンション | 説明 |
---|---|
JobName |
指定した Inference Recommender ジョブの Inference Recommender ジョブメトリクスをフィルタリングします。 |
EndpointName |
指定したエンドポイントの Inference Recommender ジョブメトリクスをフィルタリングします。 |
SageMaker Ground Truth メトリクス
Ground Truth メトリクス
メトリクス | 説明 |
---|---|
ActiveWorkers |
プライベート作業チームの 1 人のアクティブなワーカーが、タスクを送信、リリース、または拒否しました。アクティブなワーカーの総数を取得するには、Sum 統計を使用します。Ground Truth は、個々の 単位: なし 有効な統計: Sum、Sample Count |
DatasetObjectsAutoAnnotated |
ラベル付けジョブで自動注釈が付けられたデータセットオブジェクトの数。このメトリクスは、自動ラベル付けが有効になっている場合にのみ出力されます。ラベル付けジョブの進行状況を表示するには、Max メトリクスを使用します。 単位: なし 有効な統計: Max |
DatasetObjectsHumanAnnotated |
ラベル付けジョブで人間によって注釈が付けられたデータセットオブジェクトの数。ラベル付けジョブの進行状況を表示するには、Max メトリクスを使用します。 単位: なし 有効な統計: Max |
DatasetObjectsLabelingFailed |
ラベル付けジョブでラベリングに失敗したデータセットオブジェクトの数。ラベル付けジョブの進行状況を表示するには、Max メトリクスを使用します。 単位: なし 有効な統計: Max |
JobsFailed |
1 つのラベル付けジョブが失敗しました。失敗したラベル付けジョブの総数を取得するには、Sum 統計を使用します。 単位: なし 有効な統計: Sum、Sample Count |
JobsSucceeded |
1 つのラベル付けジョブが成功しました。成功したラベル付けジョブの総数を取得するには、Sum 統計を使用します。 単位: なし 有効な統計: Sum、Sample Count |
JobsStopped |
1 つのラベル付けジョブが停止されました。停止したラベル付けジョブの総数を取得するには、Sum 統計を使用します。 単位: なし 有効な統計: Sum、Sample Count |
TasksAccepted |
1 つのタスクがワーカーによって受け入れられました。ワーカーによって受け入れられたタスクの総数を取得するには、Sum 統計を使用します。Ground Truth は、個々の 単位: なし 有効な統計: Sum、Sample Count |
TasksDeclined |
1 つのタスクがワーカーによって拒否されました。ワーカーによって拒否されたタスクの総数を取得するには、Sum 統計を使用します。Ground Truth は、個々の 単位: なし 有効な統計: Sum、Sample Count |
TasksReturned |
1 つのタスクが返されました。返されたタスクの合計数を取得するには、Sum 統計を使用します。Ground Truth は、個々の 単位: なし 有効な統計: Sum、Sample Count |
TasksSubmitted |
1 つのタスクがプライベートワーカーによって送信/完了されました。ワーカーによって送信されたタスクの総数を取得するには、Sum 統計を使用します。Ground Truth は、個々の 単位: なし 有効な統計: Sum、Sample Count |
TimeSpent |
プライベートワーカーによって完了したタスクにかかった時間。このメトリクスには、ワーカーが一時停止または休憩した時間は含まれません。Ground Truth は、各 単位: 秒 有効な統計: Sum、Sample Count |
TotalDatasetObjectsLabeled |
ラベル付けジョブで正常にラベリングされたデータセットオブジェクトの数。ラベル付けジョブの進行状況を表示するには、Max メトリクスを使用します。 単位: なし 有効な統計: Max |
データセットオブジェクトメトリクスのディメンション
ディメンション | 説明 |
---|---|
LabelingJobName |
ラベル付けジョブのデータセットオブジェクト数メトリクスをフィルタリングします。 |
Amazon SageMaker Feature Store メトリクス
Feature Store の消費メトリクス
メトリクス | 説明 |
---|---|
ConsumedReadRequestsUnits |
指定した期間に消費された読み取り単位の数。Feature Store のランタイム操作とそれに対応する特徴グループの消費された読み取り単位を取得できます。 単位: なし 有効な統計: すべて |
ConsumedWriteRequestsUnits |
指定した期間に消費された書き込み単位の数。Feature Store のランタイム操作とそれに対応する特徴グループの消費された書き込み単位を取得できます。 単位: なし 有効な統計: すべて |
ConsumedReadCapacityUnits |
指定された期間に消費されたプロビジョニングされた読み取りキャパシティーユニットの数。特徴量ストアのランタイムオペレーションの消費された読み取りキャパシティーユニットとその対応する特徴量グループを取得できます。 単位: なし 有効な統計: すべて |
ConsumedWriteCapacityUnits |
指定された期間に消費されたプロビジョンド書き込みキャパシティーユニットの数。特徴量ストアのランタイムオペレーションとそれに対応する特徴量グループの消費された書き込みキャパシティーユニットを取得できます。 単位: なし 有効な統計: すべて |
Feature Store 消費メトリクスのディメンション
ディメンション | 説明 |
---|---|
FeatureGroupName , OperationName |
指定した特徴量グループおよび操作の Feature Store ランタイム消費メトリクスをフィルタリングします。 |
Feature Store 運用メトリクス
メトリクス | 説明 |
---|---|
Invocations |
指定した期間に Feature Store ランタイムオペレーションに対して行われたリクエストの数。 単位: なし 有効な統計: Sum |
Operation4XXErrors |
オペレーションが 4xx HTTPレスポンスコードを返した Feature Store ランタイムオペレーションに対して行われたリクエストの数。4xx レスポンスごとに 1 が送信され、それ以外の場合は 0 が送信されます。 単位: なし 有効な統計: 合計、平均 |
Operation5XXErrors |
オペレーションが 5xx HTTPレスポンスコードを返した特徴量ストアランタイムオペレーションに対して行われたリクエストの数。5xx レスポンスごとに 1 が送信され、それ以外の場合は 0 が送信されます。 単位: なし 有効な統計: 合計、平均 |
ThrottledRequests |
リクエストがスロットリングされた Feature Store ランタイムオペレーションに対して行われたリクエストの数。スロットリングされたリクエストごとに 1 が送信され、それ以外の場合は 0 が送信されます。 単位: なし 有効な統計: 合計、平均 |
Latency |
Feature Store ランタイムオペレーションへのリクエストを処理する時間間隔。この間隔は、リクエスト SageMaker を受信してからクライアントにレスポンスを返すまでの時間から測定されます。 単位: マイクロ秒 有効な統計: 平均、合計、最小、最大、サンプル数、パーセンタイル |
Feature Store 運用メトリクスのディメンション
ディメンション | 説明 |
---|---|
|
指定した特徴量グループと操作の Feature Store ランタイムオペレーションメトリクスをフィルタリングします。これらのディメンションは、、、 などの非バッチオペレーションに使用できます GetRecord PutRecord DeleteRecord。 |
OperationName |
指定した操作の Feature Store ランタイムオペレーションメトリクスをフィルタリングします。このディメンションは、 などのバッチオペレーションに使用できます BatchGetRecord。 |
SageMaker パイプラインメトリクス
AWS/Sagemaker/ModelBuildingPipeline
名前空間には、次のパイプライン実行のメトリクスが含まれます。
パイプライン実行メトリクスには、次の 2 つのカテゴリがあります。
-
すべてのパイプラインの実行メトリクス - アカウントレベルのパイプライン実行メトリクス (現在のアカウントのすべてのパイプライン)
-
パイプライン別の実行メトリクス - パイプラインごとのパイプライン実行メトリクス
メトリクスは、1 分間隔で利用できます。
パイプライン実行メトリクス
メトリクス | 説明 |
---|---|
ExecutionStarted |
開始されたパイプライン実行の数。 単位: カウント 有効な統計: 合計、平均 |
ExecutionFailed |
失敗したパイプライン実行の数。 単位: カウント 有効な統計: 合計、平均 |
ExecutionSucceeded |
成功したパイプライン実行の数。 単位: カウント 有効な統計: 合計、平均 |
ExecutionStopped |
停止したパイプライン実行の数。 単位: カウント 有効な統計: 合計、平均 |
ExecutionDuration |
パイプライン実行が実行された時間 (ミリ秒) 。 単位: ミリ秒 有効な統計: Average、Sum、Min、Max、Sample Count |
パイプライン別の実行メトリクスのディメンション
ディメンション | 説明 |
---|---|
PipelineName |
指定したパイプラインのパイプライン実行メトリクスをフィルタリングします。 |
パイプラインステップメトリクス
AWS/Sagemaker/ModelBuildingPipeline
名前空間には、次のパイプラインステップのメトリクスが含まれます。
メトリクスは、1 分間隔で利用できます。
メトリクス | 説明 |
---|---|
StepStarted |
開始されたステップの数。 単位: カウント 有効な統計: 合計、平均 |
StepFailed |
失敗したステップの数。 単位: カウント 有効な統計: 合計、平均 |
StepSucceeded |
成功したステップの数。 単位: カウント 有効な統計: 合計、平均 |
StepStopped |
停止したステップの数。 単位: カウント 有効な統計: 合計、平均 |
StepDuration |
ステップが実行された時間 (ミリ秒) 。 単位: ミリ秒 有効な統計: Average、Sum、Min、Max、Sample Count |
パイプラインステップメトリクスのディメンション
ディメンション | 説明 |
---|---|
PipelineName , StepName |
指定したパイプラインとステップのステップメトリクスをフィルタリングします。 |