Amazon SageMaker Profiler - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon SageMaker Profiler

Amazon SageMaker Profiler は現在プレビューリリース中で、サポートされている で無料で利用できます AWS リージョン。Amazon SageMaker Profiler の一般提供バージョン (存在する場合) には、プレビューで提供される機能や料金とは異なる機能が含まれている場合があります。

Amazon SageMaker Profiler は、 での深層学習モデルのトレーニング中にプロビジョニングされたコンピューティングリソースの詳細ビュー SageMaker AWS を提供する Amazon の機能です SageMaker。CPU とGPU使用状況のプロファイリング、カーネルの実行は GPUs、カーネルの起動は CPUs、同期オペレーション、 CPUsと のメモリオペレーションGPUs、カーネル起動と対応する実行の間のレイテンシー、 CPUsと 間のデータ転送に焦点を当てていますGPUs。 SageMaker プロファイラーは、プロファイル 、プロファイルされたイベントの統計概要、およびトレーニングジョブのタイムラインを視覚化してGPUs、 と のイベント時間関係を追跡および理解するためのユーザーインターフェイス (UI) も提供しますCPUs。

注記

SageMaker Profiler は PyTorch 、 の Deep Learning Containers で TensorFlow と をサポートしています。 AWS SageMaker詳細については、「サポートされているフレームワークイメージ AWS リージョン、インスタンスタイプ」を参照してください。

データサイエンティスト向け

大規模なコンピューティングクラスターで深層学習モデルをトレーニングすると、ボトルネック、カーネル起動レイテンシー、メモリ制限、リソース使用率の低下など、計算最適化の問題が発生することがよくあります。

このような計算パフォーマンスの問題を特定するには、コンピューティングリソースを詳細に分析して、どのカーネルがレイテンシーを発生させ、どのオペレーションがボトルネックの原因となっているかを理解する必要があります。データサイエンティストは、 SageMaker Profiler UI を使用してトレーニングジョブの詳細プロファイルを視覚化することでメリットを得ることができます。UI は、要約グラフとコンピューティングリソース上のすべてのイベントを追跡するためのタイムラインインターフェースを備えたダッシュボードを提供します。データサイエンティストは、カスタム注釈を追加して、 SageMaker Profiler Python モジュールを使用してトレーニングジョブの特定部分を追跡することもできます。

管理者向け

SageMaker コンソールまたはSageMaker ドメイン の Profiler ランディングページから、 AWS アカウントまたは SageMakerドメインの管理者であれば Profiler アプリケーションユーザーを管理できます。各ドメインユーザーは、付与されたアクセス許可を与えられれば、独自の Profiler アプリケーションにアクセスできます。 SageMaker ドメイン管理者とドメインユーザーは、アクセス許可レベルに応じて Profiler アプリケーションを作成および削除できます。