翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
アルゴリズムを使用してトレーニングジョブを実行する
アルゴリズムリソースを使用してトレーニングジョブを作成するには、Amazon SageMaker AI コンソール、低レベルの Amazon SageMaker API、または Amazon SageMaker Python SDK
トピック
アルゴリズムを使用してトレーニングジョブを実行する (コンソール)
アルゴリズムを使用してトレーニングジョブを実行するには (コンソール)
-
https://console.aws.amazon.com/sagemaker/
で SageMaker AI コンソールを開きます。 -
[Algorithms (アルゴリズム)] を選択します。
-
[My algorithms (マイアルゴリズム)] タブのリストから作成したアルゴリズムを選択するか、[AWS Marketplace subscriptions (AWS Marketplace サブスクリプション)] タブでサブスクライブしたアルゴリズムを選択します。
-
[トレーニングジョブの作成] を選択します。
選択したアルゴリズムが自動的に選択されます。
-
[トレーニングジョブの作成] ページで、以下の情報を指定します。
-
[ジョブ名] には、トレーニングジョブの名前を入力します。
-
IAM ロールの場合は、SageMaker AI でトレーニングジョブを実行するために必要なアクセス許可を持つ IAM ロールを選択するか、新しいロールの作成を選択して、SageMaker AI が
AmazonSageMakerFullAccess
管理ポリシーがアタッチされたロールを作成できるようにします。詳細については、SageMaker AI 実行ロールの使用方法 を参照してください。 -
[リソース設定] では、以下の情報を指定します。
-
[インスタンスタイプ] では、トレーニングに使用するインスタンスタイプを選択します。
-
[インスタンス数] には、トレーニングジョブに使用する ML インスタンス数を入力します。
-
[インスタンスあたりのボリュームサイズ (GB)] には、プロビジョニングする ML ストレージボリュームのサイズを入力します。ML ストレージボリュームには、モデルアーティファクトと増分ステートが保存されます。
-
暗号化キーで、Amazon SageMaker AI が AWS Key Management Service キーを使用してトレーニングインスタンスにアタッチされた ML ストレージボリューム内のデータを暗号化する場合は、キーを指定します。
-
[停止条件] には、トレーニングジョブの最大実行時間を秒数、分数、時間数、または日数で指定します。
-
-
[VPC] には、トレーニングコンテナにアクセス権を付与する Amazon VPC を選択します。詳細については、「SageMaker AI トレーニングジョブに Amazon VPC 内のリソースへのアクセスを許可する」を参照してください。
-
[ハイパーパラメータ] には、トレーニングジョブに使用するハイパーパラメータの値を指定します。
-
[入力データ設定] には、トレーニングジョブに使用する入力データのチャネルごとに以下の値を指定します。アルゴリズムの [アルゴリズムの要約] ページの [チャネル仕様] セクションでは、トレーニングのサポートに使用しているアルゴリズムのチャネル、コンテンツタイプ、サポートされる圧縮タイプ、サポートされる入力モードを確認できます。
-
[チャネル名] には、入力チャネルの名前を入力します。
-
[コンテンツタイプ] には、アルゴリズムがチャネルに期待するデータのコンテンツタイプを入力します。
-
[圧縮タイプ] では、使用するデータ圧縮タイプがあればそれを選択します。
-
[レコードラッパー] では、アルゴリズムで
RecordIO
形式のデータが必要な場合に [RecordIO
] を選択します。 -
[S3 データタイプ]、[S3 データディストリビューションタイプ]、および [S3 の場所] には、適切な値を指定します。これらの値の意味については、
S3DataSource
を参照してください。 -
[入力モード] では、プロビジョニングされた ML ストレージボリュームからデータをダウンロードし、ディレクトリを Docker ボリュームにマウントする場合に [ファイル] を選択します。Amazon S3 からコンテナに直接データをストリーミングする場合は [Pipe (パイプ)] を選択します。
-
別の入力チャネルを追加するには、[チャネルの追加] を選択します。入力チャネルの追加が完了したら、[完了] を選択します。
-
-
[出力] 場所には、以下の値を指定します。
-
[S3 出力パス] では、トレーニングジョブがモデルアーティファクトなどの出力を保存する S3 の場所を選択します。
注記
この場所に保存されているモデルアーティファクトを使用して、このトレーニングジョブからモデルまたはモデルパッケージを作成します。
-
暗号化キーの場合、SageMaker AI が AWS KMS キーを使用して S3 の場所に保管中の出力データを暗号化するようにする場合。
-
-
[タグ] には、トレーニングジョブを管理するためのタグを 1 つ以上指定します。各タグは、キー、および値 (オプション) で構成されます。タグキーはリソースごとに一意である必要があります。
-
[トレーニングジョブの作成] を選択して、トレーニングジョブを実行します。
-
アルゴリズムを使用してトレーニングジョブを実行する (API)
アルゴリズムを使用してトレーニングジョブを実行する際に SageMaker API を使用するには、CreateTrainingJob
に渡す AlgorithmSpecification
オブジェクトの [AlgorithmName
] フィールドにアルゴリズムの名前または Amazon リソースネーム (ARN) を指定します。SageMaker AI でのモデルのトレーニングについては、「」を参照してくださいAmazon SageMaker でモデルをトレーニングする。
アルゴリズムを使用してトレーニングジョブを実行する (Amazon SageMaker Python SDK )
で作成またはサブスクライブしたアルゴリズムを使用してトレーニングジョブ AWS Marketplace を作成し、 AlgorithmEstimator
オブジェクトを作成し、algorithm_arn
引数の値として Amazon リソースネーム (ARN) またはアルゴリズムの名前を指定します。その後、推定器の fit
メソッドを呼び出します。以下に例を示します。
from sagemaker import AlgorithmEstimator data_path = os.path.join(DATA_DIR, 'marketplace', 'training') algo = AlgorithmEstimator( algorithm_arn='arn:aws:sagemaker:us-east-2:012345678901:algorithm/my-algorithm', role='SageMakerRole', instance_count=1, instance_type='ml.c4.xlarge', sagemaker_session=sagemaker_session, base_job_name='test-marketplace') train_input = algo.sagemaker_session.upload_data( path=data_path, key_prefix='integ-test-data/marketplace/train') algo.fit({'training': train_input})