を使用してコンパイル済みモデルをデプロイする AWS CLI - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

を使用してコンパイル済みモデルをデプロイする AWS CLI

モデルが AWS SDK for Python (Boto3)、、または Amazon SageMaker コンソールを使用してコンパイルされている場合は AWS CLI、前提条件セクションを満たす必要があります。を使用して SageMaker Neo コンパイルモデルを作成およびデプロイするには、以下のステップに従いますAWS CLI

モデルをデプロイする

前提条件 を満たしたら、create-modelcreate-enpoint-config、および create-endpoint AWS CLI コマンドを使用します。次のステップでは、これらのコマンドを使って Neo コンパイル済みモデルをデプロイする方法を説明します。

モデルを作成する

Neo 推論コンテナイメージ から推論イメージを選択し、 create-model API URIを使用して SageMaker モデルを作成します。これは 2 つのステップで行えます。

  1. create_model.json ファイルを作成します。ファイル内で、モデルの名前、イメージ URI、Amazon S3 バケット内のmodel.tar.gzファイルへのパス、実行 SageMakerロールを指定します。

    { "ModelName": "insert model name", "PrimaryContainer": { "Image": "insert the ECR Image URI", "ModelDataUrl": "insert S3 archive URL", "Environment": {"See details below"} }, "ExecutionRoleArn": "ARN for AmazonSageMaker-ExecutionRole" }

    を使用してモデルをトレーニングした場合は SageMaker、次の環境変数を指定します。

    "Environment": { "SAGEMAKER_SUBMIT_DIRECTORY" : "[Full S3 path for *.tar.gz file containing the training script]" }

    を使用してモデルをトレーニングしなかった場合は SageMaker、次の環境変数を指定します。

    MXNet and PyTorch
    "Environment": { "SAGEMAKER_PROGRAM": "inference.py", "SAGEMAKER_SUBMIT_DIRECTORY": "/opt/ml/model/code", "SAGEMAKER_CONTAINER_LOG_LEVEL": "20", "SAGEMAKER_REGION": "insert your region", "MMS_DEFAULT_RESPONSE_TIMEOUT": "500" }
    TensorFlow
    "Environment": { "SAGEMAKER_PROGRAM": "inference.py", "SAGEMAKER_SUBMIT_DIRECTORY": "/opt/ml/model/code", "SAGEMAKER_CONTAINER_LOG_LEVEL": "20", "SAGEMAKER_REGION": "insert your region" }
    注記

    AmazonSageMakerFullAccess および AmazonS3ReadOnlyAccessポリシーはAmazonSageMaker-ExecutionRoleIAMロールにアタッチする必要があります。

  2. 次のコマンドを実行します。

    aws sagemaker create-model --cli-input-json file://create_model.json

    の完全な構文についてはAPI、create-model「」を参照してくださいcreate-model

エンドポイント設定を作成する

SageMaker モデルを作成したら、 create-endpoint-config を使用してエンドポイント設定を作成しますAPI。これを行うには、エンドポイント設定仕様でJSONファイルを作成します。例として次のコードテンプレートを使い、create_config.json と名付けて保存します。

{ "EndpointConfigName": "<provide your endpoint config name>", "ProductionVariants": [ { "VariantName": "<provide your variant name>", "ModelName": "my-sagemaker-model", "InitialInstanceCount": 1, "InstanceType": "<provide your instance type here>", "InitialVariantWeight": 1.0 } ] }

次に、次の AWS CLI コマンドを実行してエンドポイント設定を作成します。

aws sagemaker create-endpoint-config --cli-input-json file://create_config.json

の完全な構文についてはAPI、create-endpoint-config「」を参照してくださいcreate-endpoint-config

エンドポイントの作成

エンドポイント設定を作成したら、 create-endpoint を使用してエンドポイントを作成しますAPI。

aws sagemaker create-endpoint --endpoint-name '<provide your endpoint name>' --endpoint-config-name '<insert your endpoint config name>'

の完全な構文についてはAPI、create-endpoint「」を参照してくださいcreate-endpoint