本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
部署模型
當您從 部署模型時 JumpStart, 會 SageMaker 託管模型並部署可用於推論的端點。 JumpStart 也提供範例筆記本,您可以在模型部署後用來存取模型。
重要
截至 2023 年 11 月 30 日,先前的 Amazon SageMaker Studio 體驗現在已命名為 Amazon SageMaker Studio Classic。以下章節是使用 Studio Classic 應用程式的特定部分。如需有關使用更新 Studio 體驗的資訊,請參閱 Amazon SageMaker Studio。
注意
如需 Studio 中 JumpStart 模型部署的詳細資訊,請參閱 在 Studio 中部署模型
模型部署組態
選擇模型後,會開啟模型的索引標籤。在部署模型窗格中,選擇部署組態以設定模型部署。
部署模型的預設執行個體類型取決於模型。執行個體類型是執行訓練工作的硬體。在下列範例中,ml.p2.xlarge
執行個體是此特定BERT模型的預設值。
您也可以變更端點名稱、新增key;value
資源標籤、啟用或停用任何與模型相關 JumpStart 資源的jumpstart-
字首,以及指定 Amazon S3 儲存貯體來存放 SageMaker 端點使用的模型成品。
選擇安全設定以指定模型的 AWS Identity and Access Management (IAM ) 角色、Amazon Virtual Private Cloud (Amazon VPC) 和加密金鑰。
模型部署安全性
使用 部署模型時 JumpStart,您可以指定模型IAM的角色VPC、Amazon 和加密金鑰。如果您沒有為這些項目指定任何值:預設IAM角色是 Studio Classic 執行期角色;使用預設加密;不使用 AmazonVPC。
IAM 角色
您可以選取作為訓練任務和託管任務一部分IAM傳遞的角色。 SageMaker 使用此角色來存取訓練資料和模型成品。如果您未選取IAM角色, 會使用 Studio Classic 執行期角色 SageMaker 部署模型。如需IAM角色的詳細資訊,請參閱 Amazon 的身分和存取管理 SageMaker。
您傳遞的角色必須能夠存取模型所需的資源,並且必須包含下列所有項目。
-
對於託管任務:CreateModel API:執行角色許可。
注意
您可以縮小以下每個角色授予的 Amazon S3 權限範圍。使用 ARN Amazon Simple Storage Service (Amazon S3) 儲存貯體和 JumpStart Amazon S3 儲存貯體的 來執行此操作。
{ "Effect": "Allow", "Action": [ "s3:GetObject", "s3:PutObject", "s3:ListMultipartUploadParts", "s3:ListBucket" ], "Resources": [ "arn:aws:s3:::jumpstart-cache-prod-
<region>
/*", "arn:aws:s3:::jumpstart-cache-prod-<region>
", "arn:aws:s3:::bucket
/*" ] }
尋找IAM角色
如果您選取此選項,則必須從下拉式清單中選取現有IAM角色。
輸入IAM角色
如果選取此選項,則必須手動輸入現有IAM角色ARN的 。如果您的 Studio Classic 執行期角色或 Amazon VPC封鎖iam:list*
呼叫,您必須使用此選項來使用現有IAM角色。
Amazon VPC
所有 JumpStart 模型都以網路隔離模式執行。建立模型容器之後,就不能再進行呼叫。您可以選擇VPC作為訓練任務和託管任務一部分傳遞的 Amazon。 SageMaker 使用此 Amazon VPC從您的 Amazon S3 儲存貯體中推送和提取資源。此 Amazon 與限制從 Studio Classic VPC 執行個體存取公有網際網路的 Amazon VPC不同。如需 Studio Classic Amazon 的詳細資訊VPC,請參閱 將 中的 Studio 筆記本VPC連線至外部資源。
您傳遞VPC的 Amazon 不需要存取公有網際網路,但確實需要存取 Amazon S3。Amazon S3 的 Amazon VPC端點必須至少允許存取模型所需的下列資源。
{ "Effect": "Allow", "Action": [ "s3:GetObject", "s3:PutObject", "s3:ListMultipartUploadParts", "s3:ListBucket" ], "Resources": [ "arn:aws:s3:::jumpstart-cache-prod-
<region>
/*", "arn:aws:s3:::jumpstart-cache-prod-<region>
", "arn:aws:s3:::bucket
/*" ] }
如果您未選取 Amazon VPC,則不會VPC使用 Amazon。
尋找 VPC
如果您選取此選項,則必須VPC從下拉式清單中選取現有的 Amazon。選取 Amazon 之後VPC,您必須選取 Amazon 的子網路和安全群組VPC。如需子網路和安全群組的詳細資訊,請參閱 VPCs和 子網路概觀。
輸入 VPC
如果選取此選項,則必須手動選取構成 Amazon 的子網路和安全群組VPC。如果您的 Studio Classic 執行期角色或 Amazon VPC封鎖ec2:list*
呼叫,您必須使用此選項來選取子網路和安全群組。
加密金鑰
您可以選取作為訓練任務和託管任務一部分傳遞的 AWS KMS 金鑰。 SageMaker 使用此金鑰來加密容器的 Amazon EBS磁碟區,以及 Amazon S3 中用於託管任務和訓練任務輸出的重新封裝模型。如需 AWS KMS 金鑰的詳細資訊,請參閱AWS KMS 金鑰 。
您傳遞的金鑰必須信任您傳遞IAM的角色。如果您未指定IAM角色, AWS KMS 金鑰必須信任 Studio Classic 執行期角色。
如果您未選取 AWS KMS 金鑰, 會為 Amazon EBS磁碟區中的資料和 Amazon S3 成品 SageMaker 提供預設加密。
尋找加密金鑰
如果您選取此選項,則必須從下拉式清單中選取現有的 AWS KMS 金鑰。
輸入加密金鑰
如果選取此選項,則必須手動輸入 AWS KMS 金鑰。如果您的 Studio Classic 執行角色或 Amazon VPC封鎖kms:list*
呼叫,您必須使用此選項來選取現有的 AWS KMS 金鑰。
設定 JumpStart 模型的預設值
您可以設定IAM角色、 VPCs和 KMS金鑰等參數的預設值,以預先填入 JumpStart 模型部署和訓練。設定預設值後,Studio Classic UI 會自動將指定的安全設定和標籤提供給 JumpStart 模型,以簡化部署和訓練工作流程。管理員和最終使用者可以初始化組態檔案中指定的預設值YAML,格式為 。
根據預設, SageMaker Python SDK會使用兩個組態檔案:一個用於管理員,一個用於使用者。管理員可以使用系統管理員組態檔案定義一組預設值。終端使用者可以覆寫管理員組態檔案中設定的值,並使用終端使用者組態檔設定其他預設值。如需詳細資訊,請參閱預設組態檔案位置
下列程式碼範例會列出在 Amazon SageMaker Studio Classic SDK中使用 SageMaker Python 時組態檔案的預設位置。
# Location of the admin config file /etc/xdg/sagemaker/config.yaml # Location of the user config file /root/.config/sagemaker/config.yaml
在使用者組態檔案中指定的值會取代管理員組態檔案中設定的值。組態檔案對 Amazon SageMaker 網域中的每個使用者設定檔是唯一的。使用者的 Studio Classic 應用程式會直接與使用者設定檔建立關聯。如需詳細資訊,請參閱網域使用者設定檔。
管理員可以透過JupyterServer
生命週期組態選擇性地設定 JumpStart 模型訓練和部署的組態預設值。如需詳細資訊,請參閱建立並關聯生命週期組態。
您的組態檔案應遵循 SageMaker Python SDK組態檔案結構 TrainingJob
、 Model
和 EndpointConfig
組態中的特定欄位適用於 JumpStart 模型訓練和部署預設值。
SchemaVersion: '1.0' SageMaker: TrainingJob: OutputDataConfig: KmsKeyId:
example-key-id
ResourceConfig: # Training configuration - Volume encryption key VolumeKmsKeyId:example-key-id
# Training configuration form - IAM role RoleArn: arn:aws:iam::123456789012
:role/SageMakerExecutionRole VpcConfig: # Training configuration - Security groups SecurityGroupIds: -sg-1
-sg-2
# Training configuration - Subnets Subnets: -subnet-1
-subnet-2
# Training configuration - Custom resource tags Tags: - Key:Example-key
Value:Example-value
Model: EnableNetworkIsolation:true
# Deployment configuration - IAM role ExecutionRoleArn: arn:aws:iam::123456789012
:role/SageMakerExecutionRole VpcConfig: # Deployment configuration - Security groups SecurityGroupIds: -sg-1
-sg-2
# Deployment configuration - Subnets Subnets: -subnet-1
-subnet-2
EndpointConfig: AsyncInferenceConfig: OutputConfig: KmsKeyId:example-key-id
DataCaptureConfig: # Deployment configuration - Volume encryption key KmsKeyId:example-key-id
KmsKeyId:example-key-id
# Deployment configuration - Custom resource tags Tags: - Key:Example-key
Value:Example-value