Implante o Model Package diretamente com a API de implantação do SageMaker Edge Manager - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Implante o Model Package diretamente com a API de implantação do SageMaker Edge Manager

SageMaker O Edge Manager fornece uma API de implantação que você pode usar para implantar modelos em alvos de dispositivos sem AWS IoT Greengrass. É útil em situações em que você deseja atualizar modelos independentemente das atualizações de firmware ou dos mecanismos de implantação de aplicações. Você pode usar a API para integrar suas implantações de borda em um fluxo de trabalho de CI/CD para implantar modelos automaticamente depois de validar seu modelo quanto à precisão. A API também possui opções convenientes de reversão e implementação gradual para garantir que os modelos funcionem bem em um ambiente específico antes de uma implementação mais ampla.

Para usar a API de implantação do Edge Manager, primeiro compile e empacote seu modelo. Para obter informações sobre como compilar e empacotar seu modelo, consulte Prepare o modelo para implantação. As seções a seguir deste guia mostram como você pode criar implantações de borda usando a SageMaker API, depois de compilar e empacotar seus modelos.

Crie um plano de implantação de borda

Você pode criar um plano de implantação da borda com a API CreateEdgeDeploymentPlan. O plano de implantação pode ter vários estágios. Você pode configurar cada estágio para implantar a implantação em um subconjunto de dispositivos de borda (por porcentagem ou por nome do dispositivo). Você também pode configurar como as falhas de implantação são tratadas em cada estágio.

O trecho de código a seguir mostra como você pode criar um plano de implantação de borda com 1 estágio para implantar um modelo compilado e empacotado em dois dispositivos de borda específicos:

import boto3 client = boto3.client("sagemaker") client.create_edge_deployment_plan( EdgeDeploymentPlanName="edge-deployment-plan-name", DeviceFleetName="device-fleet-name", ModelConfigs=[ { "EdgePackagingJobName": "edge-packaging-job-name", "ModelHandle": "model-handle" } ], Stages=[ { "StageName": "stage-name", "DeviceSelectionConfig": { "DeviceSubsetType": "SELECTION", "DeviceNames": ["device-name-1", "device-name-2"] }, "DeploymentConfig": { "FailureHandlingPolicy": "ROLLBACK_ON_FAILURE" } } ] )

Em vez de dispositivos específicos, se você quiser implantar o modelo em uma porcentagem de dispositivos em sua frota, defina o valor de DeviceSubsetType como "PERCENTAGE" e substitua "DeviceNames": ["device-name-1", "device-name-2"] por "Percentage": desired-percentage no exemplo acima.

Os estágios podem ser adicionados após a criação do plano de implantação com a CreateEdgeDeploymentStageAPI, caso você queira começar a implementar novos estágios após validar o sucesso do lançamento do teste. Para obter mais informações sobre os estágios de implantação, consulte DeploymentStage.

Iniciar a implantação da borda

Depois de criar o plano de implantação e os estágios de implantação, você pode iniciar a implantação com a API StartEdgeDeploymentStage.

client.start_edge_deployment_stage( EdgeDeploymentPlanName="edge-deployment-plan-name", StageName="stage-name" )

Verifique o status da implantação

Você pode verificar o status da implantação periférica com a DescribeEdgeDeploymentPlanAPI.

client.describe_edge_deployment_plan( EdgeDeploymentPlanName="edge-deployment-plan-name" )