在您的设备上进行推断 - Amazon SageMaker

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在您的设备上进行推断

在此示例中,您将使用 Boto3 将编译作业的输出下载到边缘设备上。然后,您将从数据集中导入DLR、下载示例图像,调整此图像的大小以匹配模型的原始输入,然后进行预测。

  1. 将编译过的模型从 Amazon S3 下载到您的设备上,然后将其从压缩的 tarfile 中提取它。

    # Download compiled model locally to edge device object_path = f'output/{model_name}-{target_device}.tar.gz' neo_compiled_model = f'compiled-{model_name}.tar.gz' s3_client.download_file(bucket_name, object_path, neo_compiled_model) # Extract model from .tar.gz so DLR can use it !mkdir ./dlr_model # make a directory to store your model (optional) !tar -xzvf ./compiled-detect.tar.gz --directory ./dlr_model
  2. 导入DLR和初始化的DLRModel对象。

    import dlr device = 'cpu' model = dlr.DLRModel('./dlr_model', device)
  3. 下载用于推理的映像,并根据模型的训练方式确定其格式

    coco_ssd_mobilenet例如,您可以从COCO数据集中下载图像,然后将图像转换为300x300

    from PIL import Image # Download an image for model to make a prediction input_image_filename = './input_image.jpg' !curl https://farm9.staticflickr.com/8325/8077197378_79efb4805e_z.jpg --output {input_image_filename} # Format image so model can make predictions resized_image = image.resize((300, 300)) # Model is quantized, so convert the image to uint8 x = np.array(resized_image).astype('uint8')
  4. 用于DLR进行推断

    最后,您可以使用DLR对刚刚下载的图像进行预测:

    out = model.run(x)

有关使用DLR在边缘设备上从 Neo 编译的模型进行推断的更多示例,请参阅 Github 存储库。neo-ai-dlr