Amazon P SageMaker rocessing 如何为您的处理容器配置输入和输出 - Amazon SageMaker

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon P SageMaker rocessing 如何为您的处理容器配置输入和输出

使用 CreateProcessingJob 操作创建处理作业时,可以指定多个 ProcessingInputProcessingOutput 值。

您可以使用ProcessingInput参数指定要从中下载数据的亚马逊简单存储服务 (Amazon URI S3),以及将数据下载到的处理容器中的路径。ProcessingOutput 参数可配置要从中上传数据的处理容器中的路径,以及将数据上传到的 Amazon S3 中的位置。对于 ProcessingInputProcessingOutput,处理容器中的路径必须以 /opt/ml/processing/ 开头。

例如,您可以创建一个处理作业,该处理作业具有一个 ProcessingInput 参数(此参数可将数据从 s3://your-data-bucket/path/to/input/csv/data 下载到处理容器中的 /opt/ml/processing/csv);还具有一个 ProcessingOutput 参数(此参数可将数据从 /opt/ml/processing/processed_csv 上传到 s3://your-data-bucket/path/to/output/csv/data)。您的处理作业将读取输入数据,并将输出数据写入 /opt/ml/processing/processed_csv。然后,将写入此路径的数据上传到指定的 Amazon S3 输出位置。

重要

符号链接 (symlinks) 不能用于将输出数据上传到 Amazon S3。上传输出数据时不遵循符号链接。