Amazon SageMaker AI 中的資料隱私權 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon SageMaker AI 中的資料隱私權

Amazon SageMaker AI 會收集訓練期間使用 AWS自有和開放原始碼程式庫的彙總資訊。SageMaker AI 使用此彙總中繼資料來改善服務和客戶體驗。

以下各節說明 SageMaker AI 收集的中繼資料類型,以及如何選擇退出中繼資料收集。

收集的資訊類型

用量資訊

用於 SageMaker 訓練的 AWS擁有和開放原始碼程式庫中繼資料,例如用於分散式訓練、編譯和量化的中繼資料。

錯誤

意外行為的錯誤,包括與 SageMaker 訓練平台互動所造成的失敗、當機、串聯和失敗。

如何選擇退出中繼資料收集

在使用 CreateTrainingJob API 建立訓練工作時,您可以選擇不與 SageMaker 訓練共用彙總中繼資料。如果您使用 主控台建立訓練任務,中繼資料收集預設為停用。

重要

您必須選擇不為提交的每個訓練任務收集中繼資料。您還必須選擇退出 API 呼叫,如下列範例所示。您無法選擇在訓練指令碼內選擇退出。

下一節說明如何使用 AWS CLI AWS SDK for Python (Boto3)、 或 SageMaker Python SDK 選擇退出中繼資料收集。

使用 AWS Command Line Interface (AWS CLI) 選擇不收集中繼資料

若要使用 選擇退出中繼資料收集 AWS CLI,請在 create-training-job API 1中將環境變數設定為 OPT_OUT_TRACKING ,如下列程式碼範例所示。

aws sagemaker create-training-job \ --training-job-name your_job_name \ --algorithm-specification AlgorithmName=your_algorithm_name\ --output-data-config S3OutputPath=s3://bucket-name/key-name-prefix \ --resource-config InstanceType=ml.c5.xlarge, InstanceCount=1 \ --stopping-condition MaxRuntimeInSeconds=100 \ --environment OPT_OUT_TRACKING=1

使用 選擇退出中繼資料收集 AWS SDK for Python (Boto3)

若要使用適用於 Python 的 SDK (Boto3) 選擇退出中繼資料收集,請在 create_training_job API 1中將環境變數設定為 OPT_OUT_TRACKING ,如下列程式碼範例所示。

boto3.client('sagemaker').create_training_job( TrainingJobName='your_training_job', AlgorithmSpecification={ 'AlgorithmName': 'your_algorithm_name', 'TrainingInputMode': 'File', }, RoleArn='your_arn', OutputDataConfig={ 'S3OutputPath': 's3://bucket-name/key-name-prefix', }, ResourceConfig={ 'InstanceType': 'ml.m4.xlarge', 'InstanceCount': 1, 'VolumeSizeInGB': 123, }, StoppingCondition={ 'MaxRuntimeInSeconds': 123, }, Environment={ 'OPT_OUT_TRACKING': '1' }, )

使用 SageMaker Python SDK 選擇退出中繼資料集合

若要使用 SageMaker Python SDK 選擇退出中繼資料收集,請將環境變數OPT_OUT_TRACKING設定為 SageMaker AI 估算器1內部,如下列程式碼範例所示。

sagemaker.estimator( image_uri='path_to_container', role='rolearn', instance_count=1, instance_type='ml.c5.xlarge', environment={ 'OPT_OUT_TRACKING': '1' }, )

選擇退出整個帳戶的中繼資料集合

如果您想要選擇退出多個帳戶的中繼資料收集,您可以將環境變數設定為選擇退出整個追蹤帳戶。您必須使用 SageMaker AI Python SDK,在帳戶層級選擇退出中繼資料集合。

下列程式碼範例顯示如何選擇退出整個帳戶的追蹤。

SchemaVersion: '1.0' SageMaker: TrainingJob: Environment: 'OPT_OUT_TRACKING': '1'

如需如何選擇不追蹤整個帳戶的詳細資訊,請參閱搭配 SageMaker Python SDK 設定和使用預設值

其他資訊

如果您的下游服務依賴 SageMaker AI 訓練

如果您操作依賴 SageMaker 訓練的服務,強烈建議您通知客戶 SageMaker Training 平台中的彙總中繼資料收集,並向他們提供選擇退出的選擇。或者,您可以代表客戶選擇退出中繼資料集合。

如果您是使用 SageMaker AI 訓練之服務的用戶端或客戶

如果您是使用 SageMaker 訓練之服務的用戶端或客戶,請使用上一節中您偏好的方法來選擇退出中繼資料收集。