기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
Amazon SageMaker AI는 훈련 중에 사용되는 AWS소유 및 오픈 소스 라이브러리 사용에 대한 집계 정보를 수집합니다. SageMaker AI는이 집계 메타데이터를 사용하여 서비스와 고객 경험을 개선합니다.
다음 섹션에서는 SageMaker AI가 수집하는 메타데이터 유형과 메타데이터 수집을 옵트아웃하는 방법에 대한 설명을 제공합니다.
수집되는 정보의 유형
- 사용 정보
-
분산 훈련, 컴파일 및 양자화에 사용되는 라이브러리와 같이 SageMaker 훈련에 사용되는 AWS소유 및 오픈 소스 라이브러리의 메타데이터입니다.
- 오류
-
SageMaker 훈련 플랫폼과의 상호 작용으로 인한 장애, 충돌, 캐스케이드를 포함한 예상치 못한 동작으로 인한 오류입니다.
메타데이터 수집을 옵트아웃하는 방법
CreateTrainingJob
API를 사용하여 훈련 작업을 만들 때 집계된 메타데이터를 SageMaker 훈련과 공유하지 않도록 옵트아웃할 수 있습니다. 콘솔을 사용하여 훈련 작업을 만드는 경우 메타데이터 수집은 기본적으로 비활성화됩니다.
중요
제출하는 각 훈련 작업에 대한 메타데이터 수집을 옵트아웃하도록 선택해야 합니다. 또한 다음 예시와 같이 API 직접 호출에서 옵트아웃하도록 선택해야 합니다. 훈련 스크립트 내에서는 옵트아웃을 선택할 수 없습니다.
다음 섹션에서는 AWS CLI AWS SDK for Python (Boto3), 또는 SageMaker Python SDK를 사용하여 메타데이터 수집을 옵트아웃하는 방법을 보여줍니다.
AWS Command Line Interface (AWS CLI)를 사용하여 메타데이터 수집 옵트아웃
를 사용하여 메타데이터 수집을 옵트아웃하려면 다음 코드 예제와 같이 환경 변수를 create-training-job
API1
에서 OPT_OUT_TRACKING
로 AWS CLI설정합니다.
aws sagemaker create-training-job \ --training-job-name
your_job_name
\ --algorithm-specification AlgorithmName=your_algorithm_name
\ --output-data-config S3OutputPath=s3://bucket-name/key-name-prefix
\ --resource-config InstanceType=ml.c5.xlarge
, InstanceCount=1
\ --stopping-condition MaxRuntimeInSeconds=100
\ --environment OPT_OUT_TRACKING=1
를 사용하여 메타데이터 수집 옵트아웃 AWS SDK for Python (Boto3)
SDK for Python(Boto3)을 사용하여 메타데이터 수집을 옵트아웃하려면 다음 코드 예시와 같이 create_training_job
API에서 환경 변수 OPT_OUT_TRACKING
을 1
로 설정합니다.
boto3.client('sagemaker').create_training_job( TrainingJobName='
your_training_job
', AlgorithmSpecification={ 'AlgorithmName': 'your_algorithm_name
', 'TrainingInputMode': 'File', }, RoleArn='your_arn
', OutputDataConfig={ 'S3OutputPath': 's3://bucket-name/key-name-prefix
', }, ResourceConfig={ 'InstanceType': 'ml.m4.xlarge
', 'InstanceCount':1
, 'VolumeSizeInGB':123
, }, StoppingCondition={ 'MaxRuntimeInSeconds':123
, }, Environment={ 'OPT_OUT_TRACKING': '1' }, )
SageMaker Python SDK를 사용하여 메타데이터 수집 옵트아웃
SageMaker Python SDK를 사용하여 메타데이터 수집을 옵트아웃하려면 다음 코드 예제와 같이 환경 변수를 SageMaker AI 예측기 OPT_OUT_TRACKING
1
내부로 설정합니다.
sagemaker.estimator( image_uri='
path_to_container
', role='rolearn
', instance_count=1
, instance_type='ml.c5.xlarge
', environment={ 'OPT_OUT_TRACKING': '1' }, )
계정 전체에서 메타데이터 수집 옵트아웃
여러 계정을 메타데이터 수집을 옵트아웃하려면 계정 전체 추적에서 옵트아웃하도록 환경 변수를 설정할 수 있습니다. 계정 수준에서 메타데이터 수집을 옵트아웃하려면 SageMaker AI Python SDK를 사용해야 합니다.
다음 코드 예시는 계정 전체 추적을 옵트아웃하는 방법을 보여줍니다.
SchemaVersion: '1.0'
SageMaker:
TrainingJob:
Environment:
'OPT_OUT_TRACKING': '1'
계정 전체 추적을 옵트아웃하는 방법에 대한 자세한 내용은 Configuring and using defaults with the SageMaker Python SDK
추가 정보
다운스트림 서비스가 SageMaker AI 훈련에 의존하는 경우
SageMaker 훈련에 의존하는 서비스를 운영하는 경우 고객에게 SageMaker 훈련 플랫폼의 집계 메타데이터 수집에 대해 알리고 옵트아웃할 수 있는 선택권을 제시하는 것이 좋습니다. 또는 고객을 대신하여 메타데이터 수집을 옵트아웃할 수 있습니다.
SageMaker AI 훈련을 사용하는 서비스의 클라이언트 또는 고객인 경우
SageMaker 훈련을 사용하는 서비스의 클라이언트 또는 고객인 경우 이전 섹션에서 선호하는 방법을 사용하여 메타데이터 수집을 옵트아웃합니다.