Amazon SageMaker Python에서 를 사용하는 HuggingFaceProcessor 코드 예제 SDK - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon SageMaker Python에서 를 사용하는 HuggingFaceProcessor 코드 예제 SDK

Hugging Face는 자연어 처리(NLP) 모델을 제공하는 오픈 소스 제공업체입니다. Amazon SageMaker PythonHuggingFaceProcessor의 는 Hugging Face 스크립트로 처리 작업을 실행할 수 있는 기능을 SDK 제공합니다. HuggingFaceProcessor를 사용하면 Amazon에서 구축한 Docker 컨테이너를 관리형 Hugging Face 환경과 함께 활용할 수 있으므로 컨테이너를 직접 가져올 필요가 없습니다.

다음 코드 예제는 HuggingFaceProcessor에서 제공하고 유지 관리하는 Docker 이미지를 사용하여 처리 작업을 실행하는 방법을 보여줍니다 SageMaker. 작업을 실행할 때 source_dir 인수에 스크립트와 종속 항목이 포함된 디렉터리를 지정할 수 있으며, 디렉터리 내에 처리 스크립트(들)의 종속성을 source_dir 지정하는 requirements.txt 파일이 있을 수 있습니다. SageMaker 처리는 의 종속성을 컨테이너requirements.txt에 설치합니다.

from sagemaker.huggingface import HuggingFaceProcessor from sagemaker.processing import ProcessingInput, ProcessingOutput from sagemaker import get_execution_role #Initialize the HuggingFaceProcessor hfp = HuggingFaceProcessor( role=get_execution_role(), instance_count=1, instance_type='ml.g4dn.xlarge', transformers_version='4.4.2', pytorch_version='1.6.0', base_job_name='frameworkprocessor-hf' ) #Run the processing job hfp.run( code='processing-script.py', source_dir='scripts', inputs=[ ProcessingInput( input_name='data', source=f's3://{BUCKET}/{S3_INPUT_PATH}', destination='/opt/ml/processing/input/data/' ) ], outputs=[ ProcessingOutput(output_name='train', source='/opt/ml/processing/output/train/', destination=f's3://{BUCKET}/{S3_OUTPUT_PATH}'), ProcessingOutput(output_name='test', source='/opt/ml/processing/output/test/', destination=f's3://{BUCKET}/{S3_OUTPUT_PATH}'), ProcessingOutput(output_name='val', source='/opt/ml/processing/output/val/', destination=f's3://{BUCKET}/{S3_OUTPUT_PATH}') ] )

requirements.txt 파일이 있는 경우, 컨테이너에 설치하려는 라이브러리 목록이어야 합니다. 의 경로는 상대, 절대 또는 Amazon S3 URI 경로일 source_dir 수 있습니다. 그러나 Amazon S3 를 사용하는 경우 tar.gz 파일을 가리URI켜야 합니다. source_dir에 대해 지정한 디렉터리에 스크립트가 여러 개 있을 수 있습니다. HuggingFaceProcessor 클래스에 대한 자세한 내용은 Amazon SageMaker PythonSDKHugging Face Estimator를 참조하세요.