Amazon SageMaker AI에서 Hugging Face를 사용하기 위한 리소스 - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon SageMaker AI에서 Hugging Face를 사용하기 위한 리소스

Amazon SageMaker AI를 사용하면 고객이 SageMaker AI에서 자연어 처리(NLP)를 위한 Hugging Face 모델을 사용하여 추론을 훈련, 미세 조정 및 실행할 수 있습니다. Hugging Face는 훈련과 추론 모두에 사용할 수 있습니다. 다음 섹션에서는 Hugging Face 모델에 대한 정보를 제공하고 SageMaker AI와 함께 Hugging Face를 사용하는 방법을 배우는 데 사용할 수 있는 참조 자료를 포함합니다.

이 기능은 Hugging Face AWS 딥 러닝 컨테이너 개발을 통해 사용할 수 있습니다. 이러한 컨테이너에는 Hugging Face Transformer, Tokenizer 및 데이터세트 라이브러리가 포함되어 있어 이러한 리소스를 훈련 및 추론 작업에 사용할 수 있습니다. 딥 러닝 컨테이너에서 사용할 수 있는 이미지 목록은 사용 가능한 딥 러닝 컨테이너 이미지를 참조하세요. 이러한 딥 러닝 컨테이너 이미지는 보안 패치를 통해 유지 관리되고 정기적으로 업데이트됩니다.

훈련을 위해 SageMaker Python SDK와 함께 Hugging Face 딥 러닝 컨테이너를 사용하려면 Hugging Face SageMaker AI 예측기를 참조하세요. Hugging Face Estimator를 사용하면 다른 SageMaker AI Estimator와 마찬가지로 Hugging Face 모델을 사용할 수 있습니다. 하지만 SageMaker Python SDK를 사용하는 것은 선택 사항입니다. 또한 AWS CLI 및를 사용하여 Hugging Face 딥 러닝 컨테이너 사용을 오케스트레이션할 수 있습니다 AWS SDK for Python (Boto3).

Hugging Face와 사용 가능한 모델에 대한 자세한 내용은 Hugging Face 설명서를 참조하세요.

학습

훈련을 실행하려면 Hugging Face에서 제공되는 수천 개의 모델 중 원하는 모델을 사용하고 추가 훈련을 통해 사용 사례에 맞게 미세 조정합니다. SageMaker AI를 사용하면 표준 훈련을 사용하거나 SageMaker AI 분산 데이터 및 모델 병렬 훈련을 활용할 수 있습니다.

사용자 지정 코드를 사용하는 다른 SageMaker 훈련 작업과 마찬가지로, 지표 정의를 SageMaker Python SDK에 전달하여 자체 지표를 캡처할 수 있습니다. 예시는 Defining Training Metrics (SageMaker Python SDK)을 참조하세요. 캡처된 지표는 CloudWatch를 사용하고 TrainingJobAnalytics 메서드를 사용해 Panders DataFrame으로 액세스할 수 있습니다. 모델을 훈련하고 미세 조정한 후에는 다른 모델처럼 사용하여 추론 작업을 실행할 수 있습니다.

Hugging Face Estimator를 사용하여 훈련을 실행하는 방법

SageMaker AI Python SDK를 사용하여 훈련 작업에 Hugging Face Estimator를 구현할 수 있습니다. SageMaker Python SDK는 SageMaker AI에서 기계 학습 모델을 훈련하고 배포하기 위한 오픈 소스 라이브러리입니다. Hugging Face Estimator에 대한 자세한 내용은 SageMaker AI Python SDK 설명서를 참조하세요.

SageMaker Python SDK를 사용하면 다음과 같은 환경에서 Hugging Face Estimator를 사용하여 훈련 작업을 실행할 수 있습니다.

  • Amazon SageMaker Studio Classic: Studio Classic은 기계 학습(ML)을 위한 최초의 완전 통합 개발 환경(IDE)입니다. Studio Classic은 다음에 필요한 모든 ML 개발 단계를 수행할 수 있는 단일 웹 기반 시각적 인터페이스를 제공합니다.

    • 준비

    • build

    • 훈련 및 조정

    • 모델 배포 및 관리

    Studio Classic에서 Jupyter Notebook을 사용하는 방법에 대한 자세한 내용은 Amazon SageMaker Studio Classic 노트북 사용 섹션을 참조하세요.

  • SageMaker 노트북 인스턴스: Amazon SageMaker 노트북 인스턴스는 Jupyter Notebook 앱을 실행하는 기계 학습(ML) 컴퓨팅 인스턴스입니다. 이 앱을 사용하면 노트북 인스턴스에서 Jupyter Notebook을 실행하여 다음을 수행할 수 있습니다.

    • 데이터 준비 및 처리

    • 모델을 훈련하기 위한 코드 작성

    • SageMaker AI 호스팅에 모델 배포

    • Debugger, Model Monitoring 및 웹 기반 IDE와 같은 SageMaker Studio 기능 없이 모델 테스트 또는 검증

  • 로컬:에 연결되어 AWS 있고 적절한 SageMaker AI 권한이 있는 경우 SageMaker Python SDK를 로컬에서 사용할 수 있습니다. 로컬 사용을 통해 SageMaker AI의 Hugging Face에 대한 원격 훈련 및 추론 작업을 시작할 수 있습니다 AWS. 이는 로컬 머신뿐만 아니라 연결된 SageMaker Python SDK와 적절한 권한이 있는 다른 AWS 서비스에서도 작동합니다.

Inference

추론의 경우 훈련된 Hugging Face 모델 또는 사전 훈련된 Hugging Face 모델 중 하나를 사용하여 SageMaker AI로 추론 작업을 배포할 수 있습니다. 이 공동 작업을 사용하면 SageMaker AI를 사용하여 훈련된 모델과 사전 훈련된 모델을 모두 배포하는 데 한 줄의 코드만 있으면 됩니다. 또한 사용자 지정 추론 코드를 작성할 필요 없이 추론 작업을 실행할 수 있습니다. 사용자 지정 추론 코드를 사용하면 고유한 Python 스크립트를 제공하여 추론 로직을 사용자 지정할 수 있습니다.

Hugging Face 딥 러닝 컨테이너를 사용하여 추론 작업을 배포하는 방법

SageMaker AI를 사용하여 추론을 실행하는 두 가지 옵션이 있습니다. 훈련한 모델을 사용하여 추론을 실행하거나 사전 훈련된 Hugging Face 모델을 배포할 수 있습니다.

  • 훈련된 모델로 추론 실행: 훈련된 자체 모델을 사용하여 추론을 실행하는 두 가지 옵션이 있습니다.

    • SageMaker AI Hugging Face 딥 러닝 컨테이너를 사용하여 기존 Hugging Face 모델을 사용하여 훈련한 모델로 추론을 실행합니다.

    • 기존 Hugging Face 모델을 가져와서 SageMaker AI를 사용하여 배포합니다.

    SageMaker AI Hugging Face Estimator로 훈련한 모델로 추론을 실행하면 훈련이 완료된 후 즉시 모델을 배포할 수 있습니다. 훈련된 모델을 Amazon S3 버킷에 업로드하고 나중에 추론을 실행할 때 수집할 수도 있습니다.

    자체 보유한 기존 Hugging Face 모델을 직접 가져오는 경우 훈련된 모델을 Amazon S3 버킷에 업로드해야 합니다. 그런 다음 Deploy your Hugging Face Transformers for inference example에 나온 것과 같이 추론을 실행할 때 해당 버킷을 수집합니다.

  • 사전 훈련된 HuggingFace 모델로 추론 실행: 사전 훈련된 수천 개의 Hugging Face 모델 중 하나를 사용하여 추가 훈련 없이 추론 작업을 실행할 수 있습니다. 추론을 실행하려면 추론을 위해 Deploy pre-trained Hugging Face Transformers for inference example에 설명된 대로 Hugging Face 모델 목록에서 사전 훈련된 모델을 선택합니다.

어떤 작업을 수행하려고 합니까?

Hugging Face 노트북 리포지토리의 다음 노트북은 다양한 사용 사례에서 SageMaker AI와 함께 Hugging Face 딥 러닝 컨테이너를 사용하는 방법을 보여줍니다.

PyTorch를 사용하는 SageMaker AI에서 Hugging Face를 사용하여 텍스트 분류 모델을 훈련하고 배포하려고 합니다.

예제 Jupyter Notebook은 PyTorch 시작하기 데모를 참조하세요.

TensorFlow를 사용하는 SageMaker AI에서 Hugging Face를 사용하여 텍스트 분류 모델을 훈련하고 배포하려고 합니다.

예제 Jupyter Notebook은 TensorFlow 시작하기 예제를 참조하세요.

Hugging Face 및 SageMaker AI Distributed를 사용하여 데이터 병렬 처리로 분산 훈련을 실행하려고 합니다.

예제 Jupyter Notebook은 분산 훈련 예제를 참조하세요.

Hugging Face 및 SageMaker AI Distributed를 사용하여 모델 병렬 처리로 분산 훈련을 실행하려고 합니다.

예제 Jupyter Notebook은 모델 병렬화 예제를 참조하세요.

스팟 인스턴스를 사용하여 SageMaker AI에서 Hugging Face를 사용하여 모델을 훈련하고 배포하려고 합니다.

예제 Jupyter Notebook은 스팟 인스턴스 예제를 참조하세요.

SageMaker AI에서 Hugging Face를 사용하여 텍스트 분류 모델을 훈련할 때 사용자 지정 지표를 캡처하고 SageMaker AI 체크포인트를 사용하려고 합니다.

예제 Jupyter Notebook은 사용자 지정 메트릭을 사용한 훈련 예제를 참조하세요.

SageMaker AI에서 Hugging Face를 사용하여 분산형 질문 응답 TensorFlow 모델을 훈련하고 싶습니다.

예제 Jupyter Notebook은 분산 TensorFlow 훈련 예제를 참조하세요.

SageMaker AI에서 Hugging Face를 사용하여 분산 요약 모델을 훈련하고 싶습니다.

예제 Jupyter Notebook은 분산 요약 훈련 예제를 참조하세요.

SageMaker AI에서 Hugging Face를 사용하여 이미지 분류 모델을 훈련하고 싶습니다.

예제 Jupyter Notebook은 Vision Transformer 훈련 예제를 참조하세요.

훈련된 Hugging Face 모델을 SageMaker AI에 배포하려고 합니다.

예제 Jupyter Notebook은 추론 예시를 위해 Hugging Face Transformers 배포를 참조하세요.

SageMaker AI에 사전 훈련된 Hugging Face 모델을 배포하려고 합니다.

예제 Jupyter Notebook은 추론 예시를 위해 사전 훈련된 Hugging Face Transformer 배포를 참조하세요.