

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# Amazon SageMaker 훈련 컴파일러 릴리스 노트
<a name="training-compiler-release-notes"></a>

**중요**  
Amazon Web Services(AWS)는 SageMaker 훈련 컴파일러의 새 릴리스 또는 버전이 없을 것이라고 발표했습니다. SageMaker 훈련을 위한 기존 AWS 딥 러닝 컨테이너(DLCs)를 통해 SageMaker 훈련 컴파일러를 계속 활용할 수 있습니다. 기존 DLCs는 계속 액세스할 수 있지만 [AWS 딥 러닝 컨테이너 프레임워크 지원 정책에](https://docs.aws.amazon.com/deep-learning-containers/latest/devguide/support-policy.html) AWS따라 더 이상 패치 또는 업데이트를 받지 않습니다.

Amazon SageMaker 훈련 컴파일러에 대한 최신 업데이트를 추적하려면 다음 릴리스 정보를 참조하세요.

## SageMaker 훈련 컴파일러 릴리스 노트: 2023년 2월 13일
<a name="training-compiler-release-notes-20230213"></a>

**통화 업데이트**
+ PyTorch v1.13.1에 대한 지원이 추가됨

**버그 수정**
+ 비전 트랜스포머(ViT) 모델과 같은 일부 모델에서 NAN 손실을 유발하던 GPU의 경쟁 상태 문제를 수정했습니다.

**기타 변경사항**
+ SageMaker 훈련 컴파일러는 PyTorch/XLA가 `torch_xla.amp.syncfree`(예: `torch_xla.amp.syncfree.SGD`, `torch_xla.amp.syncfree.Adam`, `torch_xla.amp.syncfree.AdamW`)에서 싱크프리 버전으로 `torch.optim` 또는 `transformers.optimization`의 옵티마이저(예: SGD, Adam, AdamW)를 자동으로 오버라이드하도록 하여 성능을 개선합니다. 훈련 스크립트에서 옵티마이저를 정의하는 이러한 코드 라인은 변경할 필요가 없습니다.

**AWS 딥 러닝 컨테이너로 마이그레이션**

이 릴리스는 벤치마크 테스트를 통과했으며 다음 AWS 딥 러닝 컨테이너로 마이그레이션됩니다.
+ PyTorch v1.13.1

  ```
  763104351884.dkr.ecr.us-west-2.amazonaws.com/pytorch-trcomp-training:1.13.1-gpu-py39-cu117-ubuntu20.04-sagemaker
  ```

  Amazon SageMaker 훈련 컴파일러를 사용하여 사전 구축된 컨테이너의 전체 목록을 찾으려면 [지원되는 프레임워크, AWS 리전인스턴스 유형 및 테스트된 모델](training-compiler-support.md)을 참고하세요.

## SageMaker 훈련 컴파일러 릴리스 노트: 2023년 1월 9일
<a name="training-compiler-release-notes-20230109"></a>

**호환성에 영향을 미치는 변경 사항**
+ `tf.keras.optimizers.Optimizer`는 TensorFlow 2.11.0 이상의 새로운 옵티마이저를 가리킵니다. 이전 옵티마이저는 `tf.keras.optimizers.legacy`로 이전되었습니다. 다음을 수행하면 호환성에 영향을 미치는 변경 사항으로 인해 작업이 실패할 수 있습니다.
  + 이전 옵티마이저에서 체크포인트를 로드합니다. 레거시 옵티마이저를 사용하도록 전환하는 것을 권장합니다.
  + TensorFlow v1을 사용하세요. TensorFlow v2로 마이그레이션하거나 TensorFlow v1을 계속 사용해야 하는 경우 레거시 옵티마이저로 전환하는 것을 권장합니다.

  옵티마이저 변경 사항 중 호환성에 영향을 미치는 변경 사항에 대한 자세한 목록은 TensorFlow GitHub 리포지토리의 [공식 TensorFlow v2.11.0 릴리스 노트](https://github.com/tensorflow/tensorflow/releases/tag/v2.11.0)를 참조하세요.

**AWS 딥 러닝 컨테이너로 마이그레이션**

이 릴리스는 벤치마크 테스트를 통과했으며 다음 AWS 딥 러닝 컨테이너로 마이그레이션됩니다.
+ TensorFlow v2.11.0

  ```
  763104351884.dkr.ecr.{{<region>}}.amazonaws.com/tensorflow-training:2.11.0-gpu-py39-cu112-ubuntu20.04-sagemaker
  ```

  Amazon SageMaker 훈련 컴파일러를 사용하여 사전 구축된 컨테이너의 전체 목록을 찾으려면 [지원되는 프레임워크, AWS 리전인스턴스 유형 및 테스트된 모델](training-compiler-support.md)을 참고하세요.

## SageMaker 훈련 컴파일러 릴리스 노트: 2022년 12월 8일
<a name="training-compiler-release-notes-20221208"></a>

**버그 수정**
+ 여러 프로세스에서 모델 초기화에 불일치가 없도록 PyTorch v1.12부터 PyTorch 훈련 작업의 시드를 수정했습니다. [PyTorch 재현성](https://pytorch.org/docs/stable/notes/randomness.html)도 참조하세요.
+ G4dn 및 G5 인스턴스의 PyTorch 분산형 훈련 작업이 [PCIe](https://en.wikipedia.org/wiki/PCI_Express)를 통한 통신을 기본값으로 설정하지 않는 문제를 수정했습니다.

**알려진 문제**
+ Hugging Face의 비전 트랜스포머에서 PyTorch/XLA API를 잘못 사용하면 컨버전스 문제가 발생할 수 있습니다.

**기타 변경사항**
+ Hugging Face Transformer `Trainer` 클래스를 사용할 때는 `optim` 인수를 `adamw_torch_xla`로 설정하여 SyncFree 옵티마이저를 사용해야 합니다. 자세한 내용은 [Hugging Face Transformers `Trainer` 클래스를 사용하는 대형 언어 모델](training-compiler-pytorch-models.md#training-compiler-pytorch-models-transformers-trainer) 섹션을 참조하세요. *Hugging Face Transformer 문서*의 [옵티마이저](https://huggingface.co/docs/transformers/v4.23.1/en/perf_train_gpu_one#optimizer)도 참조하세요.

**AWS 딥 러닝 컨테이너로 마이그레이션**

이 릴리스는 벤치마크 테스트를 통과했으며 다음 AWS 딥 러닝 컨테이너로 마이그레이션됩니다.
+ PyTorch v1.12.0

  ```
  763104351884.dkr.ecr.{{<region>}}.amazonaws.com/pytorch-trcomp-training:1.12.0-gpu-py38-cu113-ubuntu20.04-sagemaker
  ```

  Amazon SageMaker 훈련 컴파일러를 사용하여 사전 구축된 컨테이너의 전체 목록을 찾으려면 [지원되는 프레임워크, AWS 리전인스턴스 유형 및 테스트된 모델](training-compiler-support.md)을 참고하세요.

## SageMaker 훈련 컴파일러 릴리스 노트: 2022년 12월 4일
<a name="training-compiler-release-notes-20221004"></a>

**통화 업데이트**
+ TensorFlow v2.10.0에 대한 지원을 추가했습니다.

**기타 변경사항**
+ TensorFlow 프레임워크 테스트에 트랜스포머 라이브러리를 사용하는 Hugging Face NLP 모델을 추가했습니다. 테스트된 트랜스포머 모델을 찾으려면 [테스트 완료 모델](training-compiler-support.md#training-compiler-tested-models)을 참조하세요.

**AWS 딥 러닝 컨테이너로 마이그레이션**

이 릴리스는 벤치마크 테스트를 통과했으며 다음 AWS 딥 러닝 컨테이너로 마이그레이션됩니다.
+ TensorFlow v2.10.0

  ```
  763104351884.dkr.ecr.{{<region>}}.amazonaws.com/tensorflow-training:2.10.0-gpu-py39-cu112-ubuntu20.04-sagemaker
  ```

  Amazon SageMaker 훈련 컴파일러를 사용하여 사전 구축된 컨테이너의 전체 목록을 찾으려면 [지원되는 프레임워크, AWS 리전인스턴스 유형 및 테스트된 모델](training-compiler-support.md)을 참고하세요.

## SageMaker 훈련 컴파일러 릴리스 노트: 2022년 9월 1일
<a name="training-compiler-release-notes-20220825"></a>

**통화 업데이트**
+ PyTorch v1.11.0과 함께 Hugging Face Transformers v4.21.1에 대한 지원이 추가되었습니다.

**개선 사항**
+ PyTorch를 사용하여 Hugging Face Transformer 모델을 위한 SageMaker 훈련 컴파일러를 활성화하는 새로운 분산형 훈련 런처 메커니즘을 구현했습니다. 자세히 알아보려면 [분산형 훈련을 위한 SageMaker 훈련 컴파일러를 사용하여 PyTorch 훈련 작업 실행](training-compiler-enable-pytorch.md#training-compiler-estimator-pytorch-distributed)을 참조하세요.
+ 분산형 훈련의 집단적 통신을 개선하기 위해 EFA와 통합했습니다.
+ PyTorch 훈련 작업을 위한 G5 인스턴스 지원이 추가되었습니다. 자세한 내용은 [지원되는 프레임워크, AWS 리전인스턴스 유형 및 테스트된 모델](training-compiler-support.md) 단원을 참조하십시오.

**AWS 딥 러닝 컨테이너로 마이그레이션**

이 릴리스는 벤치마크 테스트를 통과했으며 다음 AWS 딥 러닝 컨테이너로 마이그레이션됩니다.
+ [HuggingFace v4.21.1(PyTorch v1.11.0 포함)](https://github.com/aws/deep-learning-containers/releases/tag/v1.0-trcomp-hf-4.21.1-pt-1.11.0-tr-gpu-py38)

  ```
  763104351884.dkr.ecr.us-west-2.amazonaws.com/huggingface-pytorch-trcomp-training:1.11.0-transformers4.21.1-gpu-py38-cu113-ubuntu20.04
  ```

  Amazon SageMaker 훈련 컴파일러를 사용하여 사전 구축된 컨테이너의 전체 목록을 찾으려면 [지원되는 프레임워크, AWS 리전인스턴스 유형 및 테스트된 모델](training-compiler-support.md)을 참고하세요.

## SageMaker 훈련 컴파일러 릴리스 노트: 2022년 6월 14일
<a name="training-compiler-release-notes-20220614"></a>

**새로운 기능**
+ TensorFlow v2.9.1에 대한 지원을 추가했습니다. SageMaker 훈련 컴파일러는 TensorFlow 모듈(`tf.*`) 및 TensorFlow Keras 모듈(`tf.keras.*`) 컴파일을 완벽하게 지원합니다.
+ TensorFlow용 AWS 딥 러닝 컨테이너를 확장하여 생성된 사용자 지정 컨테이너에 대한 지원이 추가되었습니다. 자세한 내용은 [SageMaker Python SDK를 사용한 SageMaker Training Compiler 활성화 및 SageMaker AI 프레임워크 딥 러닝 컨테이너 확장](training-compiler-enable-tensorflow.md#training-compiler-enable-tensorflow-sdk-extend-container)을 참조하세요.
+ TensorFlow 훈련 작업을 위한 G5 인스턴스 지원이 추가되었습니다.

**AWS 딥 러닝 컨테이너로 마이그레이션**

이 릴리스는 벤치마크 테스트를 통과했으며 다음 AWS 딥 러닝 컨테이너로 마이그레이션됩니다.
+ TensorFlow 2.9.1

  ```
  763104351884.dkr.ecr.{{<region>}}.amazonaws.com/tensorflow-training:2.9.1-gpu-py39-cu112-ubuntu20.04-sagemaker
  ```

  Amazon SageMaker 훈련 컴파일러를 사용하여 사전 구축된 컨테이너의 전체 목록을 찾으려면 [지원되는 프레임워크, AWS 리전인스턴스 유형 및 테스트된 모델](training-compiler-support.md)를 참조하세요.

## SageMaker 훈련 컴파일러 릴리스 노트: 2022년 4월 26일
<a name="training-compiler-release-notes-20220426"></a>

**개선 사항**
+ 중국 리전을 제외하고 [AWS 딥 러닝 컨테이너](https://github.com/aws/deep-learning-containers/blob/master/available_images.md)가 사용 AWS 리전 중인 모든에 대한 지원이 추가되었습니다.

## SageMaker 훈련 컴파일러 릴리스 노트: 2022년 4월 12일
<a name="training-compiler-release-notes-20220412"></a>

**통화 업데이트**
+ TensorFlow v2.6.3 및 PyTorch v1.10.2와 함께 Hugging Face Transformers v4.17.0에 대한 지원이 추가되었습니다.

## SageMaker 훈련 컴파일러 릴리스 노트: 2022년 2월 21일
<a name="training-compiler-release-notes-20220221"></a>

**개선 사항**
+ 벤치마크 테스트를 완료하고 `ml.g4dn` 인스턴스 유형에 대한 훈련 속도 향상을 확인했습니다. 테스트된 `ml` 인스턴스의 전체 목록을 찾으려면 [지원되는 인스턴스 유형](training-compiler-support.md#training-compiler-supported-instance-types)을 참조하세요.

## SageMaker 훈련 컴파일러 릴리스 노트: 2021년 12월 01일
<a name="training-compiler-release-notes-20211201"></a>

**새로운 기능**
+  AWS re:Invent 2021에서 Amazon SageMaker 훈련 컴파일러를 출시했습니다.

**AWS 딥 러닝 컨테이너로 마이그레이션**
+ Amazon SageMaker 훈련 컴파일러는 벤치마크 테스트를 통과했으며 AWS 딥 러닝 컨테이너로 마이그레이션됩니다. Amazon SageMaker 훈련 컴파일러를 사용하여 사전 구축된 컨테이너의 전체 목록을 찾으려면 [지원되는 프레임워크, AWS 리전인스턴스 유형 및 테스트된 모델](training-compiler-support.md)을 참조하세요.