알고리즘을 사용하여 훈련 작업 실행 - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

알고리즘을 사용하여 훈련 작업 실행

Amazon SageMaker 콘솔, 하위 수준 Amazon SageMaker API 또는 Amazon SageMaker Python SDK를 사용하여 알고리즘 리소스를 생성하여 교육 작업을 생성할 수 있습니다.

알고리즘을 사용하여 훈련 작업 실행(콘솔)

알고리즘을 사용하여 훈련 작업을 실행하려면(콘솔)
  1. https://console.aws.amazon.com/sagemaker/ 에서 SageMaker 콘솔을 엽니다.

  2. 알고리즘을 선택합니다.

  3. 내 알고리즘 탭의 목록에서 생성한 알고리즘을 선택하거나 AWS Marketplace 구독 탭에서 구독한 알고리즘을 선택합니다.

  4. 훈련 작업 생성을 선택합니다.

    이전에 선택한 알고리즘이 자동으로 선택됩니다.

  5. 훈련 작업 생성 페이지에서 다음 정보를 제공합니다.

    1. 작업 이름에 훈련 작업의 이름을 입력합니다.

    2. IAM 역할의 경우 교육 작업을 실행하는 데 필요한 권한이 있는 IAM 역할을 선택하거나 SageMaker, Create a new role (새 역할 만들기) 를 선택하여 AmazonSageMakerFullAccess 관리형 정책이 연결된 역할을 생성할 수 있도록 SageMaker 합니다. 자세한 내용은 SageMaker 실행 역할 사용 방법을 참조하세요.

    3. 리소스 구성에서 다음 정보를 제공합니다.

      1. 인스턴스 유형에 훈련에 사용할 인스턴스 유형을 선택합니다.

      2. 인스턴스 수에, 각 훈련 작업에 사용할 ML 인스턴스의 수를 입력합니다.

      3. 인스턴스당 추가 볼륨 크기(GB)에 프로비저닝하려는 ML 스토리지 볼륨의 크기를 입력합니다. ML 스토리지 볼륨은 모델 결과물 및 증분 상태를 저장합니다.

      4. SageMaker Amazon에서 키 관리 서비스 AWS 키를 사용하여 교육 인스턴스에 연결된 ML 스토리지 볼륨의 데이터를 암호화하도록 하려면 암호화 키의 경우 키를 지정하십시오.

      5. 중지 조건에는 훈련 작업을 실행하려는 최대 시간을 초, 분, 시간 또는 일 단위로 지정합니다.

    4. VPC에는 훈련 컨테이너가 액세스하도록 허용할 Amazon VPC를 선택합니다. 자세한 정보는 SageMaker 교육 작업자에게 Amazon VPC의 리소스에 대한 액세스 권한을 부여하십시오.을 참조하세요.

    5. 하이퍼파라미터에는 훈련 작업에 사용할 하이퍼파라미터 값을 지정합니다.

    6. 입력 데이터 구성에서, 훈련 작업에 사용할 각 입력 데이터 채널에 대해 다음 값을 지정합니다. 훈련 지원에 사용하고 있는 알고리즘 채널, 콘텐츠 유형, 지원되는 압축 유형, 각 채널에 지원되는 입력 모드를 알고리즘의 알고리즘 요약 페이지의 채널 사양 단원에서 확인할 수 있습니다.

      1. 채널 이름에는 입력 채널의 이름을 입력합니다.

      2. 콘텐츠 유형에는 알고리즘에서 채널에 대해 필요로 하는 데이터의 콘텐츠 유형을 입력합니다.

      3. 압축 유형에는 사용할 데이터 압축 유형을 선택합니다(있는 경우).

      4. 레코드 래퍼에는 알고리즘이 RecordIO 형식의 데이터를 예상하는 경우 RecordIO를 선택합니다.

      5. S3 데이터 유형, S3 데이터 배포 유형, S3 위치에는 적절한 값을 지정합니다. 이러한 값이 의미하는 내용은 S3DataSource 단원을 참조하세요.

      6. 프로비저닝된 ML 스토리지 볼륨에서 데이터를 다운로드하여 도커 볼륨에 해당 디렉터리를 탑재하려는 경우 입력 모드에서 파일을 선택합니다. Amazon S3에서 컨테이너로 직접 데이터를 스트리밍하려면 파이프를 선택합니다.

      7. 다른 입력 채널을 추가하려면 채널 추가를 선택합니다. 입력 채널을 추가했으면 완료를 선택합니다.

    7. 출력 위치에 다음 값을 지정합니다.

      1. S3 출력 경로에서 훈련 작업이 출력(예: 모델 결과물)을 저장할 S3 위치를 선택합니다.

        참고

        이 위치에 저장된 모델 결과물을 사용하여 이 훈련 작업에서 모델 또는 모델 패키지를 생성합니다.

      2. 암호화 키의 경우, S3 위치에 저장된 출력 데이터를 AWS KMS 키를 사용하여 SageMaker 암호화하려는 경우

    8. 태그에는 훈련 작업을 관리하기 위한 태그를 하나 이상 지정합니다. 각 태그는 키와 값(선택 사항)으로 구성됩니다. 태그 키는 리소스마다 고유해야 합니다.

    9. 훈련 작업을 실행하려면 훈련 작업 생성을 선택합니다.

알고리즘을 사용하여 훈련 작업 실행(API)

SageMaker API를 사용하여 알고리즘을 사용하여 교육 작업을 실행하려면 전달되는 AlgorithmSpecification객체의 AlgorithmName 필드로 이름 또는 Amazon 리소스 이름 (ARN) 을 지정하십시오. CreateTrainingJob 의 학습 모델에 대한 자세한 내용은 SageMaker 을 참조하십시오Amazon에서 모델 학습시키기 SageMaker.

알고리즘을 사용하여 교육 작업 실행 (Amazon SageMaker Python SDK)

직접 만들거나 구독한 알고리즘을 사용하여 교육 작업을 생성하고 AlgorithmEstimator 객체를 만든 다음 Amazon Resource Name (ARN) 또는 알고리즘 이름을 인수 값으로 지정합니다. AWS Marketplace algorithm_arn 그런 다음 예측기의 fit 메서드를 호출합니다. 예:

from sagemaker import AlgorithmEstimator data_path = os.path.join(DATA_DIR, 'marketplace', 'training') algo = AlgorithmEstimator( algorithm_arn='arn:aws:sagemaker:us-east-2:012345678901:algorithm/my-algorithm', role='SageMakerRole', instance_count=1, instance_type='ml.c4.xlarge', sagemaker_session=sagemaker_session, base_job_name='test-marketplace') train_input = algo.sagemaker_session.upload_data( path=data_path, key_prefix='integ-test-data/marketplace/train') algo.fit({'training': train_input})