알고리즘을 사용하여 훈련 작업 실행 - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

알고리즘을 사용하여 훈련 작업 실행

알고리즘 리소스를 사용하여 Amazon SageMaker AI 콘솔, 하위 수준 Amazon SageMaker API또는 Amazon SageMaker Python SDK를 사용하여 훈련 작업을 생성할 수 있습니다.

알고리즘을 사용하여 훈련 작업 실행(콘솔)

알고리즘을 사용하여 훈련 작업을 실행하려면(콘솔)
  1. 에서 SageMaker AI 콘솔을 엽니다https://console.aws.amazon.com/sagemaker/.

  2. 알고리즘을 선택합니다.

  3. 내 알고리즘 탭의 목록에서 생성한 알고리즘을 선택하거나 AWS Marketplace 구독 탭에서 구독한 알고리즘을 선택합니다.

  4. 훈련 작업 생성을 선택합니다.

    이전에 선택한 알고리즘이 자동으로 선택됩니다.

  5. 훈련 작업 생성 페이지에서 다음 정보를 제공합니다.

    1. 작업 이름에 훈련 작업의 이름을 입력합니다.

    2. IAM 역할에서 SageMaker AI에서 훈련 작업을 실행하는 데 필요한 권한이 있는 IAM 역할을 선택하거나 새 역할 생성을 선택하여 SageMaker AI가 AmazonSageMakerFullAccess 관리형 정책이 연결된 역할을 생성할 수 있도록 합니다. 자세한 내용은 SageMaker AI 실행 역할을 사용하는 방법을 참조하세요.

    3. 리소스 구성에서 다음 정보를 제공합니다.

      1. 인스턴스 유형에 훈련에 사용할 인스턴스 유형을 선택합니다.

      2. 인스턴스 수에, 각 훈련 작업에 사용할 ML 인스턴스의 수를 입력합니다.

      3. 인스턴스당 추가 볼륨 크기(GB)에 프로비저닝하려는 ML 스토리지 볼륨의 크기를 입력합니다. ML 스토리지 볼륨은 모델 결과물 및 증분 상태를 저장합니다.

      4. 암호화 키의 경우 Amazon SageMaker AI가 AWS Key Management Service 키를 사용하여 훈련 인스턴스에 연결된 ML 스토리지 볼륨의 데이터를 암호화하도록 하려면 키를 지정합니다.

      5. 중지 조건에는 훈련 작업을 실행하려는 최대 시간을 초, 분, 시간 또는 일 단위로 지정합니다.

    4. 에서 훈련 컨테이너가 액세스VPC하도록 허용할 Amazon을 VPC선택합니다. 자세한 내용은 SageMaker AI 훈련 작업에 Amazon의 리소스에 대한 액세스 권한 부여 VPC 단원을 참조하십시오.

    5. 하이퍼파라미터에는 훈련 작업에 사용할 하이퍼파라미터 값을 지정합니다.

    6. 입력 데이터 구성에서, 훈련 작업에 사용할 각 입력 데이터 채널에 대해 다음 값을 지정합니다. 훈련 지원에 사용하고 있는 알고리즘 채널, 콘텐츠 유형, 지원되는 압축 유형, 각 채널에 지원되는 입력 모드를 알고리즘의 알고리즘 요약 페이지의 채널 사양 단원에서 확인할 수 있습니다.

      1. 채널 이름에는 입력 채널의 이름을 입력합니다.

      2. 콘텐츠 유형에는 알고리즘에서 채널에 대해 필요로 하는 데이터의 콘텐츠 유형을 입력합니다.

      3. 압축 유형에는 사용할 데이터 압축 유형을 선택합니다(있는 경우).

      4. 레코드 래퍼에는 알고리즘이 RecordIO 형식의 데이터를 예상하는 경우 RecordIO를 선택합니다.

      5. S3 데이터 유형, S3 데이터 배포 유형, S3 위치에는 적절한 값을 지정합니다. 이러한 값이 의미하는 내용은 S3DataSource 섹션을 참조하세요.

      6. 프로비저닝된 ML 스토리지 볼륨에서 데이터를 다운로드하여 Docker 볼륨에 해당 디렉터리를 탑재하려는 경우 입력 모드에서 파일을 선택합니다. Amazon S3에서 컨테이너로 직접 데이터를 스트리밍하려면 파이프를 선택합니다.

      7. 다른 입력 채널을 추가하려면 채널 추가를 선택합니다. 입력 채널을 추가했으면 완료를 선택합니다.

    7. 출력 위치에 다음 값을 지정합니다.

      1. S3 출력 경로에서 훈련 작업이 출력(예: 모델 결과물)을 저장할 S3 위치를 선택합니다.

        참고

        이 위치에 저장된 모델 결과물을 사용하여 이 훈련 작업에서 모델 또는 모델 패키지를 생성합니다.

      2. 암호화 키의 경우 SageMaker AI가 AWS KMS 키를 사용하여 S3 위치에 저장된 출력 데이터를 암호화하도록 하려면

    8. 태그에는 훈련 작업을 관리하기 위한 태그를 하나 이상 지정합니다. 각 태그는 키와 값(선택사항)으로 구성됩니다. 태그 키는 리소스마다 고유해야 합니다.

    9. 훈련 작업을 실행하려면 훈련 작업 생성을 선택합니다.

알고리즘을 사용하여 훈련 작업 실행(API)

알고리즘을 사용하여를 사용하여 훈련 작업을 실행하려면 이름 또는 Amazon 리소스 이름(ARN)을에 전달하는 AlgorithmSpecification 객체의 AlgorithmName 필드로 SageMaker API지정합니다CreateTrainingJob. SageMaker AI의 모델 훈련에 대한 자세한 내용은 섹션을 참조하세요Amazon을 사용하여 모델 훈련 SageMaker.

알고리즘을 사용하여 훈련 작업 실행(Amazon SageMaker PythonSDK)

에서 생성하거나 구독한 알고리즘 AWS Marketplace 을 사용하여 훈련 작업을 생성하고, AlgorithmEstimator 객체를 생성하고, Amazon 리소스 이름(ARN) 또는 알고리즘 이름을 algorithm_arn 인수 값으로 지정합니다. 그런 다음 예측기의 fit 메서드를 호출합니다. 예시:

from sagemaker import AlgorithmEstimator data_path = os.path.join(DATA_DIR, 'marketplace', 'training') algo = AlgorithmEstimator( algorithm_arn='arn:aws:sagemaker:us-east-2:012345678901:algorithm/my-algorithm', role='SageMakerRole', instance_count=1, instance_type='ml.c4.xlarge', sagemaker_session=sagemaker_session, base_job_name='test-marketplace') train_input = algo.sagemaker_session.upload_data( path=data_path, key_prefix='integ-test-data/marketplace/train') algo.fit({'training': train_input})