알고리즘 리소스 생성 - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

알고리즘 리소스 생성

Amazon에서 교육 작업을 SageMaker 실행하고 게시하는 데 사용할 수 있는 알고리즘 리소스를 생성하려면 다음 정보를 AWS Marketplace 지정하십시오.

  • 훈련 코드와 경우에 따라서는 추론 코드를 포함하고 있는 Docker 컨테이너

  • 훈련을 위해 알고리즘에 필요한 입력 데이터의 구성

  • 알고리즘에서 지원하는 하이퍼파라미터

  • 교육 작업 CloudWatch 중에 알고리즘이 Amazon에 보내는 지표.

  • 훈련 및 추론을 위해 알고리즘이 지원하는 인스턴스 유형 및 알고리즘이 여러 인스턴스 간에 분산된 훈련을 지원하는지 여부

  • 검증 프로파일은 알고리즘의 교육 코드를 테스트하는 데 SageMaker 사용하는 교육 작업과 알고리즘의 추론 코드를 테스트하기 위해 SageMaker 실행되는 일괄 변환 작업입니다.

    구매자 및 판매자가 SageMaker에서 제품이 작동할 것이라고 확신할 수 있도록 Amazon에서는 AWS Marketplace에서 등록하기 전에 알고리즘을 검증하도록 요구하고 있습니다. 검증이 성공한 AWS Marketplace 경우에만 제품을 목록에 올릴 수 있습니다. 알고리즘을 검증하려면 검증 프로필과 샘플 데이터를 SageMaker 사용하여 다음 검증 작업을 실행합니다.

    1. 계정에서 훈련 작업을 생성하여 훈련 이미지가 제대로 작동하는지 확인하세요. SageMaker

    2. 알고리즘에 추론 코드를 포함한 경우에는 알고리즘의 추론 이미지 및 훈련 작업에서 생성된 모델 결과물을 사용하여 사용자 계정에서 모델을 생성합니다.

    3. 알고리즘에 추론 코드를 포함한 경우 모델을 사용하여 계정에서 변환 작업을 생성하여 추론 이미지가 호환되는지 확인하세요. SageMaker

    상품을 리스팅할 때 이 검증 프로세스의 입력과 출력은 상품의 일부로 유지되며 구매자가 이용할 수 있습니다. AWS Marketplace이러한 입력 및 출력을 통해 구매자는 구입 전 제품을 파악하고 평가할 수 있습니다. 예를 들어, 구매자는 사용된 입력 데이터, 생성된 출력과 코드에서 내보낸 로그 및 지표를 검사할 수 있습니다. 검증 사양이 포괄적일수록 고객이 제품을 보다 쉽게 평가할 수 있습니다.

    참고

    검증 프로필에서는 공개하려는 데이터만 제공합니다.

    검증에는 최대 몇 시간 가량 걸릴 수 있습니다. 계정의 작업 상태를 보려면 SageMaker 콘솔에서 교육 작업 및 변환 작업 페이지를 참조하십시오. 검증에 실패하면 SageMaker 콘솔에서 스캔 및 검증 보고서에 액세스할 수 있습니다. 문제가 발생하면 알고리즘을 다시 생성해야 합니다.

    참고

    알고리즘을 AWS Marketplace게시하려면 하나 이상의 검증 프로필이 필요합니다.

SageMaker 콘솔이나 SageMaker API를 사용하여 알고리즘을 생성할 수 있습니다.

알고리즘 리소스 생성(콘솔)

알고리즘 리소스를 생성하려면(콘솔)
  1. https://console.aws.amazon.com/sagemaker/ 에서 SageMaker 콘솔을 엽니다.

  2. 왼쪽 메뉴에서 훈련을 선택합니다.

  3. 드롭다운 메뉴에서 알고리즘을 선택한 다음 알고리즘 생성을 선택합니다.

  4. 훈련 사양 페이지에서 다음 정보를 제공합니다.

    1. 알고리즘 이름에 알고리즘의 이름을 입력합니다. 알고리즘 이름은 계정과 AWS 지역 내에서 고유해야 합니다. 이름은 1~64자여야 합니다. 유효한 문자는 a-z, A-Z, 0-9 및 –(하이픈)입니다.

    2. 알고리즘에 대한 설명을 입력합니다. 이 설명은 SageMaker 콘솔과 에 표시됩니다 AWS Marketplace.

    3. 훈련 이미지의 경우, 훈련 컨테이너가 저장되어 있는 Amazon ECR에서의 경로를 입력합니다.

    4. 알고리즘이 여러 인스턴스에 대한 훈련을 지원하는 경우 분산 훈련 지원에서 를 선택합니다. 그렇지 않은 경우 아니요를 선택합니다.

    5. 훈련용 인스턴스 유형 지원에서 알고리즘에서 지원하는 인스턴스 유형을 선택합니다.

    6. 채널 사양에, 알고리즘에 대한 입력 데이터 채널을 지정합니다( 최대 8개). 예를 들어 train, validationtest라는 입력 채널 3개를 지정할 수 있습니다. 각 채널에 대해 다음 정보를 지정합니다.

      1. 채널 이름에 채널의 이름을 입력합니다. 이름은 1~64자여야 합니다. 유효한 문자는 a-z, A-Z, 0-9 및 –(하이픈)입니다.

      2. 알고리즘에서 채널을 요구하게 하려면 채널 필요를 선택합니다.

      3. 채널에 대한 설명을 입력합니다.

      4. 지원되는 입력 모드에서, 알고리즘에서 입력 데이터 스트리밍을 지원하면 파이프 모드를 선택하고, 알고리즘에서 파일로 입력 데이터 다운로드를 지원하면 파일 모드를 선택합니다. 사용자는 두 가지 모드를 모두 선택할 수도 있습니다.

      5. 지원되는 콘텐츠 유형에, 알고리즘에서 입력 데이터에 대해 원하는 MIME 유형을 입력합니다.

      6. 알고리즘에서 Gzip 압축을 지원하는 경우에는 지원되는 압축 유형에서 Gzip을 선택합니다. 그렇지 않다면 없음을 선택합니다.

      7. 다른 데이터 입력 채널을 추가하려면 채널 추가를 선택하고, 채널을 모두 추가했으면 다음을 선택합니다.

  5. 튜닝 사양 페이지에서 다음 정보를 제공합니다.

    1. 하이퍼파라미터 사양에서, JSON 객체를 편집하여 알고리즘에서 지원하는 하이퍼파라미터를 지정합니다. 알고리즘에서 지원하는 각 하이퍼파라미터에 대해 다음과 유사하게 JSON 블록을 구성합니다.

      { "DefaultValue": "5", "Description": "The first hyperparameter", "IsRequired": true, "IsTunable": false, "Name": "intRange", "Range": { "IntegerParameterRangeSpecification": { "MaxValue": "10", "MinValue": "1" }, "Type": "Integer" }

      JSON에서 다음 정보를 입력합니다.

      1. DefaultValue로 하이퍼파라미터(하나 있는 경우)에 대한 기본값을 지정합니다.

      2. Description으로 하이퍼파라미터에 대한 설명을 지정합니다.

      3. IsRequired로 하이퍼파라미터가 필요한지 여부를 지정합니다.

      4. 사용자가 이 알고리즘을 사용하는 하이퍼파라미터 튜닝 작업을 실행할 때 이 하이퍼파라미터를 튜닝 가능하도록 하려면 IsTunabletrue를 지정합니다. 자세한 내용은 를 사용하여 자동 모델 튜닝을 수행하십시오. SageMaker 섹션을 참조하세요.

      5. Name으로 하이퍼파라미터에 대한 이름을 지정합니다.

      6. Range로 다음 중 하나를 지정합니다.

        • IntegerParameterRangeSpecification - 하이퍼파라미터의 값이 정수입니다. 하이퍼파라미터에 대한 최대 및 최소 값을 지정합니다.

        • ContinuousParameterRangeSpecification - 하이퍼파라미터의 값이 부동 소수점 값입니다. 하이퍼파라미터에 대한 최대 및 최소 값을 지정합니다.

        • CategoricalParameterRangeSpecification - 하이퍼파라미터의 값이 카테고리 값입니다. 가능한 모든 값 목록을 지정합니다.

      7. Type으로 Integer, Continuous 또는 Categorical을 지정합니다. 이 값은 지정한 Range 유형에 해당해야 합니다.

    2. 지표 정의의 경우 알고리즘에서 내보낼 훈련 지표를 모두 지정하십시오. SageMaker 지정한 정규 표현식을 사용하여 훈련 중에 훈련 컨테이너에서 로그를 구문 분석하여 메트릭을 찾습니다. 사용자는 알고리즘으로 교육 작업을 실행할 때 이러한 지표를 볼 수 있으며 Amazon에서 지표를 모니터링하고 플로팅할 수 CloudWatch 있습니다. 자세한 내용은 Amazon CloudWatch 메트릭을 사용한 교육 작업 모니터링 및 분석 섹션을 참조하세요. 각 지표에 대해 다음 정보를 제공합니다.

      1. 지표 이름에 지표의 이름을 입력합니다.

      2. 의 경우Regex, 지표 값을 찾을 수 있도록 교육 로그를 구문 분석하는 데 SageMaker 사용하는 정규 표현식을 입력하십시오.

      3. 이 지표를 하이퍼파라미터 튜닝 작업의 목표 지표로 사용할 수 있는 경우 목표 지표 지원에 대해 를 선택합니다. 자세한 내용은 를 사용하여 자동 모델 튜닝을 수행하십시오. SageMaker 을 참조하십시오.

      4. 다른 지표를 추가하려면 지표 추가를 선택하고 지표 추가를 마친 경우에는 다음을 선택합니다.

  6. 알고리즘이 추론을 지원하는 경우 추론 사양 페이지에서 다음 정보를 제공합니다.

    1. 추론 이미지 위치에는 추론 컨테이너가 저장된 Amazon ECR의 경로를 입력합니다.

    2. 컨테이너 DNS 호스트 이름에 이미지의 DNS 호스트 이름을 입력합니다.

    3. Supported instance types for real-time inference(실시간 추론에 지원되는 인스턴스 유형)의 SageMaker에서 호스팅 엔드포인트로 배포된 모델에 대해 알고리즘에서 지원하는 인스턴스 유형을 선택합니다. 자세한 내용은 추론 모델 배포 섹션을 참조하세요.

    4. 배치 변환 작업에 지원되는 인스턴스 유형에서, 알고리즘이 배치 변환 작업에 대해 지원하는 인스턴스 유형을 선택합니다. 자세한 내용은 배치 변환을 사용하여 Amazon에서 추론 실행 SageMaker 섹션을 참조하세요.

    5. 지원되는 콘텐츠 유형에, 추론 요청을 위해 알고리즘에 필요한 입력 데이터 유형을 입력합니다.

    6. 지원되는 응답 MIME 유형에, 추론 응답에 대해 알고리즘에서 지원하는 MIME 유형을 입력합니다.

    7. 다음을 선택합니다.

  7. 검증 사양 페이지에서 다음 정보를 제공합니다.

    1. 이 알고리즘 게시 위치의 AWS Marketplace 경우 [] 를 선택하여 알고리즘을 AWS Marketplace게시합니다.

    2. 알고리즘의 훈련 및/또는 추론 코드를 SageMaker 테스트하기 위해 지정한 교육 작업 및/또는 배치 변환 작업을 실행하려면 이 리소스 검증에서 [] 를 선택합니다.

      참고

      알고리즘을 게시하려면 알고리즘을 검증해야 합니다. AWS Marketplace

    3. IAM 역할의 경우, 교육 작업 및 일괄 변환 작업을 실행하는 데 필요한 권한이 있는 IAM 역할을 선택하거나 Create a new role (Create a new role) 를 선택하여 관리형 정책이 연결된 역할을 생성할 수 있도록 SageMaker 하십시오. SageMaker AmazonSageMakerFullAccess 자세한 내용은 SageMaker 실행 역할 사용 방법 섹션을 참조하세요.

    4. 검증 프로필에서 다음을 지정합니다.

      • 검증 프로필의 이름

      • 훈련 작업 정의. 훈련 작업을 설명하는 JSON 블록입니다. CreateAlgorithm API의 TrainingJobDefinition 입력 파라미터와 형식이 동일합니다.

      • 변환 작업 정의. 배치 변환 작업을 설명하는 JSON 블록입니다. CreateAlgorithm API의 TransformJobDefinition 입력 파라미터와 형식이 동일합니다.

    5. 알고리즘 생성을 선택합니다.

알고리즘 리소스 생성(API)

API를 사용하여 알고리즘 리소스를 생성하려면 SageMaker API를 호출하십시오. CreateAlgorithm