Neptune ML 모델 훈련 API - Amazon Neptune

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Neptune ML 모델 훈련 API

모델 훈련 작업:

모델 훈련 구조:

StartMLModelTrainingJob(작업)

        이 API의 AWS CLI 이름은 start-ml-model-training-job입니다.

Neptune ML 모델 훈련 작업을 새로 생성합니다. modeltraining 명령을 사용한 모델 훈련을 참조합니다.

IAM 인증이 사용 설정된 Neptune 클러스터에서 이 작업을 호출하는 경우 요청을 생성하는 IAM 사용자 또는 역할에는 해당 클러스터에서 neptune-db:StartMLModelTrainingJob IAM 작업을 허용하는 정책이 연결되어 있어야 합니다.

요청

  • baseProcessingInstanceType(CLI의 경우: --base-processing-instance-type) - String, 유형은 string(UTF-8 인코딩 문자열)입니다.

    ML 모델 훈련 준비 및 관리에 사용되는 ML 인스턴스 유형입니다. 훈련 데이터 및 모델을 처리하는 데 필요한 메모리 요구 사항을 기반으로 선택된 CPU 인스턴스입니다.

  • customModelTrainingParameters(CLI의 경우: --custom-model-training-parameters) - CustomModelTrainingParameters 객체입니다.

    사용자 지정 모델 훈련 구성입니다. 이는 JSON 객체입니다.

  • dataProcessingJobId(CLI의 경우: --data-processing-job-id) - 필수: String, 유형은 string(UTF-8 인코딩 문자열)입니다.

    훈련에서 사용할 데이터를 생성하여 완료된 데이터 처리 작업의 작업 ID입니다.

  • enableManagedSpotTraining(CLI의 경우: --enable-managed-spot-training) - Boolean, 유형은 boolean(부울(true 또는 false) 값)입니다.

    Amazon Elastic Compute Cloud 스팟 인스턴스를 사용하여 기계 학습 모델 훈련 비용을 최적화합니다. 기본값은 False입니다.

  • id(CLI의 경우: --id) - String, 유형은 string(UTF-8 인코딩 문자열)입니다.

    새 작업의 고유 식별자입니다. 기본값은 자동 생성된 UUID입니다.

  • maxHPONumberOfTrainingJobs(CLI의 경우: --max-hpo-number-of-training-jobs) - Integer, 유형은 integer(32비트 부호 있는 정수)입니다.

    하이퍼파라미터 튜닝 작업을 위해 시작할 최대 총 훈련 작업 수입니다. 기본값은 2입니다. Neptune ML은 기계 학습 모델의 하이퍼파라미터를 자동으로 튜닝합니다. 성능이 좋은 모델을 확보하려면 최소 10개 이상의 작업(즉 maxHPONumberOfTrainingJobs 값을 10으로 설정)을 사용합니다. 일반적으로 튜닝 실행 횟수가 많을수록 더 좋은 결과를 얻을 수 있습니다.

  • maxHPOParallelTrainingJobs(CLI의 경우: --max-hpo-parallel-training-jobs) - Integer, 유형은 integer(32비트 부호 있는 정수)입니다.

    하이퍼파라미터 튜닝 작업을 위해 시작할 최대 병렬 훈련 작업 수입니다. 기본값은 2입니다. 실행할 수 있는 병렬 작업 수는 훈련 인스턴스에서 사용 가능한 리소스에 따라 제한됩니다.

  • neptuneIamRoleArn(CLI의 경우: --neptune-iam-role-arn) - String, 유형은 string(UTF-8 인코딩 문자열)입니다.

    SageMaker와 Amazon S3 리소스에 대한 Neptune의 액세스 권한을 제공하는 IAM 역할의 ARN입니다. 이는 DB 클러스터 파라미터 그룹에 나열되어 있어야 합니다. 그렇지 않으면 오류가 발생합니다.

  • previousModelTrainingJobId(CLI의 경우: --previous-model-training-job-id) - String, 유형은 string(UTF-8 인코딩 문자열)입니다.

    업데이트된 데이터를 기반으로 하여 점진적으로 업데이트하려는 완료된 모델 훈련 작업의 작업 ID입니다.

  • s3OutputEncryptionKMSKey(CLI의 경우: --s-3-output-encryption-kms-key) - String, 유형은 string(UTF-8 인코딩 문자열)입니다.

    SageMaker가 처리 작업의 출력을 암호화하는 데 사용하는 Amazon Key Management Service(Amazon KMS) 키입니다. 기본값은 없습니다.

  • sagemakerIamRoleArn(CLI의 경우: --sagemaker-iam-role-arn) - String, 유형은 string(UTF-8 인코딩 문자열)입니다.

    SageMaker 실행을 위한 IAM 역할의 ARN입니다. 이 ARN은 DB 클러스터 파라미터 그룹에 나열되어 있어야 합니다. 그렇지 않으면 오류가 발생합니다.

  • securityGroupIds(CLI의 경우: --security-group-ids) - String, 유형은 string(UTF-8 인코딩 문자열)입니다.

    VPC 보안 그룹 ID입니다. 기본값은 없습니다.

  • subnets(CLI의 경우: --subnets) - String, 유형은 string(UTF-8 인코딩 문자열)입니다.

    Neptune VPC의 서브넷 ID입니다. 기본값은 없습니다.

  • trainingInstanceType(CLI의 경우: --training-instance-type) - String, 유형은 string(UTF-8 인코딩 문자열)입니다.

    모델 훈련에 사용되는 ML 인스턴스 유형입니다. 모든 Neptune ML 모델은 CPU, GPU 및 다중 GPU 훈련을 지원합니다. 기본값은 ml.p3.2xlarge입니다. 훈련에 적합한 인스턴스 유형을 선택하는 것은 작업 유형, 그래프 크기, 예산에 따라 달라집니다.

  • trainingInstanceVolumeSizeInGB(CLI의 경우: --training-instance-volume-size-in-gb) - Integer, 유형은 integer(32비트 부호 있는 정수)입니다.

    훈련 인스턴스의 디스크 볼륨 크기입니다. 입력 데이터와 출력 모델 모두 디스크에 저장되므로 볼륨 크기는 두 데이터 집합을 모두 저장할 수 있을 만큼 커야 합니다. 기본값은 0입니다. 지정하지 않거나 0인 경우 Neptune ML은 데이터 처리 단계에서 생성된 권장 사항에 따라 디스크 볼륨 크기를 선택합니다.

  • trainingTimeOutInSeconds(CLI의 경우: --training-time-out-in-seconds) - Integer, 유형은 integer(32비트 부호 있는 정수)입니다.

    훈련 작업의 제한 시간(초 단위)입니다. 기본값은 86,400(1일)입니다.

  • trainModelS3Location(CLI의 경우: --train-model-s3-location) - 필수: String, 유형은 string(UTF-8 인코딩 문자열)입니다.

    모델 아티팩트가 저장되는 Amazon S3의 위치입니다.

  • volumeEncryptionKMSKey(CLI의 경우: --volume-encryption-kms-key) - String, 유형은 string(UTF-8 인코딩 문자열)입니다.

    훈련 작업을 실행하는 ML 컴퓨팅 인스턴스에 연결된 스토리지 볼륨에서 데이터를 암호화하는 데 SageMaker가 사용하는 Amazon Key Management Service(Amazon KMS) 키입니다. 기본값은 없습니다.

응답

  • arn - String, 유형은 string(UTF-8 인코딩 문자열)입니다.

    새 모델 훈련 작업의 ARN입니다.

  • creationTimeInMillis - Long, 유형은 long(64비트 부호가 있는 정수)입니다.

    모델 훈련 작업 생성 시간(밀리초 단위)입니다.

  • id - String, 유형은 string(UTF-8 인코딩 문자열)입니다.

    새 모델 훈련 작업의 고유 ID입니다.

ListMLModelTrainingJobs(작업)

        이 API의 AWS CLI 이름은 list-ml-model-training-jobs입니다.

Neptune ML 모델 훈련 작업을 나열합니다. modeltraining 명령을 사용한 모델 훈련을 참조합니다.

IAM 인증이 사용 설정된 Neptune 클러스터에서 이 작업을 호출하는 경우 요청을 생성하는 IAM 사용자 또는 역할에는 해당 클러스터에서 neptune-db:neptune-db:ListMLModelTrainingJobs IAM 작업을 허용하는 정책이 연결되어 있어야 합니다.

요청

  • maxItems(CLI의 경우: --max-items) - ListMLModelTrainingJobsInputMaxItemsInteger, 유형은 1~1,024자인 integer(32비트 부호 있는 정수)입니다.

    반환할 항목의 최대 수입니다(1~1024이며, 기본값은 10).

  • neptuneIamRoleArn(CLI의 경우: --neptune-iam-role-arn) - String, 유형은 string(UTF-8 인코딩 문자열)입니다.

    SageMaker와 Amazon S3 리소스에 대한 Neptune의 액세스 권한을 제공하는 IAM 역할의 ARN입니다. 이는 DB 클러스터 파라미터 그룹에 나열되어 있어야 합니다. 그렇지 않으면 오류가 발생합니다.

응답

  • ids - String, 유형은 string(UTF-8 인코딩 문자열)입니다.

    모델 훈련 작업 ID 목록 페이지입니다.

GetMLModelTrainingJob(작업)

        이 API의 AWS CLI 이름은 get-ml-model-training-job입니다.

Neptune ML 모델 훈련 작업에 대한 정보를 검색합니다. modeltraining 명령을 사용한 모델 훈련을 참조합니다.

IAM 인증이 사용 설정된 Neptune 클러스터에서 이 작업을 호출하는 경우 요청을 생성하는 IAM 사용자 또는 역할에는 해당 클러스터에서 neptune-db:GetMLModelTrainingJobStatus IAM 작업을 허용하는 정책이 연결되어 있어야 합니다.

요청

  • id(CLI의 경우: --id) - 필수: String, 유형은 string(UTF-8 인코딩 문자열)입니다.

    검색할 모델 훈련 작업의 고유 식별자입니다.

  • neptuneIamRoleArn(CLI의 경우: --neptune-iam-role-arn) - String, 유형은 string(UTF-8 인코딩 문자열)입니다.

    SageMaker와 Amazon S3 리소스에 대한 Neptune의 액세스 권한을 제공하는 IAM 역할의 ARN입니다. 이는 DB 클러스터 파라미터 그룹에 나열되어 있어야 합니다. 그렇지 않으면 오류가 발생합니다.

응답

  • hpoJobMlResourceDefinition 객체입니다.

    HPO 작업입니다.

  • id - String, 유형은 string(UTF-8 인코딩 문자열)입니다.

    이 모델 훈련 작업의 고유 식별자입니다.

  • mlModelsMlConfigDefinition 객체의 배열입니다.

    사용 중인 ML 모델의 구성 목록입니다.

  • modelTransformJobMlResourceDefinition 객체입니다.

    모델 변환 작업입니다.

  • processingJobMlResourceDefinition 객체입니다.

    데이터 처리 작업입니다.

  • status - String, 유형은 string(UTF-8 인코딩 문자열)입니다.

    모델 훈련 작업의 상태입니다.

CancelMLModelTrainingJob(작업)

        이 API의 AWS CLI 이름은 cancel-ml-model-training-job입니다.

Neptune ML 모델 훈련 작업을 취소합니다. modeltraining 명령을 사용한 모델 훈련을 참조합니다.

IAM 인증이 사용 설정된 Neptune 클러스터에서 이 작업을 호출하는 경우 요청을 생성하는 IAM 사용자 또는 역할에는 해당 클러스터에서 neptune-db:CancelMLModelTrainingJob IAM 작업을 허용하는 정책이 연결되어 있어야 합니다.

요청

  • clean(CLI의 경우: --clean) - Boolean, 유형은 boolean(부울(true 또는 false) 값)입니다.

    TRUE로 설정된 경우 이 플래그는 작업이 중지될 때 모든 Amazon S3 아티팩트를 삭제하도록 지정합니다. 기본값은 FALSE입니다.

  • id(CLI의 경우: --id) - 필수: String, 유형은 string(UTF-8 인코딩 문자열)입니다.

    취소할 모델 훈련 작업의 고유 식별자입니다.

  • neptuneIamRoleArn(CLI의 경우: --neptune-iam-role-arn) - String, 유형은 string(UTF-8 인코딩 문자열)입니다.

    SageMaker와 Amazon S3 리소스에 대한 Neptune의 액세스 권한을 제공하는 IAM 역할의 ARN입니다. 이는 DB 클러스터 파라미터 그룹에 나열되어 있어야 합니다. 그렇지 않으면 오류가 발생합니다.

응답

  • status - String, 유형은 string(UTF-8 인코딩 문자열)입니다.

    취소 상태입니다.

모델 훈련 구조:

CustomModelTrainingParameters(구조)

사용자 지정 모델 학습 파라미터가 포함되어 있습니다. Neptune ML의 사용자 지정 모델을 참조합니다.

필드
  • sourceS3DirectoryPath - 필수는 String이며, 유형은 string(UTF-8 인코딩 문자열)입니다.

    모델을 구현하는 Python 모듈이 위치한 Amazon S3 위치 경로입니다. 이는 최소한 훈련 스크립트, 변환 스크립트 및 model-hpo-configuration.json 파일을 포함하는 유효한 기존 Amazon S3 위치를 가리켜야 합니다.

  • trainingEntryPointScript - String이며, 유형은 string(UTF-8 인코딩 문자열)입니다.

    모델 훈련을 수행하고 하이퍼파라미터를 명령줄 인수로 취하는 스크립트(예: 고정값 하이퍼파라미터)의 모듈 진입점 이름입니다. 기본값은 training.py입니다.

  • transformEntryPointScript - String이며, 유형은 string(UTF-8 인코딩 문자열)입니다.

    모델 배포에 필요한 모델 아티팩트를 계산하기 위해 하이퍼파라미터 검색에서 최적의 모델을 식별한 후 실행해야 하는 스크립트의 모듈 내 진입점 이름입니다. 명령줄 인수 없이 실행할 수 있어야 하며 기본값은 transform.py입니다.