기계 학습 제품 생성을 위한 요구 사항 및 모범 사례 - AWS Marketplace

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

기계 학습 제품 생성을 위한 요구 사항 및 모범 사례

구매자가 모델 패키지와 알고리즘 제품을 쉽게 테스트할 수 있어야 합니다. 다음 섹션에서는 기계 학습(ML) 제품 목록을 생성하기 위한 요구 사항과 ML 제품의 모범 사례에 대해 설명합니다. 요구 사항 및 권장 사항의 전체 요약은 ML 제품 목록의 요구 사항 및 권장 사항 요약 섹션을 참조하세요.

참고

게시된 제품이 요구 사항을 충족하지 않는 경우 AWS Marketplace 담당자가 이러한 요구 사항을 충족하는 데 도움을 주기 위해 연락을 드릴 수 있습니다.

필수 자산

기계 학습 제품 목록을 생성하기 전에, 다음과 같은 필수 자산이 있는지 확인합니다.

  • Amazon 리소스 이름(ARN) - 게시 AWS 리전 하려는에서 모델 패키지 또는 알고리즘 리소스의 ARN을 제공합니다( 참조게시 AWS 리전 지원).

    • 모델 패키지의 ARN은 arn:aws:sagemaker:<region>:<account-id>:model-package/<model-package-name> 형식입니다.

    • 알고리즘의 ARN은 arn:aws:sagemaker:<region>:<account-id>:algorithm/<algorithm-name> 형식입니다.

  • 사용 정보 요구 사항 - 입력, 출력 및 코드 예제에 대한 세부 정보를 제공합니다.

  • 입력 및 출력 요구 사항 - 파일 또는 텍스트를 제공합니다.

  • Jupyter Notebook 요구 사항 - 전체 제품 사용법을 보여줍니다.

ML 제품의 일반 모범 사례

기계 학습 제품에 대한 다음 정보를 제공합니다.

  • 제품 설명에 다음 정보가 포함되어야 합니다.

    • 모델이 하는 일

    • 대상 고객

    • 가장 중요한 사용 사례

    • 모델을 훈련한 방법 또는 사용된 데이터의 양

    • 성능 지표의 정의 및 사용된 검증 데이터

    • 의료용인 경우 모델이 진단용인지 여부

  • 기본적으로 기계 학습 제품은 대중에게 공개되도록 구성됩니다. 그러나 비공개 제품을 생성할 수도 있습니다. 자세한 내용은 제품 목록 생성 단원을 참조하세요.

  • (선택 사항) 유료 제품의 경우 고객이 제품을 사용해 볼 수 있도록 14~30일 무료 평가판을 제공합니다. 자세한 내용은 에 대한 기계 학습 제품 요금 AWS Marketplace 단원을 참조하세요.

  • (선택 사항) 모델 패키지 제품의 경우 제품 목록 페이지에서 실시간 제품 데모를 활성화하려면 AWS Marketplace 판매자 운영 팀에 문의합니다. 제품 데모를 제공하면 잠재 구매자가 모델을 구독하거나 배포할 필요 없이 목록 페이지에서 직접 모델을 사용해 볼 수 있습니다.

사용 정보 요구 사항

제품의 예상 입력 및 출력을 설명하는 명확한 사용 정보(예시 포함)는 긍정적인 구매자 경험을 유도하는 데 매우 중요합니다.

제품 목록에 새 버전의 리소스를 추가할 때마다 사용 정보를 제공해야 합니다.

처음 게시하는 새 제품의 사용 정보를 추가하려면 AWS Marketplace Management Portal 콘솔에 로그인합니다. 제품 드롭다운에서 기계 학습을 선택합니다. 자신의 제품을 선택합니다. 시작 옵션 제품 개요에서 모델 패키지 또는 알고리즘 리소스의 ARN을 입력하고 추가를 선택합니다.

특정 버전의 기존 사용 정보를 편집하려면 시작 옵션에서 편집을 선택하고 버전 편집을 선택합니다.

입력 및 출력 요구 사항

구매자가 제품을 이해하고 사용하는 데 도움이 되도록 입력 및 출력 예시와 함께 형식을 명확하게 설명해야 합니다. 이러한 이해를 통해 구매자는 입력 데이터에 필요한 변환을 수행하여 최상의 추론 결과를 얻을 수 있습니다.

Amazon SageMaker AI 리소스를 제품 목록에 추가할 때 다음을 입력하라는 메시지가 표시됩니다.

추론 입력 및 출력

추론 입력의 경우 실시간 엔드포인트와 배치 변환 작업의 입력 형식을 모두 제공합니다. 필요한 데이터 전처리용 코드 조각을 포함합니다. 지원되는 MIME 콘텐츠 유형(예: image/jpeg, image/png, image/bmp), 값에 대한 설명(해당하는 경우) 및 제한 사항을 포함합니다. GitHub에 호스팅되는 입력 샘플을 포함합니다.

추론 출력의 경우 실시간 엔드포인트와 배치 변환 작업의 출력 형식을 제공합니다. 출력 MIME 콘텐츠 유형(예: application/json, image/jpeg) 및 값에 대한 설명(해당하는 경우)을 포함합니다. GitHub에 호스팅되는 출력 샘플을 포함합니다.

샘플의 경우 제품에서 작동하는 입력 파일을 제공합니다. 모델에서 멀티클래스 분류를 수행하는 경우 각 클래스에 대해 하나 이상의 샘플 입력 파일을 제공합니다.

훈련 입력

모델 훈련을 위한 정보 섹션에서 입력 데이터 형식과 필요한 데이터 전처리용 코드 조각을 제공합니다. 지원되는 MIME 콘텐츠 유형(예: image/jpeg, image/png, image/bmp), 값에 대한 설명(해당하는 경우) 및 제한 사항을 포함합니다. GitHub에 호스팅되는 입력 샘플을 포함합니다.

구매자가 제공할 수 있는 선택적 기능과 필수 기능을 모두 설명하고, PIPE 입력 모드의 지원 여부를 지정합니다. 분산 훈련(CPU/GPU 인스턴스를 2개 이상 사용하는 훈련)이 지원되는 경우 이 옵션을 지정합니다. 튜닝의 경우 권장 하이퍼파라미터를 기재합니다.

Jupyter Notebook 요구 사항

제품 목록에 SageMaker AI 리소스를 추가할 때 구매자에게 데이터를 업로드하거나 찾도록 요청하지 않고 전체 워크플로를 보여주는 GitHub에서 호스팅되는 샘플 Jupyter Notebook에 대한 링크를 제공합니다.

AWS SDK for Python (Boto)를 사용합니다. 잘 개발된 샘플 노트북을 사용하면 구매자가 목록을 더 쉽게 사용해 볼 수 있습니다.

모델 패키지 제품의 경우 샘플 노트북은 입력 데이터 준비, 실시간 추론을 위한 엔드포인트 생성, 배치 변환 작업 수행을 시연합니다. 자세한 내용은 GitHub의 모델 패키지 목록 및 샘플 노트북을 참조하세요. 샘플 노트북은 auto_insurance를 참조하세요. 노트북은 파라미터를 입력 AWS 리전하지 않고 구매자가 샘플 데이터를 찾을 필요 없이 모두 작동합니다.

참고

여러 가능한 입력 및 데이터 전처리 단계를 보여주지 않는 저개발 샘플 Jupyter Notebook은 구매자가 제품의 가치 제안을 완전히 이해하기 어려울 수 있습니다.

알고리즘 제품의 경우 샘플 노트북은 전체 훈련, 튜닝, 모델 생성, 실시간 추론을 위한 엔드포인트 생성, 배치 변환 작업 수행을 시연합니다. 자세한 내용은 GitHub의 알고리즘 목록 및 샘플 노트북을 참조하세요. 샘플 노트북은 GitHub의 amazon_demo_productautoml을 참조하세요. 이러한 샘플 노트북은 파라미터를 입력하지 않아도 모든 리전에서 작동하며 구매자가 샘플 데이터를 찾을 필요가 없습니다.

참고

예제 훈련 데이터가 부족하면 고객이 Jupyter Notebook을 성공적으로 실행할 수 없습니다. 샘플 노트북이 제대로 개발되지 않으면 구매자가 제품을 사용해 볼 수 없어서 선택을 망설이게 됩니다.

ML 제품 목록의 요구 사항 및 권장 사항 요약

다음 표에는 기계 학습 제품 목록 페이지의 요구 사항과 권장 사항에 대한 요약 정보가 정리되어 있습니다.

세부 정보 모델 패키지 목록 알고리즘 목록
Product descriptions
Explain in detail what the product does for supported content types (for example, “detects X in images"). Required Required
Provide compelling and differentiating information about the product (avoid adjectives like "best" or unsubstantiated claims). Recommended Recommended
List most important use case(s) for this product. Required Required
Describe the data (source and size) it was trained on and list any known limitations. Required Not applicable
Describe the core framework that the model was built on. Recommended Recommended
Summarize model performance metric on validation data (for example, "XX.YY percent accuracy benchmarked using the Z dataset"). Required Not applicable
Summarize model latency and/or throughput metrics on recommended instance type. Required Not applicable
Describe the algorithm category. For example, “This decision forest regression algorithm is based on an ensemble of tree-structured classifiers that are built using the general technique of bootstrap aggregation and a random choice of features.” Not applicable Required
Usage information
For inference, provide the input format for both the real-time endpoint and batch transform job. Include supported MIME content types (for example, image/jpeg, image/png, image/bmp), description of values if applicable, and limitations. See 입력 및 출력 요구 사항. Required Required
For inference, provide input samples for both the real-time endpoint and batch transform job. Samples must be hosted on GitHub. See 입력 및 출력 요구 사항. Required Required
For inference, provide the output format for both the real-time endpoint and batch transform job. Include output MIME content type (for example, application/json, image/jpeg) and description of values if applicable. See 입력 및 출력 요구 사항. Required Required
For inference, provide output samples for both the real-time endpoint and batch transform job. Samples must be hosted on GitHub. See 입력 및 출력 요구 사항. Required Required
For inference, provide an example of using an endpoint or batch transform job. Include a code example using the AWS Command Line Interface (AWS CLI) commands or using an AWS SDK. Required Required
For training, provide input format. Include supported MIME content types (for example, image/jpeg, image/png, image/bmp), description of values if applicable, and limitations (for example, minimum rows of data required). See 입력 및 출력 요구 사항. Not applicable Required
For training, provide input samples hosted on GitHub. See 입력 및 출력 요구 사항. Not applicable Required
For training, provide an example of performing training jobs. Describe the supported hyperparameters, their ranges, and their overall impact. Specify if the algorithm supports hyperparameter tuning, distributed training, or GPU instances. Include code example such as AWS CLI commands or using an AWS SDK, for example. Not applicable Required
Provide a Jupyter notebook hosted on GitHub demonstrating complete use of your product. See Jupyter Notebook 요구 사항. Required Required
Provide technical information related to the usage of the product, including user manuals and sample data. Recommended Recommended