쿠키 기본 설정 선택

당사는 사이트와 서비스를 제공하는 데 필요한 필수 쿠키 및 유사한 도구를 사용합니다. 고객이 사이트를 어떻게 사용하는지 파악하고 개선할 수 있도록 성능 쿠키를 사용해 익명의 통계를 수집합니다. 필수 쿠키는 비활성화할 수 없지만 '사용자 지정' 또는 ‘거부’를 클릭하여 성능 쿠키를 거부할 수 있습니다.

사용자가 동의하는 경우 AWS와 승인된 제3자도 쿠키를 사용하여 유용한 사이트 기능을 제공하고, 사용자의 기본 설정을 기억하고, 관련 광고를 비롯한 관련 콘텐츠를 표시합니다. 필수가 아닌 모든 쿠키를 수락하거나 거부하려면 ‘수락’ 또는 ‘거부’를 클릭하세요. 더 자세한 내용을 선택하려면 ‘사용자 정의’를 클릭하세요.

엔드포인트 구성 생성

포커스 모드
엔드포인트 구성 생성 - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

모델을 만들었으면 엔드포인트 구성을 생성하세요. 그런 다음 엔드포인트 구성의 사양을 사용하여 모델을 배포할 수 있습니다. 구성에서 실시간 또는 서버리스 엔드포인트를 원하는지 여부를 지정합니다. 서버리스 엔드포인트 구성을 생성하려면 Amazon SageMaker AI 콘솔, CreateEndpointConfig API 또는를 사용할 수 있습니다 AWS CLI. API 및 콘솔 접근 방식은 다음 섹션에 요약되어 있습니다.

인터페이스 엔드포인트 생성하기 (콘솔 사용)

다음 예제에서는 Python용AWS SDK (Boto3)를 사용하여 CreateEndpointConfig API를 호출합니다. 다음 값을 지정하세요:

  • EndpointConfigName에서 엔드포인트 구성의 이름을 선택하세요. 이 이름은 해당 리전의 계정 내에서 고유해야 합니다.

  • (선택 사항)의 경우 KmsKeyId사용하려는 키에 키 ID, 키 ARN, 별칭 이름 또는 AWS KMS 별칭 ARN을 사용합니다. SageMaker AI는이 키를 사용하여 Amazon ECR 이미지를 암호화합니다.

  • ModelName의 경우, 배포하려는 모델의 이름을 사용하세요. 이는 모델 생성 단계에서 사용한 것과 동일한 모델이어야 합니다.

  • ServerlessConfig의 경우:

    • MemorySizeInMB2048으로 설정합니다. 이 예제에서는 메모리 크기를 2048MB로 설정했지만 메모리 크기로 1024 MB, 2048 MB, 3072 MB, 4096 MB, 5120 MB, 또는 6144 MB 중 하나를 선택할 수 있습니다.

    • MaxConcurrency20으로 설정합니다. 이 예시에서는 최대 동시 실행을 20으로 설정했습니다. 서버리스 엔드포인트에 설정할 수 있는 최대 동시 호출 수는 200개이며, 선택할 수 있는 최소값은 1입니다.

    • (선택 사항) 동시성 프로비저닝을 사용하려면 ProvisionedConcurrency를 10으로 설정합니다. 이 예시에서는 동시성 프로비저닝을 10으로 설정했습니다. 서버리스 엔드포인트의 ProvisionedConcurrency 수는 MaxConcurrency보다 작거나 같아야 합니다. 온디맨드 서버리스 추론 엔드포인트를 사용하려는 경우 이 이를 비워 둘 수 있습니다. 동시성 프로비저닝의 크기를 동적으로 조정할 수 있습니다. 자세한 내용은 서버리스 엔드포인트에 맞게 프로비저닝된 동시성의 자동 확장 섹션을 참조하세요.

response = client.create_endpoint_config( EndpointConfigName="<your-endpoint-configuration>", KmsKeyId="arn:aws:kms:us-east-1:123456789012:key/143ef68f-76fd-45e3-abba-ed28fc8d3d5e", ProductionVariants=[ { "ModelName": "<your-model-name>", "VariantName": "AllTraffic", "ServerlessConfig": { "MemorySizeInMB": 2048, "MaxConcurrency": 20, "ProvisionedConcurrency": 10, } } ] )

엔드포인트 구성성 생성하기 (콘솔 사용)

  1. Amazon SageMaker AI 콘솔에 로그인합니다.

  2. 탐색 패널에서 Inference(추론)을 선택합니다.

  3. 다음으로 Endpoint configurations(엔드포인트 구성)을 선택합니다.

  4. Create endpoint configuration(엔드포인트 구성 생성)을 선택합니다.

  5. Endpoint configuration name(엔드포인트 구성 이름)에 해당 리전의 계정 내에서 고유한 이름을 입력합니다.

  6. Type of endpoint(엔드포인트 유형)에서 Serverless(서버리스)를 선택합니다.

    콘솔의 엔드포인트 유형 옵션 스크린샷.
  7. Production variants(프로덕션 변형)에서 Add model(모델 추가)를 선택합니다.

  8. Add model(모델 추가)에서 모델 목록에서 사용하려는 모델을 선택한 다음 Save(저장)을 선택합니다.

  9. 모델을 추가한 후 Actions(작업)에서 Edit(편집)을 선택합니다.

  10. Memory size(메모리 크기)에서 원하는 메모리 크기 (GB)를 선택합니다.

    콘솔의 메모리 크기 옵션 스크린샷.
  11. Max Concurrency(최대 동시성)에 엔드포인트를 위해 원하는 최대 동시 호출 수를 입력합니다. 입력할 수 있는 최대값은 200이고 최소값은 1입니다.

  12. (선택 사항) 동시성 프로비저닝을 사용하려면 Provisioned Concurrency setting(동시성 프로비저닝 설정) 필드에 원하는 동시 호출 수를 입력합니다. 프로비저닝된 동시 호출 수는 최대 동시 호출 수보다 작거나 같아야 합니다.

  13. Save(저장)를 선택합니다.

  14. (선택 사항) 엔드포인트 구성을 위한 메타데이터를 생성하려면 Tags(태그)에 키-값 페어를 입력합니다.

  15. Create endpoint configuration(엔드포인트 구성 생성)을 선택합니다.

프라이버시사이트 이용 약관쿠키 기본 설정
© 2025, Amazon Web Services, Inc. 또는 계열사. All rights reserved.