`JumpStartModel` 클래스와 함께 공개적으로 사용 가능한 파운데이션 모델 배포

포커스 모드

JumpStartModel 클래스와 함께 공개적으로 사용 가능한 파운데이션 모델 배포 - Amazon SageMaker AI

기본 인스턴스 유형 확인 추론 구성 요소를 사용하여 여러 모델을 공유 엔드포인트에 배포 유효한 입력 및 출력 추론 형식 확인 지원되는 콘텐츠 확인 및 유형 수락

SageMaker Python SDK를 사용하여 몇 줄의 코드만으로 기본 제공 알고리즘 또는 사전 훈련된 모델을 SageMaker AI 엔드포인트에 배포할 수 있습니다.

먼저 사전 훈련된 모델 테이블이 있는 기본 제공 알고리즘에서 원하는 모델의 모델 ID를 찾습니다.

모델 ID를 사용하여 모델을 JumpStart 모델로 정의합니다.


from sagemaker.jumpstart.model import JumpStartModel

model_id = "huggingface-text2text-flan-t5-xl"
my_model = JumpStartModel(model_id=model_id)

deploy 메서드를 사용하여 추론을 위해 모델을 자동으로 배포합니다. 이 예제에서는 Hugging Face의 FLAN-T5 XL 모델을 사용합니다.
```
predictor = my_model.deploy()
```

그런 다음 predict 메서드를 사용하여 배포된 모델로 추론을 실행할 수 있습니다.


question = "What is Southern California often abbreviated as?"
response = predictor.predict(question)
print(response)

참고

이 예제에서는 파운데이션 모델 FLAN-T5 XL을 사용합니다. 이 모델은 질문 응답, 요약, 챗봇 생성 등을 포함한 다양한 텍스트 생성 사용 사례에 적합합니다. 모델 사용 사례에 대한 자세한 내용은 사용 가능한 파운데이션 모델 섹션을 참조하세요.

JumpStartModel 클래스와 해당 파라미터에 대한 자세한 내용은 JumpStartModel을 참조하세요.

기본 인스턴스 유형 확인

JumpStartModel 클래스를 사용하여 사전 훈련된 모델을 배포할 때 선택적으로 특정 모델 버전 또는 인스턴스 유형을 포함할 수 있습니다. 모든 JumpStart 모델에는 기본 인스턴스 유형이 있습니다. 다음 코드를 사용하여 기본 배포 인스턴스 유형을 검색합니다.


from sagemaker import instance_types

instance_type = instance_types.retrieve_default(
    model_id=model_id,
    model_version=model_version,
    scope="inference")
print(instance_type)

instance_types.retrieve() 메서드를 사용하여 지정된 JumpStart 모델에 지원되는 모든 인스턴스 유형을 확인합니다.

추론 구성 요소를 사용하여 여러 모델을 공유 엔드포인트에 배포

추론 구성 요소는 유연성과 확장성을 높이기 위해 엔드포인트에 하나 이상의 모델을 배포하는 데 사용할 수 있는 SageMaker AI 호스팅 객체입니다. JumpStart 모델의 endpoint_type를 기본 모델 기반 엔드포인트가 아닌 추론 구성 요소 기반으로 변경해야 합니다.


predictor = my_model.deploy(
    endpoint_name = 'jumpstart-model-id-123456789012', 
    endpoint_type = EndpointType.INFERENCE_COMPONENT_BASED
)

추론 구성 요소를 사용하여 엔드포인트를 생성하고 SageMaker AI 모델을 배포하는 방법에 대한 자세한 내용은 섹션을 참조하세요여러 모델을 사용한 공유 리소스 사용률.

유효한 입력 및 출력 추론 형식 확인

추론에 대해 유효한 데이터 입력 및 출력 형식을 확인하려면 Serializers 및 Deserializers 클래스의 retrieve_options() 메서드를 사용할 수 있습니다.


print(sagemaker.serializers.retrieve_options(model_id=model_id, model_version=model_version))
print(sagemaker.deserializers.retrieve_options(model_id=model_id, model_version=model_version))

지원되는 콘텐츠 확인 및 유형 수락

마찬가지로 retrieve_options() 메서드를 사용하여 지원되는 콘텐츠를 확인하고 모델의 유형을 수락할 수 있습니다.


print(sagemaker.content_types.retrieve_options(model_id=model_id, model_version=model_version))
print(sagemaker.accept_types.retrieve_options(model_id=model_id, model_version=model_version))

유틸리티에 대한 자세한 내용은 Utility API를 참조하세요.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

퍼블릭 모델 미세 조정

독점 모델 배포

이 페이지에서

쿠키 기본 설정 선택

쿠키 기본 설정 사용자 지정

필수

성능

기능

광고

쿠키 기본 설정을 저장할 수 없음

`JumpStartModel` 클래스와 함께 공개적으로 사용 가능한 파운데이션 모델 배포

참고

기본 인스턴스 유형 확인

추론 구성 요소를 사용하여 여러 모델을 공유 엔드포인트에 배포

유효한 입력 및 출력 추론 형식 확인

지원되는 콘텐츠 확인 및 유형 수락

이 페이지에서

Related resources

페이지 내용이 도움이 되었습니까?

Related resources

다음 주제:

이전 주제:

도움이 필요하십니까?