파운데이션 모델을 위한 프롬프트 엔지니어링 - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

파운데이션 모델을 위한 프롬프트 엔지니어링

프롬프트 엔지니어링은 특정 유형의 출력을 생성하기 위해 언어 모델에 대한 프롬프트 또는 입력 자극을 설계하고 개선하는 프로세스입니다. 프롬프트 엔지니어링에는 적절한 키워드를 선택하고 컨텍스트를 제공하며 모델이 원하는 응답을 생성하도록 유도하는 방식으로 입력을 형성하는 것이 포함되며, 이는 파운데이션 모델의 동작과 출력을 능동적으로 형성하는 데 필수적인 기법입니다.

효과적인 프롬프트 엔지니어링은 모델 행동을 지시하고 원하는 응답을 달성하는 데 매우 중요합니다. 프롬프트 엔지니어링을 통해 미세 조정과 같은 복잡한 사용자 지정 조치 없이도 모델의 톤, 스타일 및 도메인 전문성을 제어할 수 있습니다. 추가 데이터에 대한 모델 미세 조정을 것을 고려하기 전에 프롬프트 엔지니어링에 시간을 할애하는 것이 좋습니다. 목표는 모델이 보이지 않거나 제한된 데이터 시나리오에서 모델이 일반화되고 잘 수행될 수 있도록 모델에 충분한 컨텍스트와 지침을 제공하는 것입니다.

제로샷 학습

제로샷 학습에는 보이지 않는 클래스나 작업을 일반화하고 예측하도록 모델을 훈련시키는 것이 포함됩니다. 제로샷 학습 환경에서 프롬프트 엔지니어링을 수행하려면 대상 작업에 대한 정보와 원하는 출력 형식을 명시적으로 제공하는 프롬프트를 구성하는 것이 좋습니다. 예를 들어, 훈련 중에 모델이 인식하지 못한 일련의 클래스에 대해 제로샷 텍스트 분류를 위한 파운데이션 모델을 사용하려는 경우, 잘 설계된 프롬프트는 다음과 같습니다. "Classify the following text as either sports, politics, or entertainment: [input text]." 대상 클래스와 예상 출력 형식을 명시적으로 지정하면 보이지 않는 클래스에서도 정확한 예측을 수행하도록 모델을 유도할 수 있습니다.

퓨샷 학습

퓨샷 학습에는 새로운 클래스나 작업에 대해 제한된 양의 데이터로 모델을 훈련시키는 것이 포함됩니다. 퓨샷 학습 환경에서의 프롬프트 엔지니어링은 사용 가능한 제한된 훈련 데이터를 효과적으로 사용하는 프롬프트를 설계하는 데 중점을 둡니다. 예를 들어 이미지 분류 작업에 파운데이션 모델을 사용하고 새 이미지 클래스의 예제가 몇 개뿐인 경우, 대상 클래스의 자리 표시자와 함께 사용 가능한 레이블이 지정된 예제가 포함된 프롬프트를 엔지니어링할 수 있습니다. 예를 들어 프롬프트는 "[image 1], [image 2], and [image 3] are examples of [target class]. Classify the following image as [target class]"과 같을 수 있습니다. 레이블이 지정된 제한된 예제를 통합하고 대상 클래스를 명시적으로 지정하면 최소한의 훈련 데이터로도 모델을 일반화하고 정확한 예측을 수행하도록 유도할 수 있습니다.

지원되는 추론 파라미터

추론 파라미터를 변경하면 프롬프트에 대한 응답에도 영향을 미칠 수 있습니다. 프롬프트에 최대한 구체적이고 컨텍스트를 추가할 수 있지만 지원되는 추론 파라미터를 실험해 볼 수도 있습니다. 다음은 일반적으로 지원되는 몇 가지 추론 파라미터의 예입니다.

추론 파라미터 설명

max_new_tokens

기초 모델 응답의 최대 출력 길이. 유횻값: 정수, 범위: 양의 정수.

temperature

출력의 임의성을 제어합니다. 온도가 높으면 확률이 낮은 단어가 포함된 출력 시퀀스가 생성되고 온도가 낮으면 확률이 높은 단어가 포함된 출력 시퀀스가 생성됩니다. temperature=0If의 경우 응답은 확률이 가장 높은 단어로만 구성됩니다 (불필요한 디코딩). 유효한 값: 부동 소수점, 범위: 양의 부동 소수점.

top_p

모델은 텍스트 생성의 각 단계에서 누적 확률이 인 가능한 가장 작은 단어 집합을 샘플링합니다. top_p 유효 값: 부동 소수점, 범위: 0.0, 1.0.

return_full_text

True인 경우 입력 텍스트는 생성된 출력 텍스트의 일부입니다. 유효한 값: 부울, 기본값: False.

기초 모델 추론에 대한 자세한 내용은 을 참조하십시오. JumpStartModel클래스와 함께 공개적으로 사용 가능한 기초 모델을 배포하세요.

즉각적인 엔지니어링만으로는 특정 비즈니스 요구 사항, 도메인별 언어, 대상 작업 또는 기타 요구 사항에 맞게 기본 모델을 조정할 수 없는 경우 추가 데이터를 기반으로 모델을 미세 조정하거나 Retrieval Augmented Generation (RAG) 을 사용하여 보관된 지식 소스의 향상된 컨텍스트로 모델 아키텍처를 보강하는 것을 고려할 수 있습니다. 자세한 내용은 파운데이션 모델 미세 조정 또는 검색: 증강 제너레이션을 참조하세요.