기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
Amazon Titan Image Generator G1 모델 개요
Amazon Titan Image Generator G1은 이미지 생성 모델입니다. 두 가지 버전인 v1과 v2로 제공됩니다.
Amazon Titan Image Generator v1을 사용하면 다양한 방식으로 이미지를 생성하고 편집할 수 있습니다. 사용자가 자연어 프롬프트를 입력하기만 하면 텍스트 기반 설명과 일치하는 이미지를 생성할 수 있습니다. 또한 마스크 없이 텍스트 기반 프롬프트를 적용하거나 이미지 마스크를 사용하여 이미지의 특정 부분을 편집하는 등 기존 이미지를 업로드하고 편집할 수 있습니다. 또한 이 모델은 이미지의 경계를 확장하는 아웃페인팅과 누락된 영역을 채우는 인페인팅을 지원합니다. 선택적 텍스트 프롬프트를 기반으로 이미지의 변형을 생성할 수 있는 기능과, 사용자가 참조 이미지를 사용하여 스타일을 전송하거나 여러 참조의 스타일을 결합할 수 있는 즉각적인 사용자 지정 옵션을 제공하며, 이 모든 옵션에서 미세 조정이 필요하지 않습니다.
Titan Image Generator v2는 Titan Image Generator v1의 모든 기존 기능에 몇 가지 새로운 기능을 추가로 지원합니다. 이러한 기능으로 사용자는 참조 이미지를 활용하여 이미지 생성에 가이드를 제공할 수 있습니다. 여기서 출력 이미지는 텍스트 프롬프트를 따라가면서 참조 이미지의 레이아웃 및 구성에 맞게 생성됩니다. 또한 사용자 입력 없이 여러 객체가 포함된 이미지에서 배경을 제거할 수 있는 자동 배경 제거 기능도 포함되어 있습니다. 이 모델은 생성된 이미지의 색상 팔레트를 정확하게 제어하므로 사용자는 추가적인 미세 조정 없이도 브랜드의 시각적 아이덴티티를 유지할 수 있습니다. 또한 주제 일관성 기능을 사용하면 사용자가 참조 이미지로 모델을 미세 조정하여, 생성된 이미지에서 선택한 주제(예: 반려동물, 신발 또는 핸드백)를 유지할 수 있습니다. 이 포괄적인 기능 모음을 통해 사용자는 창의적 잠재력과 풍부한 상상력을 발휘하여 비전을 실현할 수 있습니다.
Amazon Titan Image Generator G1 모델 프롬프트 엔지니어링 지침에 대한 자세한 내용은 Amazon Titan Image Generator Prompt Engineering Best Practices
AI의 책임 있는 사용에 대한 모범 사례를 지속적으로 지원하기 위해 Titan Foundation 모델(FMs)은 데이터에서 유해한 콘텐츠를 감지 및 제거하고, 사용자 입력에서 부적절한 콘텐츠를 거부하고, 부적절한 콘텐츠(예: 증오 발언, 비속어 및 폭력)가 포함된 모델의 출력을 필터링하도록 구축되었습니다. Titan Image Generator FM은 생성된 모든 이미지에 보이지 않는 워터마크와 C2PA
Amazon Bedrock 콘솔에서 워터마크 감지 기능을 사용하거나 Amazon Bedrock 워터마크 감지API(미리 보기)를 호출하여 이미지에 Titan Image Generator의 워터마크가 포함되어 있는지 확인할 수 있습니다. Content Credentials Verify
Amazon Titan Image Generator v1 개요
모델 ID –
amazon.titan-image-generator-v1
최대 입력 문자 - 512자
최대 입력 이미지 크기 - 5MB(일부 특정 해상도만 지원됨)
인/아웃페인팅을 사용한 최대 이미지 크기 - 1,408x1,408픽셀
이미지 변형을 사용한 최대 이미지 크기 - 4,096x4,096픽셀
언어 - 영어
출력 유형 - 이미지
지원되는 이미지 유형 - JPEG, JPG, PNG
추론 유형 - 온디맨드, 프로비저닝된 처리량
지원되는 사용 사례 - 이미지 생성, 이미지 편집, 이미지 변형
Amazon Titan Image Generator v2 개요
모델 ID –
amazon.titan-image-generator-v2:0
최대 입력 문자 - 512자
최대 입력 이미지 크기 - 5MB(일부 특정 해상도만 지원됨)
인/아웃페인팅, 배경 제거, 이미지 컨디셔닝, 색상 팔레트를 사용한 최대 이미지 크기 - 1,408 x 1,408픽셀
이미지 변형을 사용한 최대 이미지 크기 - 4,096x4,096픽셀
언어 - 영어
출력 유형 - 이미지
지원되는 이미지 유형 - JPEG, JPG, PNG
추론 유형 - 온디맨드, 프로비저닝된 처리량
지원되는 사용 사례 - 이미지 생성, 이미지 편집, 이미지 변형, 배경 제거, 색상 안내 콘텐츠
특성
-
Text-to-image (T2I) 생성 - 텍스트 프롬프트를 입력하고 출력으로 새 이미지를 생성합니다. 생성된 이미지는 텍스트 프롬프트에 설명된 개념을 캡처합니다.
-
T2I 모델 미세 조정 - 여러 이미지를 가져와서 나만의 스타일과 개인 맞춤으로 캡처한 다음 핵심 T2I 모델을 미세 조정합니다. 미세 조정된 모델은 특정 사용자의 스타일과 개인 맞춤을 준수하는 이미지를 생성합니다.
-
이미지 편집 옵션 - 인페인팅, 아웃페인팅, 변형 생성, 이미지 마스크를 사용하지 않는 자동 편집 등이 포함됩니다.
-
인페인팅 - 사용자가 입력하거나 모델에서 추정한 이미지 및 분할 마스크를 입력으로 사용하고 마스크 내의 영역을 재구성합니다. 인페인팅을 사용하면 마스크된 요소를 제거하고 배경 픽셀로 바꿀 수 있습니다.
-
아웃페인팅 - 사용자가 입력하거나 모델에서 추정한 이미지 및 분할 마스크를 입력으로 사용하고 영역을 매끄럽게 확장하는 새 픽셀을 생성합니다. 이미지를 경계선까지 확장할 때 마스크된 이미지의 픽셀을 보존하려면 정밀한 아웃페인팅을 사용합니다. 기본값 아웃페인팅을 사용하면 분할 설정에 따라 마스크된 이미지의 픽셀을 이미지 경계까지 확장할 수 있습니다.
-
이미지 변형 - 1~5개의 이미지와 필요한 경우 프롬프트를 입력으로 사용합니다. 입력 이미지의 내용은 보존되지만 스타일과 배경이 달라지는 새 이미지를 생성합니다.
-
이미지 컨디셔닝 - (V2만 해당) 입력 참조 이미지를 사용하여 이미지 생성을 안내합니다. 모델은 텍스트 프롬프트를 따라가면서 참조 이미지의 레이아웃 및 구성과 일치하는 출력 이미지를 생성합니다.
-
주제 일관성 - (V2만 해당) 주제 일관성을 통해 사용자는 참조 이미지로 모델을 미세 조정하여, 생성된 이미지에서 선택한 주제(예: 반려동물, 신발 또는 핸드백)를 유지할 수 있습니다.
-
색상 안내 콘텐츠 - (V2만 해당) 프롬프트와 함께 16진수 색상 코드 목록을 제공할 수 있습니다. 1~10개의 16진수 코드를 제공할 수 있습니다. 에서 반환한 이미지 Titan Image Generator G1 V2 는 사용자가 제공한 색상 팔레트를 통합합니다.
-
배경 제거 - (V2만 해당) 입력 이미지에서 여러 객체를 자동으로 식별하고 배경을 제거합니다. 출력 이미지의 배경은 투명합니다.
-
콘텐츠 출처 - Content Credentials Verify
와 같은 사이트를 사용하여 이미지가 Titan Image Generator에서 생성되었는지 확인할 수 있습니다. 메타데이터가 제거되지 않은 한 이미지가 생성된 이미지임을 나타내야 합니다.
참고
미세 조정된 모델을 사용하는 경우 API 또는 모델의 인페인팅, 아웃페인팅 또는 색상 팔레트 기능을 사용할 수 없습니다.
파라미터
Amazon Titan Image Generator G1 모델 추론 파라미터에 대한 자세한 내용은 Amazon Titan Image Generator G1 models inference parameters를 참조하세요.
미세 조정
Amazon Titan Image Generator G1 모델 미세 조정에 대한 자세한 내용은 다음 페이지를 참조하세요.
Amazon Titan Image Generator G1 모델 미세 조정 및 요금
모델은 다음 예제 공식을 사용하여 작업당 총 요금을 계산합니다.
총 요금 = 단계 * 배치 크기 * 표시된 이미지당 요금
최소값(자동):
-
최소 단계(자동) - 500
-
최소 배치 크기 - 8
-
기본 학습률 - 0.00001
-
표시된 이미지당 요금 - 0.005
하이퍼파라미터 설정 미세 조정
단계 - 모델이 각 배치에 노출된 횟수입니다. 기본 단계 수 세트는 없습니다. 10~40,000 사이의 숫자 또는 문자열 값 ‘Auto(자동)’를 선택해야 합니다.
단계 설정 - 자동 - Amazon Bedrock은 훈련 정보를 기반으로 합리적인 값을 결정합니다. 훈련 비용보다 모델 성능을 우선시하려면 이 옵션을 선택합니다. 단계 수는 자동으로 결정됩니다. 이 숫자는 일반적으로 데이터세트를 기반으로 1,000~8,000입니다. 작업 비용은 모델을 데이터에 노출하는 데 사용되는 단계 수의 영향을 받습니다. 작업 비용이 계산되는 방법을 알아보려면 요금 세부 정보의 요금 예제 섹션을 참조하세요. (위의 예제 표를 참조하여 ‘자동’을 선택할 때 단계 수와 이미지 수가 어떻게 관련되는지 확인하세요.)
단계 설정 - 사용자 지정 - Bedrock이 사용자 지정 모델을 훈련 데이터에 노출시킬 단계 수를 입력할 수 있습니다. 이 값은 10~40,000이어야 합니다. 더 낮은 단계 수 값을 사용하면 모델에서 생성된 이미지당 비용을 줄일 수 있습니다.
배치 크기 - 모델 파라미터를 업데이트하기 전에 처리된 샘플 수입니다. 이 값은 8에서 192 사이이며 8의 배수입니다.
학습률 - 훈련 데이터의 각 배치 이후 모델 파라미터가 업데이트되는 비율입니다. 0과 1 사이의 부동 소수점 값입니다. 학습률은 기본적으로 0.00001로 설정됩니다.
미세 조정 절차에 대한 자세한 내용은 Submit a model customization job을 참조하세요.
출력
Amazon Titan Image Generator G1은 출력 이미지 크기와 품질을 사용하여 이미지 가격 책정 방식을 결정합니다. Amazon Titan Image Generator G1 모델에는 크기를 기준으로 2개의 가격 세그먼트가 존재합니다. 하나는 512*512 이미지용이고 다른 하나는 1,024*1,024 이미지용입니다. 가격은 이미지 높이*너비, 512*512 이하 또는 512*512 이상의 이미지 크기를 기준으로 책정됩니다.
Amazon Bedrock 요금에 대한 자세한 내용은 Amazon Bedrock 요금
워터마크 감지
참고
Amazon Bedrock 콘솔 및에 대한 워터마크 감지API는 공개 미리 보기 릴리스에서 사용할 수 있으며 Titan Image Generator G1에서 생성된 워터마크만 감지합니다. 현재 이 기능은 us-west-2
및 us-east-1
리전에서는 사용할 수 없습니다. 워터마크 감지는 Titan Image Generator G1에서 생성된 워터마크를 매우 정확하게 감지합니다. 원본 이미지에서 수정된 이미지인 경우 감지 결과가 덜 정확할 수 있습니다.
이 모델은 잘못된 정보의 확산을 줄이고, 저작권 보호를 지원하고, 콘텐츠 사용을 추적할 수 있도록 생성된 모든 이미지에 보이지 않는 워터마크를 추가합니다. 워터마크 감지 기능을 사용하면 워터마크의 존재 여부를 검사할 수 있어 이미지가 Titan Image Generator G1 모델로 생성되었는지 확인할 수 있습니다.
참고
워터마크 감지API는 미리 보기 중이며 변경될 수 있습니다. 를 사용하려면 가상 환경을 생성하는 것이 좋습니다SDK. 워터마크 감지APIs는 최신에서 사용할 수 없으므로 워터마크 감지와 함께 버전을 설치하기 전에 SDK 가상 환경에서 최신 버전의를 제거하는 SDKs것이 좋습니다APIs.
이미지를 업로드하여 이미지에 Titan Image Generator G1의 워터마크가 있는지 감지할 수 있습니다. 다음 단계에 따라 콘솔을 사용하여 이 모델에서 워터마크를 감지할 수 있습니다.
Titan Image Generator G1을 사용하여 워터마크를 감지하는 방법
Amazon Bedrock 콘솔
에서 Amazon Bedrock 콘솔을 엽니다. -
Amazon Bedrock의 탐색 창에서 개요를 선택합니다. 빌드 및 테스트 탭을 선택합니다.
-
세이프가드 섹션에서 워터마크 감지로 이동하여 워터마크 감지 보기를 선택합니다.
-
이미지 업로드를 선택하고 JPG 또는 PNG 형식의 파일을 찾습니다. 허용되는 최대 파일 크기는 5MB입니다.
-
파일을 업로드하면 이름, 파일 크기, 마지막으로 수정된 날짜와 함께 이미지 썸네일이 표시됩니다. 업로드 섹션에서 이미지를 삭제하거나 바꾸려면 X를 선택합니다.
-
분석을 선택하여 워터마크 감지 분석을 시작합니다.
-
이미지는 결과 아래에서 미리 볼 수 있으며, 워터마크가 감지되면 이미지 아래에 워터마크가 감지라고 표시되고 이미지 전체에 배너가 표시됩니다. 워터마크가 감지되지 않으면 이미지 아래의 텍스트에 워터마크가 NOT 감지된 것으로 표시됩니다.
-
다음 이미지를 로드하려면 업로드 섹션의 이미지 썸네일에서 X를 선택하고 분석할 새 이미지를 선택합니다.
프롬프트 엔지니어링 지침
마스크 프롬프트 - 이 알고리즘은 픽셀을 개념으로 분류합니다. 사용자는 마스크 프롬프트의 해석에 따라 마스크할 이미지 영역을 분류하는 데 사용할 텍스트 프롬프트를 제공합니다. 프롬프트 옵션은 더 복잡한 프롬프트를 해석하고 마스크를 분할 알고리즘으로 인코딩할 수 있습니다.
이미지 마스크 - 이미지 마스크를 사용하여 마스크 값을 설정할 수도 있습니다. 이미지 마스크를 마스크의 프롬프트 입력과 결합하여 정확도를 향상시킬 수 있습니다. 이미지 마스크 파일은 다음 파라미터에 부합해야 합니다.
-
마스크 이미지의 마스크 이미지 값은 0(검은색) 또는 255(흰색)여야 합니다. 값이 0인 이미지 마스크 영역은 사용자 프롬프트 또는 입력 이미지의 이미지로 재생성됩니다.
-
maskImage
필드는 base64 인코딩 이미지 문자열이어야 합니다. -
마스크 이미지는 입력 이미지와 크기가 같아야 합니다(높이와 너비가 동일).
-
입력 이미지와 마스크 이미지에는 PNG 또는 JPG 파일만 사용할 수 있습니다.
-
마스크 이미지는 흑백 픽셀 값만 사용해야 합니다.
-
마스크 이미지는 RGB 채널만 사용할 수 있습니다(알파 채널은 지원되지 않음).
Amazon Titan Image Generator 프롬프트 엔지니어링에 대한 자세한 내용은 Amazon Titan Image Generator G1 models Prompt Engineering Best Practices
일반적인 프롬프트 엔지니어링 지침은 프롬프트 엔지니어링 지침을 참조하세요.