Stable Diffusion 3 Grande solicitação e resposta

O corpo da solicitação é passado no body campo de uma solicitação para InvokeModelou InvokeModelWithResponseStream.

Campo do corpo da solicitação de invocação do modelo

Quando você faz uma InvokeModel chamada usando um Stable Diffusion 3 Modelo grande, preencha o campo do corpo com um JSON objeto parecido com o abaixo.


{
    'prompt': 'Create an image of a panda'
}

Campo corporal de respostas de invocação do modelo

Quando você faz uma InvokeModel chamada usando um Stable Diffusion 3 Modelo grande, a resposta se parece com a seguinte


{
    'seeds': [2130420379], 
    "finish_reasons": [null], 
    "images": ["..."]
}

Uma resposta com um motivo final que não sejanull, terá a seguinte aparência:


{
    "finish_reasons": ["Filter reason: prompt"]
}

seeds — (string) Lista de sementes usadas para gerar imagens para o modelo.
finish_reasons — Enumeração indicando se a solicitação foi filtrada ou não. nullindicará que a solicitação foi bem-sucedida. Valores atuais possíveis:"Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null.
images — Uma lista de imagens geradas no formato de string base64.

Para obter mais informações, consulte https://platform.stability.ai/docs/api-reference#tag/v1generation.

Text to image

O Stability.ai Stable Diffusion 3 O modelo grande tem os seguintes parâmetros de inferência para uma chamada de text-to-image inferência.

prompt — (string) O que você deseja ver na imagem de saída. Um aviso forte e descritivo que defina claramente elementos, cores e assuntos resultará em melhores resultados.

Mínimo	Máximo
0	10.000

Campos opcionais

aspect_ratio — (string) Controla a proporção da imagem gerada. Esse parâmetro só é válido para text-to-image solicitações. Padrão 1:1. Enumeração: 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21.
modo — Controla se é uma image-to-image geração text-to-image ou, o que afeta quais parâmetros são necessários. Padrão: text-to-image. Enumeração:image-to-image,text-to-image.
output_format — Especifica o formato da imagem de saída. Formatos suportados:JPEG,PNG. Dimensões suportadas: altura de 640 a 1.536 px, largura de 640 a 1.536 px.
seed — (número) Um valor específico que é usado para orientar a 'aleatoriedade' da geração. (Omita esse parâmetro ou passe 0 para usar uma semente aleatória.) Intervalo: 0 a 4294967295.
negative_prompt — Palavras-chave do que você não deseja ver na imagem de saída. Máximo: 10.000 caracteres.


import boto3
import json
import base64
import io
from PIL import Image

bedrock = boto3.client('bedrock-runtime', region_name='us-west-2')
response = bedrock.invoke_model(
    modelId='stability.sd3-large-v1:0',
    body=json.dumps({
        'prompt': 'A car made out of vegetables.'
    })
)
output_body = json.loads(response["body"].read().decode("utf-8"))
base64_output_image = output_body["images"][0]
image_data = base64.b64decode(base64_output_image)
image = Image.open(io.BytesIO(image_data))
image.save("image.png")

Image to image

O Stability.ai Stable Diffusion 3 O modelo grande tem os seguintes parâmetros de inferência para uma chamada de image-to-image inferência.

text_prompts (obrigatório): uma matriz de prompts de texto a serem usados na geração. Cada elemento é um JSON objeto que contém uma solicitação e um peso para a solicitação.

prompt — (string) O que você deseja ver na imagem de saída. Um aviso forte e descritivo que defina claramente elementos, cores e assuntos resultará em melhores resultados.

Mínimo	Máximo
0	10.000

image — String no formato base64. A imagem a ser usada como ponto de partida para a geração. Formatos suportados: JPEGPNG,, WEBP (WEBPnão suportado no console), Dimensões suportadas: Largura: 640 - 1536 px, Altura: 640 - 1536 px.
força — Numérica. Às vezes chamado de redução de ruído, esse parâmetro controla quanta influência o parâmetro da imagem tem na imagem gerada. Um valor de 0 produziria uma imagem idêntica à entrada. Um valor de 1 seria como se você não tivesse passado nenhuma imagem. Intervalo: [0, 1]
modo — deve ser definido comoimage-to-image.

Campos opcionais

aspect_ratio — (string) Controla a proporção da imagem gerada. Esse parâmetro só é válido para text-to-image solicitações. Padrão 1:1. Enumeração: 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21.
modo — Controla se é uma image-to-image geração text-to-image ou, o que afeta quais parâmetros são necessários. Padrão: text-to-image. Enumeração:image-to-image,text-to-image.
output_format — Especifica o formato da imagem de saída. Formatos suportados:JPEG,PNG. Dimensões suportadas: altura de 640 a 1.536 px, largura de 640 a 1.536 px.
seed — (número) Um valor específico que é usado para orientar a 'aleatoriedade' da geração. (Omita esse parâmetro ou passe 0 para usar uma semente aleatória.) Intervalo: 0 a 4294967295.
negative_prompt — Palavras-chave do que você não deseja ver na imagem de saída. Máximo: 10.000 caracteres.


import boto3
import json
import base64
import io
from PIL import Image

bedrock = boto3.client('bedrock-runtime', region_name='us-west-2')
file_path = 'input_image.png'
image_bytes = open(file_path, "rb").read()
base64_image = base64.b64encode(image_bytes).decode("utf-8")
response = bedrock.invoke_model(
    modelId='stability.sd3-large-v1:0',
    body=json.dumps({
        'prompt': 'A car made out of fruits',
        'image': base64_image,
        'strength': 0.75,
        'mode': 'image-to-image'
    })
)
output_body = json.loads(response["body"].read().decode("utf-8"))
base64_output_image = output_body["images"][0]
image_data = base64.b64decode(base64_output_image)
image = Image.open(io.BytesIO(image_data))
image.save("output_image.png")

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Stability.ai Stable Diffusion 3

Hiperparâmetros de modelo personalizado