Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Solicitud y respuesta de Stable Image Core
El cuerpo de la solicitud se pasa en el body
campo de una solicitud a InvokeModelo InvokeModelWithResponseStream.
Campo del cuerpo de la solicitud de invocación del modelo
Cuando realices una InvokeModel llamada con un modelo Stability AI Stable Diffusion Stable Image Core, rellena el campo del cuerpo con un JSON objeto parecido al siguiente.
{
'prompt': 'Create an image of a panda'
}
La invocación del modelo responde al campo corporal
Cuando realizas una InvokeModel llamada con un modelo Stability AI Stable Diffusion Stable Image Core, la respuesta es similar a la siguiente
{
'seeds': [2130420379],
'finish_reasons': [null],
'images': ['...']
}
seeds — (string) Lista de semillas utilizadas para generar imágenes para el modelo.
-
finish_reasons: enumeración que indica si la solicitud se filtró o no. null
indicará que la solicitud se ha realizado correctamente. Valores posibles actuales:"Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null
.
-
imágenes: una lista de imágenes generadas en formato de cadena base64.
Para obtener más información, consulte https://platform.stability.ai/docs/api-reference#tag/v1generation.
- Text to image
-
El modelo Stable Image Core tiene los siguientes parámetros de inferencia para una llamada de inferencia de texto a imagen.
text_prompts (obligatorio): una matriz de mensajes de texto que se utilizan en la generación. Cada elemento es un JSON objeto que contiene una solicitud y un peso para la solicitud.
Campos opcionales
aspect_ratio — (cadena) Controla la relación de aspecto de la imagen generada. Este parámetro solo es válido para las solicitudes. text-to-image Predeterminado 1:1. Enum: 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21.
-
modo: se establece text-to-image en, lo que afecta a los parámetros necesarios. Predeterminado: text-to-image. Enum: text-to-image
.
-
output_format: especifica el formato de la imagen de salida. Formatos compatibles:,. JPEG PNG Dimensiones compatibles: altura 640 a 1.536 px, anchura 640 a 1.536 px.
-
semilla: (número) Un valor específico que se utiliza para determinar la «aleatoriedad» de la generación. (Omita este parámetro o pase 0 para usar una semilla aleatoria). Rango: de 0 a 4294967295.
-
negative_prompt: palabras clave de lo que no desea ver en la imagen de salida. Máximo: 10.000 caracteres.
import boto3
import json
import base64
import io
from PIL import Image
bedrock = boto3.client('bedrock-runtime', region_name='us-west-2')
response = bedrock.invoke_model(
modelId='stability.stable-image-core-v1:0',
body=json.dumps({
'prompt': 'A car made out of vegetables.'
})
)
output_body = json.loads(response["body"].read().decode("utf-8"))
base64_output_image = output_body["images"][0]
image_data = base64.b64decode(base64_output_image)
image = Image.open(io.BytesIO(image_data))
image.save("image.png")