Stable Diffusion 3 Große Anfrage und Antwort

Der Anfragetext wird im body Feld einer Anfrage an InvokeModeloder übergeben InvokeModelWithResponseStream.

Feld für den Hauptteil der Modellaufrufanforderung

Wenn Sie einen InvokeModel Anruf mit einem tätigen Stable Diffusion 3 Großes Modell, füllen Sie das Textfeld mit einem JSON Objekt, das wie das folgende aussieht.


{
    'prompt': 'Create an image of a panda'
}

Der Modellaufruf antwortet auf das Textfeld

Wenn Sie einen InvokeModel Anruf mit einem tätigen Stable Diffusion 3 Großes Modell, die Antwort sieht wie folgt aus


{
    'seeds': [2130420379], 
    "finish_reasons": [null], 
    "images": ["..."]
}

Eine Antwort mit einem abschließenden Grund, der dies nicht istnull, sieht wie folgt aus:


{
    "finish_reasons": ["Filter reason: prompt"]
}

seeds — (Zeichenfolge) Liste der Ausgangswerte, die zur Generierung von Bildern für das Modell verwendet wurden.
finish_reasons — Aufzählung, die angibt, ob die Anfrage gefiltert wurde oder nicht. nullgibt an, dass die Anfrage erfolgreich war. Aktuell mögliche Werte:"Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null.
images — Eine Liste generierter Bilder im Base64-String-Format.

Weitere Informationen finden Sie unter https://platform.stability.ai/docs/api-reference#tag/v1generation.

Text to image

Die Datei Stability.ai Stable Diffusion 3 Das große Modell hat die folgenden Inferenzparameter für einen text-to-image Inferenzaufruf.

prompt — (Zeichenfolge) Was Sie im Ausgabebild sehen möchten. Eine aussagekräftige, aussagekräftige Eingabeaufforderung, die Elemente, Farben und Motive klar definiert, führt zu besseren Ergebnissen.

Minimum	Maximum
0	10.000

Optionale Felder

aspect_ratio — (string) Steuert das Seitenverhältnis des generierten Bildes. Dieser Parameter ist nur für Anfragen gültig. text-to-image Standard 1:1. Enum: 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21.
mode — Steuert, ob es sich um eine Oder-Generation handelt, was sich darauf auswirkt, welche Parameter erforderlich sind. text-to-image image-to-image Standard: text-to-image. Aufzählung:image-to-image,text-to-image.
output_format — Gibt das Format des Ausgabebilds an. Unterstützte Formate:JPEG,. PNG Unterstützte Abmessungen: Höhe 640 bis 1.536 px, Breite 640 bis 1.536 px.
seed — (Zahl) Ein bestimmter Wert, der verwendet wird, um die „Zufälligkeit“ der Generierung zu bestimmen. (Lassen Sie diesen Parameter weg oder übergeben Sie 0, um einen zufälligen Startwert zu verwenden.) Bereich: 0 bis 4294967295.
negative_prompt — Schlüsselwörter für das, was Sie im Ausgabebild nicht sehen möchten. Maximal: 10.000 Zeichen.


import boto3
import json
import base64
import io
from PIL import Image

bedrock = boto3.client('bedrock-runtime', region_name='us-west-2')
response = bedrock.invoke_model(
    modelId='stability.sd3-large-v1:0',
    body=json.dumps({
        'prompt': 'A car made out of vegetables.'
    })
)
output_body = json.loads(response["body"].read().decode("utf-8"))
base64_output_image = output_body["images"][0]
image_data = base64.b64decode(base64_output_image)
image = Image.open(io.BytesIO(image_data))
image.save("image.png")

Image to image

Die Stability.ai Stable Diffusion 3 Das große Modell hat die folgenden Inferenzparameter für einen image-to-image Inferenzaufruf.

text_prompts (erforderlich): Eine Reihe von Textaufforderungen, die für die Generierung verwendet werden sollen. Jedes Element ist ein JSON Objekt, das eine Eingabeaufforderung und eine Gewichtung für die Eingabeaufforderung enthält.

Minimum	Maximum
0	10.000

image — Zeichenfolge im Base64-Format. Das Bild, das als Ausgangspunkt für die Generierung verwendet werden soll. Unterstützte Formate:JPEG,PNG, WEBP (in der Konsole WEBP nicht unterstützt), Unterstützte Abmessungen: Breite: 640-1536 px, Höhe: 640-1536 px.
Stärke — Numerisch. Dieser Parameter wird manchmal auch als Rauschunterzeichnung bezeichnet und steuert, wie stark der Bildparameter auf das generierte Bild Einfluss hat. Ein Wert von 0 würde ein Bild ergeben, das mit der Eingabe identisch ist. Ein Wert von 1 wäre so, als ob Sie überhaupt kein Bild übergeben hätten. Bereich: [0, 1]
Modus — muss auf eingestellt seinimage-to-image.

Optionale Felder

aspect_ratio — (string) Steuert das Seitenverhältnis des generierten Bildes. Dieser Parameter ist nur für Anfragen gültig. text-to-image Standard 1:1. Enum: 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21.
mode — Steuert, ob es sich um eine Oder-Generation handelt, was sich darauf auswirkt, welche Parameter erforderlich sind. text-to-image image-to-image Standard: text-to-image. Aufzählung:image-to-image,text-to-image.
output_format — Gibt das Format des Ausgabebilds an. Unterstützte Formate:JPEG,. PNG Unterstützte Abmessungen: Höhe 640 bis 1.536 px, Breite 640 bis 1.536 px.
seed — (Zahl) Ein bestimmter Wert, der verwendet wird, um die „Zufälligkeit“ der Generierung zu bestimmen. (Lassen Sie diesen Parameter weg oder übergeben Sie 0, um einen zufälligen Startwert zu verwenden.) Bereich: 0 bis 4294967295.
negative_prompt — Schlüsselwörter für das, was Sie im Ausgabebild nicht sehen möchten. Maximal: 10.000 Zeichen.


import boto3
import json
import base64
import io
from PIL import Image

bedrock = boto3.client('bedrock-runtime', region_name='us-west-2')
file_path = 'input_image.png'
image_bytes = open(file_path, "rb").read()
base64_image = base64.b64encode(image_bytes).decode("utf-8")
response = bedrock.invoke_model(
    modelId='stability.sd3-large-v1:0',
    body=json.dumps({
        'prompt': 'A car made out of fruits',
        'image': base64_image,
        'strength': 0.75,
        'mode': 'image-to-image'
    })
)
output_body = json.loads(response["body"].read().decode("utf-8"))
base64_output_image = output_body["images"][0]
image_data = base64.b64decode(base64_output_image)
image = Image.open(io.BytesIO(image_data))
image.save("output_image.png")

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Stability.ai Stable Diffusion 3

Hyperparameter für benutzerdefinierte Modelle