Stable Diffusion 3 Große Anfrage und Antwort - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Stable Diffusion 3 Große Anfrage und Antwort

Der Anfragetext wird im body Feld einer Anfrage an InvokeModeloder übergeben InvokeModelWithResponseStream.

Feld für den Hauptteil der Modellaufrufanforderung

Wenn Sie einen InvokeModel Anruf mit einem tätigen Stable Diffusion 3 Großes Modell, füllen Sie das Textfeld mit einem JSON Objekt, das wie das folgende aussieht.

{ 'prompt': 'Create an image of a panda' }

Der Modellaufruf antwortet auf das Textfeld

Wenn Sie einen InvokeModel Anruf mit einem tätigen Stable Diffusion 3 Großes Modell, die Antwort sieht wie folgt aus

{ 'seeds': [2130420379], "finish_reasons": [null], "images": ["..."] }

Eine Antwort mit einem abschließenden Grund, der dies nicht istnull, sieht wie folgt aus:

{ "finish_reasons": ["Filter reason: prompt"] }
  • seeds — (Zeichenfolge) Liste der Ausgangswerte, die zur Generierung von Bildern für das Modell verwendet wurden.

  • finish_reasons — Aufzählung, die angibt, ob die Anfrage gefiltert wurde oder nicht. nullgibt an, dass die Anfrage erfolgreich war. Aktuell mögliche Werte:"Filter reason: prompt", "Filter reason: output image", "Filter reason: input image", "Inference error", null.

  • images — Eine Liste generierter Bilder im Base64-String-Format.

Weitere Informationen finden Sie unter https://platform.stability.ai/docs/api-reference#tag/v1generation.

Text to image

Die Datei Stability.ai Stable Diffusion 3 Das große Modell hat die folgenden Inferenzparameter für einen text-to-image Inferenzaufruf.

  • prompt — (Zeichenfolge) Was Sie im Ausgabebild sehen möchten. Eine aussagekräftige, aussagekräftige Eingabeaufforderung, die Elemente, Farben und Motive klar definiert, führt zu besseren Ergebnissen.

    Minimum Maximum

    0

    10.000

Optionale Felder

  • aspect_ratio — (string) Steuert das Seitenverhältnis des generierten Bildes. Dieser Parameter ist nur für Anfragen gültig. text-to-image Standard 1:1. Enum: 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21.

  • mode — Steuert, ob es sich um eine Oder-Generation handelt, was sich darauf auswirkt, welche Parameter erforderlich sind. text-to-image image-to-image Standard: text-to-image. Aufzählung:image-to-image,text-to-image.

  • output_format — Gibt das Format des Ausgabebilds an. Unterstützte Formate:JPEG,. PNG Unterstützte Abmessungen: Höhe 640 bis 1.536 px, Breite 640 bis 1.536 px.

  • seed — (Zahl) Ein bestimmter Wert, der verwendet wird, um die „Zufälligkeit“ der Generierung zu bestimmen. (Lassen Sie diesen Parameter weg oder übergeben Sie 0, um einen zufälligen Startwert zu verwenden.) Bereich: 0 bis 4294967295.

  • negative_prompt — Schlüsselwörter für das, was Sie im Ausgabebild nicht sehen möchten. Maximal: 10.000 Zeichen.

import boto3 import json import base64 import io from PIL import Image bedrock = boto3.client('bedrock-runtime', region_name='us-west-2') response = bedrock.invoke_model( modelId='stability.sd3-large-v1:0', body=json.dumps({ 'prompt': 'A car made out of vegetables.' }) ) output_body = json.loads(response["body"].read().decode("utf-8")) base64_output_image = output_body["images"][0] image_data = base64.b64decode(base64_output_image) image = Image.open(io.BytesIO(image_data)) image.save("image.png")
Image to image

Die Stability.ai Stable Diffusion 3 Das große Modell hat die folgenden Inferenzparameter für einen image-to-image Inferenzaufruf.

text_prompts (erforderlich): Eine Reihe von Textaufforderungen, die für die Generierung verwendet werden sollen. Jedes Element ist ein JSON Objekt, das eine Eingabeaufforderung und eine Gewichtung für die Eingabeaufforderung enthält.

  • prompt — (Zeichenfolge) Was Sie im Ausgabebild sehen möchten. Eine aussagekräftige, aussagekräftige Eingabeaufforderung, die Elemente, Farben und Motive klar definiert, führt zu besseren Ergebnissen.

    Minimum Maximum

    0

    10.000

  • image — Zeichenfolge im Base64-Format. Das Bild, das als Ausgangspunkt für die Generierung verwendet werden soll. Unterstützte Formate:JPEG,PNG, WEBP (in der Konsole WEBP nicht unterstützt), Unterstützte Abmessungen: Breite: 640-1536 px, Höhe: 640-1536 px.

  • Stärke — Numerisch. Dieser Parameter wird manchmal auch als Rauschunterzeichnung bezeichnet und steuert, wie stark der Bildparameter auf das generierte Bild Einfluss hat. Ein Wert von 0 würde ein Bild ergeben, das mit der Eingabe identisch ist. Ein Wert von 1 wäre so, als ob Sie überhaupt kein Bild übergeben hätten. Bereich: [0, 1]

  • Modus — muss auf eingestellt seinimage-to-image.

Optionale Felder

  • aspect_ratio — (string) Steuert das Seitenverhältnis des generierten Bildes. Dieser Parameter ist nur für Anfragen gültig. text-to-image Standard 1:1. Enum: 16:9, 1:1, 21:9, 2:3, 3:2, 4:5, 5:4, 9:16, 9:21.

  • mode — Steuert, ob es sich um eine Oder-Generation handelt, was sich darauf auswirkt, welche Parameter erforderlich sind. text-to-image image-to-image Standard: text-to-image. Aufzählung:image-to-image,text-to-image.

  • output_format — Gibt das Format des Ausgabebilds an. Unterstützte Formate:JPEG,. PNG Unterstützte Abmessungen: Höhe 640 bis 1.536 px, Breite 640 bis 1.536 px.

  • seed — (Zahl) Ein bestimmter Wert, der verwendet wird, um die „Zufälligkeit“ der Generierung zu bestimmen. (Lassen Sie diesen Parameter weg oder übergeben Sie 0, um einen zufälligen Startwert zu verwenden.) Bereich: 0 bis 4294967295.

  • negative_prompt — Schlüsselwörter für das, was Sie im Ausgabebild nicht sehen möchten. Maximal: 10.000 Zeichen.

import boto3 import json import base64 import io from PIL import Image bedrock = boto3.client('bedrock-runtime', region_name='us-west-2') file_path = 'input_image.png' image_bytes = open(file_path, "rb").read() base64_image = base64.b64encode(image_bytes).decode("utf-8") response = bedrock.invoke_model( modelId='stability.sd3-large-v1:0', body=json.dumps({ 'prompt': 'A car made out of fruits', 'image': base64_image, 'strength': 0.75, 'mode': 'image-to-image' }) ) output_body = json.loads(response["body"].read().decode("utf-8")) base64_output_image = output_body["images"][0] image_data = base64.b64decode(base64_output_image) image = Image.open(io.BytesIO(image_data)) image.save("output_image.png")