Features Parameter Feinabstimmung Output Erkennung von Wasserzeichen Prompt-Engineering-Richtlinien

Amazon Titan Image Generator G1-Modelle im Überblick

Amazon Titan Image Generator G1 ist ein Modell zur Bilderzeugung. Es ist in zwei Versionen v1 und v2 erhältlich.

Amazon Titan Image Generator v1 ermöglicht es Benutzern, Bilder auf vielfältige Weise zu generieren und zu bearbeiten. Benutzer können Bilder erstellen, die ihren textbasierten Beschreibungen entsprechen, indem sie einfach Eingabeaufforderungen in natürlicher Sprache eingeben. Darüber hinaus können sie vorhandene Bilder hochladen und bearbeiten, z. B. textbasierte Eingabeaufforderungen anwenden, ohne dass eine Maske erforderlich ist, oder bestimmte Teile eines Bildes mithilfe einer Bildmaske bearbeiten. Das Modell unterstützt auch das Übermalen, wodurch die Grenzen eines Bildes erweitert werden, und das Inpainting, das fehlende Bereiche ausfüllt. Es bietet die Möglichkeit, Variationen eines Bilds auf der Grundlage einer optionalen Textaufforderung zu generieren, sowie sofortige Anpassungsoptionen, mit denen Benutzer Stile mithilfe von Referenzbildern übertragen oder Stile aus mehreren Referenzen kombinieren können, ohne dass eine Feinabstimmung erforderlich ist.

Titan Image Generator v2 unterstützt alle vorhandenen Funktionen von Titan Image Generator v1 und fügt mehrere neue Funktionen hinzu. Es ermöglicht Benutzern, Referenzbilder als Leitfaden für die Bilderzeugung zu verwenden, wobei das Ausgabebild dem Layout und der Zusammensetzung des Referenzbilds entspricht und gleichzeitig der Textanfrage folgt. Es enthält auch eine automatische Funktion zum Entfernen des Hintergrunds, mit der Hintergründe von Bildern mit mehreren Objekten ohne Benutzereingabe entfernt werden können. Das Modell bietet eine präzise Kontrolle über die Farbpalette der generierten Bilder, sodass Benutzer die visuelle Identität einer Marke beibehalten können, ohne dass zusätzliche Feinabstimmungen erforderlich sind. Darüber hinaus ermöglicht die Funktion zur Motivkonsistenz den Benutzern die Feinabstimmung des Modells anhand von Referenzbildern, um das gewählte Motiv (z. B. Haustier, Schuh oder Handtasche) in den generierten Bildern beizubehalten. Diese umfassende Suite von Funktionen ermöglicht es Benutzern, ihr kreatives Potenzial zu entfalten und ihre fantasievollen Visionen zum Leben zu erwecken.

Weitere Informationen zu den technischen Richtlinien für Amazon Titan Image Generator G1-Modelle finden Sie unter Amazon Titan Image Generator Prompt Engineering Best Practices.

Um weiterhin bewährte Verfahren für den verantwortungsvollen Umgang mit KI zu unterstützen, sind Titan Foundation Models (FMs) darauf ausgelegt, schädliche Inhalte in den Daten zu erkennen und zu entfernen, unangemessene Inhalte in der Benutzereingabe zurückzuweisen und die Ausgaben der Modelle zu filtern, die unangemessene Inhalte enthalten (wie Hassreden, Obszönitäten und Gewalt). Der Titan Image Generator FM fügt allen generierten Bildern ein unsichtbares Wasserzeichen und C2PA-Metadaten hinzu.

Sie können die Funktion zur Erkennung von Wasserzeichen in der Amazon Bedrock-Konsole verwenden oder die Amazon Bedrock-Wasserzeichenerkennung API (Vorschau) aufrufen, um zu überprüfen, ob ein Bild Wasserzeichen von Titan Image Generator enthält. Sie können auch Websites wie Content Credentials Verify verwenden, um zu überprüfen, ob ein Bild von Titan Image Generator generiert wurde.

Überblick über Amazon Titan Image Generator v1

Model ID: amazon.titan-image-generator-v1
Max. Eingabezeichen — 512 Zeichen
Max. Eingabebildgröße — 5 MB (nur einige spezifische Auflösungen werden unterstützt)
Max. Bildgröße bei In-/Outpainting — 1.408 x 1.408 px
Maximale Bildgröße bei Verwendung der Bildvariation: 4.096 x 4.096 px
Sprachen: Englisch
Ausgabetyp: Bild
Unterstützte Bildtypen —,, JPEG JPG PNG
Inferenztypen: Auf Abruf bereitgestellter Durchsatz
Unterstützte Anwendungsfälle: Bilderzeugung, Bildbearbeitung, Bildvariationen

Überblick über Amazon Titan Image Generator v2

Model ID: amazon.titan-image-generator-v2:0
Max. Eingabezeichen — 512 Zeichen
Max. Eingabebildgröße — 5 MB (nur einige spezifische Auflösungen werden unterstützt)
Maximale Bildgröße bei In-/Outpainting, Entfernung des Hintergrunds, Bildbearbeitung, Farbpalette — 1.408 x 1.408 px
Maximale Bildgröße bei Verwendung der Bildvariation: 4.096 x 4.096 px
Sprachen: Englisch
Ausgabetyp: Bild
Unterstützte Bildtypen —,, JPEG JPG PNG
Inferenztypen: Auf Abruf bereitgestellter Durchsatz
Unterstützte Anwendungsfälle — Bilderzeugung, Bildbearbeitung, Bildvariationen, Entfernung des Hintergrunds, farbgesteuerte Inhalte

Features

Text-to-image (T2I) -Generierung — Geben Sie eine Texteingabeaufforderung ein und generieren Sie ein neues Bild als Ausgabe. Das generierte Bild erfasst die in der Textaufforderung beschriebenen Konzepte.
Feinabstimmung eines T2I-Modells: Importieren Sie mehrere Bilder, um Ihren eigenen persönlichen Stil zu erfassen, und optimieren Sie dann das T2I-Kernmodell. Das fein abgestimmte Modell generiert Bilder, die dem Stil und der Anpassung der Benutzer entsprechen.
Bildbearbeitungsoptionen — umfassen: In-Painting, Outpainting, Generierung von Variationen und automatische Bearbeitung ohne Bildmaske.
Inpainting: Verwendet ein Bild und eine Segmentierungsmaske als Eingabe (entweder vom/von der Benutzer:in oder vom Modell geschätzt) und rekonstruiert den Bereich innerhalb der Maske. Verwenden Sie Inpainting, um maskierte Elemente zu entfernen und sie durch Hintergrundpixel zu ersetzen.
Outpainting: Verwendet ein Bild und eine Segmentierungsmaske als Eingabe (entweder vom/von der Benutzer:in oder vom Modell geschätzt) und generiert neue Pixel, die den Bereich nahtlos erweitern. Erhalten Sie die Pixel des maskierten Bilds mit präzisem Outpainting, wenn das Bild über seine Ränder erweitert wird. Verwenden Sie das Standard-Outpainting, um die Pixel des maskierten Bilds auf der Grundlage der Segmentierungseinstellungen bis zu den Bildrändern zu erweitern.
Bildvariation — Verwendet 1 bis 5 Bilder und eine optionale Eingabeaufforderung als Eingabe. Es generiert ein neues Bild, das den Inhalt der Eingabebilder beibehält, aber dessen Stil und Hintergrund variiert.
Bildkonditionierung — (nur V2) Verwendet ein eingegebenes Referenzbild als Steuerung für die Bilderzeugung. Das Modell generiert ein Ausgabebild, das dem Layout und der Zusammensetzung des Referenzbilds entspricht und trotzdem der Textanfrage folgt.
Konsistenz des Motivs — (nur V2) Mithilfe der Motivkonsistenz können Benutzer das Modell anhand von Referenzbildern verfeinern, um das gewählte Motiv (z. B. Haustier, Schuh oder Handtasche) in den generierten Bildern beizubehalten.
Farborientierter Inhalt — (nur V2) Sie können eine Liste mit Hex-Farbcodes zusammen mit einer Aufforderung bereitstellen. Es kann ein Bereich von 1 bis 10 Hex-Codes bereitgestellt werden. Das Bild wurde zurückgegeben von Titan Image Generator G1 V2 wird die vom Benutzer bereitgestellte Farbpalette enthalten.
Entfernung des Hintergrunds — (nur V2) Identifiziert automatisch mehrere Objekte im Eingabebild und entfernt den Hintergrund. Das Ausgabebild hat einen transparenten Hintergrund.
Herkunft der Inhalte — Verwenden Sie Websites wie Content Credentials Verify, um zu überprüfen, ob ein Bild von Titan Image Generator generiert wurde. Dies sollte darauf hinweisen, dass das Bild generiert wurde, sofern die Metadaten nicht entfernt wurden.

Anmerkung

Wenn Sie ein fein abgestimmtes Modell verwenden, können Sie die Funktionen des Modells oder des Modells nicht in der Farbpalette API oder im Modell verwenden.

Parameter

Informationen zu Inferenzparametern für Amazon Amazon Titan Image Generator G1-Modelle finden Sie unter Inferenzparameter für Amazon Titan Image Generator G1-Modelle.

Feinabstimmung

Weitere Informationen zur Feinabstimmung der Amazon Titan Image Generator G1-Modelle finden Sie auf den folgenden Seiten.

Feinabstimmung und Preisgestaltung der Amazon Titan Image Generator G1-Modelle

Das Modell verwendet die folgende Beispielformel, um den Gesamtpreis pro Auftrag zu berechnen:

Gesamtpreis = Schritte * Batchgröße * Preis pro betrachtetem Bild

Mindestwerte (auto):

Minimale Schritte (auto): 500
Minimale Chargengröße: 8
Die Standard-Lernrate beträgt 0,00001
Preis pro betrachtetem Bild - 0.005

Feinabstimmung der Hyperparameter-Einstellungen

Schritte — Gibt an, wie oft das Modell jeder Charge ausgesetzt ist. Es gibt keine Standardeinstellung für die Schrittanzahl. Sie müssen eine Zahl zwischen 10 und 40.000 oder den Zeichenkettenwert „Auto“ auswählen.

Schritteinstellungen — Automatisch — Amazon Bedrock ermittelt anhand von Trainingsinformationen einen angemessenen Wert. Wählen Sie diese Option, um der Modellleistung Vorrang vor den Schulungskosten einzuräumen. Die Anzahl der Schritte wird automatisch bestimmt. Diese Zahl liegt in der Regel zwischen 1.000 und 8.000, basierend auf Ihrem Datensatz. Die Auftragskosten werden durch die Anzahl der Schritte beeinflusst, die verwendet werden, um das Modell den Daten zugänglich zu machen. Weitere Informationen zur Berechnung der Auftragskosten finden Sie im Abschnitt mit Preisbeispielen in den Preisdetails. (In der obigen Beispieltabelle können Sie sehen, wie die Anzahl der Schritte mit der Anzahl der Bilder zusammenhängt, wenn Automatisch ausgewählt ist.)

Schritteinstellungen — Benutzerdefiniert — Sie können die Anzahl der Schritte eingeben, mit der Bedrock Ihr benutzerdefiniertes Modell den Trainingsdaten zugänglich machen soll. Dieser Wert kann zwischen 10 und 40.000 liegen. Sie können die Kosten pro vom Modell erzeugtem Bild reduzieren, indem Sie einen niedrigeren Wert für die Anzahl der Schritte verwenden.

Chargengröße — Die Anzahl der Proben, die verarbeitet wurden, bevor die Modellparameter aktualisiert werden. Dieser Wert liegt zwischen 8 und 192 und ist ein Vielfaches von 8.

Lernrate — Die Geschwindigkeit, mit der Modellparameter nach jedem Stapel von Trainingsdaten aktualisiert werden. Dies ist ein Gleitkommawert zwischen 0 und 1. Die Lernrate ist standardmäßig auf 0,00001 festgelegt.

Weitere Informationen zum Verfahren zur Feinabstimmung finden Sie unter Einen Modellanpassungsauftrag einreichen.

Output

Amazon Titan Image Generator G1-Modelle verwenden die Größe und Qualität des Ausgabebilds, um den Preis für ein Bild zu bestimmen. Die Modelle von Amazon Titan Image Generator G1 haben je nach Größe zwei Preissegmente: eines für 512*512 Bilder und eines für 1024*1024 Bilder. Die Preisgestaltung basiert auf der Bildgröße (Höhe*Breite), die mindestens 512*512 entspricht oder größer als 512*512 ist.

Weitere Informationen zu den Preisen von Amazon Bedrock finden Sie unter Amazon Bedrock Pricing.

Erkennung von Wasserzeichen

Anmerkung

Die Wasserzeichenerkennung für die Amazon Bedrock-Konsole API ist in der öffentlichen Vorschauversion verfügbar und erkennt nur Wasserzeichen, die mit Titan Image Generator G1 generiert wurden. Diese Funktion ist derzeit nur in den Regionen und verfügbar. us-west-2 us-east-1 Die Wasserzeichenerkennung ist eine hochgenaue Erkennung des vom Titan Image Generator G1 generierten Wasserzeichens. Bilder, die gegenüber dem Originalbild verändert wurden, führen möglicherweise zu weniger genauen Erkennungsergebnissen.

Dieses Modell fügt allen generierten Bildern ein unsichtbares Wasserzeichen hinzu, um die Verbreitung von Fehlinformationen zu reduzieren, den Urheberrechtsschutz zu verbessern und die Nutzung von Inhalten nachzuverfolgen. Mithilfe einer Wasserzeichenerkennung können Sie überprüfen, ob ein Bild mit dem Titan Image Generator G1-Modell generiert wurde. Dieses Modell prüft, ob dieses Wasserzeichen vorhanden ist.

Anmerkung

Die Wasserzeichenerkennung API befindet sich in der Vorschauversion und kann sich ändern. Wir empfehlen Ihnen, eine virtuelle Umgebung für die Verwendung von zu erstellen. SDK Da die Wasserzeichenerkennung in der aktuellen Version APIs nicht verfügbar istSDKs, empfehlen wir, die neueste Version von SDK aus der virtuellen Umgebung zu deinstallieren, bevor Sie die Version mit der Wasserzeichenerkennung installieren. APIs

Sie können Ihr Bild hochladen, um festzustellen, ob ein Wasserzeichen von Titan Image Generator G1 auf dem Bild vorhanden ist. Verwenden Sie die Konsole, um ein Wasserzeichen von diesem Modell zu erkennen, indem Sie die folgenden Schritte ausführen.

So erkennen Sie ein Wasserzeichen mit Titan Image Generator G1:

Öffnen Sie die Amazon-Bedrock-Konsole unter Amazon-Bedrock-Konsole.
Wählen Sie im Navigationsbereich von Amazon Bedrock die Option Übersicht aus. Wählen Sie die Registerkarte Build and Test.
Gehen Sie im Abschnitt Sicherheitsvorkehrungen zu Wasserzeichenerkennung und wählen Sie Wasserzeichenerkennung anzeigen aus.
Wählen Sie Bild hochladen und suchen Sie nach einer Datei im JPG Format Or. PNG Die maximal zulässige Dateigröße beträgt 5 MB.
Nach dem Hochladen wird eine Miniaturansicht des Bilds mit dem Namen, der Dateigröße und dem Datum der letzten Änderung angezeigt. Wählen Sie X, um das Bild aus dem Upload-Bereich zu löschen oder zu ersetzen.
Wählen Sie Analysieren aus, um mit der Analyse der Wasserzeichenerkennung zu beginnen.
Das Bild wird unter Ergebnisse in der Vorschau angezeigt und gibt an, ob ein Wasserzeichen erkannt wurde, wobei das Wasserzeichen unter dem Bild und ein Banner über dem Bild erkannt wurde. Wenn kein Wasserzeichen erkannt wurde, wird im Text unter dem Bild die Meldung Wasserzeichen erkannt angezeigt. NOT
Um das nächste Bild zu laden, wählen Sie X in der Miniaturansicht des Bilds im Upload-Bereich und wählen Sie ein neues Bild zur Analyse aus.

Prompt-Engineering-Richtlinien

Maskenaufforderung: Dieser Algorithmus unterteilt Pixel in Konzepte. Benutzer können eine Texteingabeaufforderung eingeben, die basierend auf der Interpretation der Maskenaufforderung die Bereiche des Bildes, die maskiert werden sollen, klassifiziert. Mit der Eingabeaufforderungsoption können komplexere Eingabeaufforderungen interpretiert und die Maske im Segmentierungsalgorithmus kodiert werden.

Bildmaske: Sie können auch eine Bildmaske verwenden, um die Maskenwerte festzulegen. Die Bildmaske kann zur Verbesserung der Genauigkeit mit der Eingabeaufforderung für die Maske kombiniert werden. Die Bildmaskendatei muss den folgenden Parametern entsprechen:

Die Maskenbildwerte müssen für das Maskenbild 0 (schwarz) oder 255 (weiß) sein. Der Bildmaskenbereich mit dem Wert 0 wird mit dem Bild aus der Benutzeraufforderung und/oder dem Eingabebild regeneriert.
Das Feld maskImage muss eine base64-kodierte Bildzeichenfolge sein.
Das Maskenbild muss dieselben Abmessungen wie das Eingabebild haben (gleiche Höhe und Breite).
Für das Eingabebild und das Maskenbild können nur PNG JPG Oder-Dateien verwendet werden.
Das Maskenbild darf nur schwarze und weiße Pixelwerte verwenden.
Das Maskenbild kann nur die RGB Kanäle verwenden (Alphakanal wird nicht unterstützt).

Weitere Informationen zur Prompt-Entwicklung von Amazon Titan Image Generator finden Sie unter Amazon Titan Image Generator G1-Modelle Prompt Engineering Best Practices.

Allgemeine Prompt-Engineering-Richtlinien finden Sie unter Prompt-Engineering-Richtlinien.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Amazon Titan Multimodal Embeddings G1

Amazon Bedrock Studio verwalten