Modèles Amazon Titan Image Generator G1 - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Modèles Amazon Titan Image Generator G1

Amazon Titan Image Generator G1 est un modèle de génération d'images. Il est disponible en deux versions v1 et v2.

Amazon Titan Image Generator v1 permet aux utilisateurs de générer et de modifier des images de manière polyvalente. Les utilisateurs peuvent créer des images qui correspondent à leurs descriptions textuelles en saisissant simplement des instructions en langage naturel. En outre, ils peuvent télécharger et modifier des images existantes, notamment en appliquant des instructions textuelles sans avoir besoin de masque, ou en modifiant des parties spécifiques d'une image à l'aide d'un masque d'image. Le modèle permet également de surpeindre, qui repousse les limites d'une image, et d'inpainting, qui comble les zones manquantes. Il offre la possibilité de générer des variations d'une image en fonction d'une invite de texte facultative, ainsi que des options de personnalisation instantanée qui permettent aux utilisateurs de transférer des styles à l'aide d'images de référence ou de combiner des styles provenant de plusieurs références, le tout sans nécessiter de réglage précis.

Titan Image Generator v2 prend en charge toutes les fonctionnalités existantes de Titan Image Generator v1 et ajoute plusieurs nouvelles fonctionnalités. Il permet aux utilisateurs de tirer parti des images de référence pour guider la génération d'images, où l'image de sortie s'aligne sur la mise en page et la composition de l'image de référence tout en suivant les instructions textuelles. Il inclut également une fonction de suppression automatique de l'arrière-plan, qui permet de supprimer les arrière-plans des images contenant plusieurs objets sans aucune intervention de l'utilisateur. Le modèle permet de contrôler avec précision la palette de couleurs des images générées, ce qui permet aux utilisateurs de préserver l'identité visuelle d'une marque sans avoir à effectuer de réglages supplémentaires. De plus, la fonction de cohérence du sujet permet aux utilisateurs d'affiner le modèle avec des images de référence afin de préserver le sujet choisi (animal de compagnie, chaussure ou sac à main, par exemple) dans les images générées. Cette suite complète de fonctionnalités permet aux utilisateurs de libérer leur potentiel créatif et de donner vie à leurs visions imaginatives.

Pour plus d'informations sur les directives d'ingénierie rapides des modèles Amazon Titan Image Generator G1, consultez les meilleures pratiques d'ingénierie rapides d'Amazon Titan Image Generator.

Pour continuer à soutenir les meilleures pratiques en matière d'utilisation responsable de l'IA, les modèles de la Titan Foundation (FMs) sont conçus pour détecter et supprimer le contenu préjudiciable des données, rejeter le contenu inapproprié des entrées utilisateur et filtrer les résultats des modèles contenant du contenu inapproprié (tel que les discours de haine, les blasphèmes et la violence). Le Titan Image Generator FM ajoute un filigrane invisible et des métadonnées C2PA à toutes les images générées.

Vous pouvez utiliser la fonction de détection des filigranes de la console Amazon Bedrock ou appeler Amazon Bedrock watermark Detection API (aperçu) pour vérifier si une image contient un filigrane provenant de Titan Image Generator. Vous pouvez également utiliser des sites tels que Content Credentials Verify pour vérifier si une image a été générée par Titan Image Generator.

Présentation d'Amazon Titan Image Generator v1

  • ID du modèle : amazon.titan-image-generator-v1

  • Nombre maximum de caractères d'entrée : 512 caractères

  • Taille maximale de l'image d'entrée : 5 Mo (seules certaines résolutions spécifiques sont prises en charge)

  • Taille maximale de l'image en utilisant la peinture en intérieur/extérieur — 1 408 x 1 408 px px

  • Taille maximale de l’image en utilisant la variation d’image : 4 096 x 4 096 px

  • Langues : anglais

  • Type de sortie : image

  • Types d'images pris en charge — JPEGJPG, PNG

  • Types d’inférence : débit provisionné, à la demande

  • Cas d’utilisation pris en charge : génération d’images, retouche d’images, variations d’images

Présentation d'Amazon Titan Image Generator v2

  • ID du modèle : amazon.titan-image-generator-v2:0

  • Nombre maximum de caractères d'entrée : 512 caractères

  • Taille maximale de l'image d'entrée : 5 Mo (seules certaines résolutions spécifiques sont prises en charge)

  • Taille maximale de l'image en utilisant la peinture en entrée/sortie, la suppression de l'arrière-plan, le conditionnement de l'image, la palette de couleurs — 1 408 x 1 408 px

  • Taille maximale de l’image en utilisant la variation d’image : 4 096 x 4 096 px

  • Langues : anglais

  • Type de sortie : image

  • Types d'images pris en charge — JPEGJPG, PNG

  • Types d’inférence : débit provisionné, à la demande

  • Cas d'utilisation pris en charge : génération d'images, retouche d'image, variations d'image, suppression de l'arrière-plan, contenu guidé par couleur

Fonctionnalités

  • Text-to-image Génération (T2I) — Entrez une invite de texte et générez une nouvelle image en sortie. L’image générée capture les concepts décrits par l’invite de texte.

  • Affinement d’un modèle T2I : importez plusieurs images pour capturer votre propre style et vos personnalisations, puis affinez le modèle T2I de base. Le modèle affiné génère des images qui respectent le style et les personnalisations d’un utilisateur spécifique.

  • Options de retouche d'image : peinture intérieure, peinture extérieure, génération de variations et retouche automatique sans masque d'image.

  • Inpainting : utilise une image et un masque de segmentation comme données d’entrée (provenant de l’utilisateur ou estimées par le modèle) et reconstruit la région dans le masque. Utilisez l’inpainting pour supprimer les éléments masqués et les remplacer par des pixels d’arrière-plan.

  • Outpainting : utilise une image et un masque de segmentation comme données d’entrée (provenant de l’utilisateur ou estimées par le modèle) et génère de nouveaux pixels qui étendent la région en toute transparence. Utilisez un outpainting précis pour préserver les pixels de l’image masquée lorsque vous étendez l’image jusqu’aux limites. Utilisez l’outpainting par défaut pour étendre les pixels de l’image masquée jusqu’aux limites de l’image en fonction des paramètres de segmentation.

  • Variation d'image — Utilise 1 à 5 images et une invite facultative comme entrée. Il génère une nouvelle image qui préserve le contenu des images d'entrée, mais en modifie le style et l'arrière-plan.

  • Conditionnement d'image — (V2 uniquement) Utilise une image de référence en entrée pour guider la génération d'images. Le modèle génère une image de sortie qui s'aligne sur la mise en page et la composition de l'image de référence, tout en suivant les instructions textuelles.

  • Cohérence du sujet — (V2 uniquement) La cohérence du sujet permet aux utilisateurs d'affiner le modèle avec des images de référence afin de préserver le sujet choisi (animal de compagnie, chaussure ou sac à main, par exemple) dans les images générées.

  • Contenu guidé par couleur — (V2 uniquement) Vous pouvez fournir une liste de codes couleur hexadécimaux avec une invite. Une plage de 1 à 10 codes hexadécimaux peut être fournie. L'image renvoyée par Titan Image Generator G1 V2 intégrera la palette de couleurs fournie par l'utilisateur.

  • Suppression de l'arrière-plan — (V2 uniquement) Identifie automatiquement plusieurs objets dans l'image d'entrée et supprime l'arrière-plan. L'image de sortie possède un arrière-plan transparent.

  • Provenance du contenu — Utilisez des sites tels que Content Credentials Verify pour vérifier si une image a été générée par Titan Image Generator. Cela devrait indiquer que l'image a été générée, sauf si les métadonnées ont été supprimées.

Note

si vous utilisez un modèle affiné, vous ne pouvez pas utiliser les fonctionnalités de peinture, de surpeinture ou de palette de couleurs du modèle API ou du modèle.

Paramètres

Pour plus d'informations sur les paramètres d'inférence des modèles Amazon Titan Image Generator G1, consultez la section Paramètres d'inférence des modèles Amazon Titan Image Generator G1.

Affinement

Pour plus d'informations sur le réglage précis des modèles Amazon Titan Image Generator G1, consultez les pages suivantes.

Réglage précis et tarification des modèles Amazon Titan Image Generator G1

Le modèle utilise l'exemple de formule suivant pour calculer le prix total par tâche :

Prix total = étapes * Taille du batch * Prix par image vue

Valeurs minimales (auto) :

  • Nombre minimum d'étapes (auto) : 500

  • Taille de lot minimale : 8

  • Taux d'apprentissage par défaut - 0,00001

  • Prix par image vue - 0,005

Réglage précis des paramètres des hyperparamètres

Étapes : nombre de fois que le modèle est exposé à chaque lot. Aucun nombre de pas n'est défini par défaut. Vous devez sélectionner un nombre compris entre 10 et 40 000 ou une valeur de chaîne « Auto ».

Réglages des étapes - Auto — Amazon Bedrock détermine une valeur raisonnable en fonction des informations d'entraînement. Sélectionnez cette option pour donner la priorité aux performances du modèle par rapport aux coûts de formation. Le nombre d'étapes est déterminé automatiquement. Ce nombre sera généralement compris entre 1 000 et 8 000 selon votre ensemble de données. Les coûts des jobs sont influencés par le nombre d'étapes utilisées pour exposer le modèle aux données. Reportez-vous à la section des exemples de tarification des détails des prix pour comprendre comment le coût du travail est calculé. (Voir le tableau d'exemple ci-dessus pour voir comment le nombre de pas est lié au nombre d'images lorsque Auto est sélectionné.)

Paramètres des étapes - Personnalisé — Vous pouvez saisir le nombre d'étapes que vous souhaitez que Bedrock expose votre modèle personnalisé aux données d'entraînement. Cette valeur peut être comprise entre 10 et 40 000. Vous pouvez réduire le coût par image produite par le modèle en utilisant une valeur de nombre d'étapes inférieure.

Taille du lot : nombre d'échantillons traités avant la mise à jour des paramètres du modèle. Cette valeur est comprise entre 8 et 192 et est un multiple de 8.

Taux d'apprentissage : taux auquel les paramètres du modèle sont mis à jour après chaque lot de données d'entraînement. Il s'agit d'une valeur flottante comprise entre 0 et 1. Le taux d'apprentissage est défini sur 0,00001 par défaut.

Pour plus d'informations sur la procédure de réglage précis, voir Soumettre une tâche de personnalisation du modèle.

Sortie

Les modèles Amazon Titan Image Generator G1 utilisent la taille et la qualité de l'image de sortie pour déterminer le prix d'une image. Les modèles Amazon Titan Image Generator G1 proposent deux segments de prix basés sur la taille : un pour 512 x 512 images et un autre pour 1 024 x 1024 images. Le prix dépend de la taille de l’image (hauteur x largeur), inférieure ou égale à 512 x 512 ou supérieure à 512 x 512.

Pour plus d'informations sur les tarifs d'Amazon Bedrock, consultez les tarifs d'Amazon Bedrock.

Détection de filigranes

Note

La détection des filigranes pour la console Amazon Bedrock API est disponible dans la version préliminaire publique et permet de détecter uniquement les filigranes générés par Titan Image Generator G1. Cette fonctionnalité n'est actuellement disponible que dans les us-east-1 régions us-west-2 et. La détection de filigrane est une détection très précise du filigrane généré par Titan Image Generator G1. Les images modifiées par rapport à l'image d'origine peuvent produire des résultats de détection moins précis.

Ce modèle ajoute un filigrane invisible à toutes les images générées afin de réduire la diffusion de fausses informations, de contribuer à la protection des droits d'auteur et de suivre l'utilisation du contenu. Une détection de filigrane est disponible pour vous aider à confirmer si une image a été générée par le modèle Titan Image Generator G1, qui vérifie l'existence de ce filigrane.

Note

La détection des filigranes API est en cours de prévisualisation et est sujette à modification. Nous vous recommandons de créer un environnement virtuel pour utiliser leSDK. La détection des APIs filigranes n'étant pas disponible dans la dernière versionSDKs, nous vous recommandons de désinstaller la dernière version SDK de l'environnement virtuel avant d'installer la version avec la détection des filigranes. APIs

Vous pouvez télécharger votre image pour détecter si un filigrane provenant de Titan Image Generator G1 est présent sur l'image. Utilisez la console pour détecter un filigrane provenant de ce modèle en suivant les étapes ci-dessous.

Pour détecter un filigrane avec Titan Image Generator G1 :
  1. Ouvrez la console Amazon Bedrock.

  2. Sélectionnez Vue d'ensemble dans le volet de navigation d'Amazon Bedrock. Choisissez l'onglet Construire et tester.

  3. Dans la section Sauvegardes, accédez à Détection des filigranes et choisissez Afficher la détection des filigranes.

  4. Sélectionnez Charger une image et recherchez un fichier en PNG format JPG ou en format. La taille de fichier maximale autorisée est de 5 Mo.

  5. Une fois chargée, une miniature de l'image s'affiche avec le nom, la taille du fichier et la date de dernière modification. Sélectionnez X pour supprimer ou remplacer l'image dans la section Télécharger.

  6. Sélectionnez Analyser pour commencer l'analyse de détection des filigranes.

  7. L'image est prévisualisée sous Résultats et indique si un filigrane est détecté avec un filigrane détecté sous l'image et une bannière sur l'image. Si aucun filigrane n'est détecté, le texte sous l'image indiquera Filigrane NOT détecté.

  8. Pour charger l'image suivante, sélectionnez X dans la miniature de l'image dans la section Télécharger et choisissez une nouvelle image à analyser.

Directives d’ingénierie de requête

Invite de masque : cet algorithme classe les pixels en concepts. L’utilisateur peut fournir une invite de texte qui sera utilisée pour classer les zones de l’image à masquer, en fonction de l’interprétation de l’invite de masque. L’option d’invite permet d’interpréter des invites plus complexes et de coder le masque dans l’algorithme de segmentation.

Masque d’image : vous pouvez également utiliser un masque d’image pour définir les valeurs du masque. Le masque d’image peut être combiné à une saisie d’invite de masque afin d’améliorer la précision. Le fichier de masque d’image doit être conforme aux paramètres suivants :

  • Les valeurs de l’image de masque doivent être 0 (noir) ou 255 (blanc). La zone du masque d’image ayant la valeur 0 sera regénérée avec l’image provenant de l’invite utilisateur et/ou de l’image d’entrée.

  • Le champ maskImage doit être une chaîne d’image codée en base64.

  • L’image de masque doit avoir les mêmes dimensions que l’image d’entrée (même hauteur et même largeur).

  • Seuls JPG les fichiers PNG OR peuvent être utilisés pour l'image d'entrée et l'image du masque.

  • L’image de masque ne doit utiliser que des valeurs de pixels en noir et blanc.

  • L'image du masque ne peut utiliser que les RGB canaux (le canal alpha n'est pas pris en charge).

Pour plus d'informations sur l'ingénierie rapide d'Amazon Titan Image Generator, consultez Amazon Titan Image Generator G1 models Prompt Engineering Best Practices.

Pour les directives générales d’ingénierie de requête, consultez Directives d’ingénierie de requête.