Sélectionner vos préférences de cookies

Nous utilisons des cookies essentiels et des outils similaires qui sont nécessaires au fonctionnement de notre site et à la fourniture de nos services. Nous utilisons des cookies de performance pour collecter des statistiques anonymes afin de comprendre comment les clients utilisent notre site et d’apporter des améliorations. Les cookies essentiels ne peuvent pas être désactivés, mais vous pouvez cliquer sur « Personnaliser » ou « Refuser » pour refuser les cookies de performance.

Si vous êtes d’accord, AWS et les tiers approuvés utiliseront également des cookies pour fournir des fonctionnalités utiles au site, mémoriser vos préférences et afficher du contenu pertinent, y compris des publicités pertinentes. Pour accepter ou refuser tous les cookies non essentiels, cliquez sur « Accepter » ou « Refuser ». Pour effectuer des choix plus détaillés, cliquez sur « Personnaliser ».

Stability.ai Diffusion 1.0 image vers image (masquage)

Mode de mise au point
Stability.ai Diffusion 1.0 image vers image (masquage) - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Le modèle Stability.ai Diffusion 1.0 comporte les paramètres d’inférence et la réponse du modèle suivants pour l’utilisation de masques avec les appels d’inférence image vers image.

Demande et réponse

Le corps de la demande est transmis dans le body champ d'une demande à InvokeModelou InvokeModelWithResponseStream.

Pour plus d'informations, consultez https://platform.stability. ai/docs/api-reference#tag/v1generation/operation/masking.

Request

Le modèle Stability.ai Diffusion 1.0 comporte les paramètres d’inférence suivants pour un appel d’inférence image vers image (masquage).

{ "text_prompts": [ { "text": string, "weight": float } ], "init_image" : string , "mask_source" : string, "mask_image" : string, "cfg_scale": float, "clip_guidance_preset": string, "sampler": string, "samples" : int, "seed": int, "steps": int, "style_preset": string, "extras" : json object }

Les paramètres suivants sont obligatoires.

  • text_prompt (obligatoire) : tableau d’invites de texte à utiliser pour la génération. Chaque élément est un objet JSON qui contient une invite et une pondération pour l’invite.

    • text : invite que vous souhaitez transmettre au modèle.

      Minimum Maximum

      0

      2000

    • weight (facultatif) : pondération que le modèle doit appliquer à l’invite. Une valeur inférieure à zéro indique une invite négative. Utilisez une invite négative pour indiquer au modèle d’éviter certains concepts. La valeur par défaut de weight est un.

  • init_image (obligatoire) : image codée en base64 que vous souhaitez utiliser pour initialiser le processus de diffusion.

  • mask_source (obligatoire) : détermine d’où provient le masque. Les valeurs possibles sont :

    • MASK_IMAGE_WHITE : utilisez les pixels blancs de l’image de masque indiquée dans mask_image comme masque. Les pixels blancs sont remplacés et les pixels noirs restent inchangés.

    • MASK_IMAGE_BLACK : utilisez les pixels noirs de l’image de masque indiquée dans mask_image comme masque. Les pixels noirs sont remplacés et les pixels blancs restent inchangés.

    • INIT_IMAGE_ALPHA : utilisez le canal alpha de l’image indiquée dans init_image comme masque. Les pixels entièrement transparents sont remplacés et les pixels totalement opaques restent inchangés.

  • mask_image (obligatoire) : image de masque codée en base64 que vous souhaitez utiliser comme masque pour l’image source dans init_image. Ses dimensions doivent être identiques à celles de l’image source. Utilisez l’option mask_source pour spécifier les pixels à remplacer.

Les paramètres suivants sont facultatifs.

  • cfg_scale (facultatif) : détermine dans quelle mesure l’image finale représente l’invite. Utilisez un nombre inférieur pour augmenter le caractère aléatoire de la génération.

    Par défaut Minimum Maximum

    7

    0

    35

  • clip_guidance_preset (facultatif) : énumération : FAST_BLUE, FAST_GREEN, NONE, SIMPLE, SLOW, SLOWER, SLOWEST.

  • sampler (facultatif) : échantillonneur à utiliser pour le processus de diffusion. Si cette valeur est omise, le modèle sélectionne automatiquement un échantillonneur approprié.

    Énumération : DDIM, DDPM, K_DPMPP_2M, K_DPMPP_2S_ANCESTRAL, K_DPM_2, K_DPM_2_ANCESTRAL, K_EULER, K_EULER_ANCESTRAL, K_HEUN K_LMS.

  • samples (facultatif) : nombre d’images à générer. Amazon Bedrock prend actuellement en charge la génération d’une seule image. Si vous fournissez une valeur pour samples, elle doit être égale à un.

    Par défaut Minimum Maximum

    1

    1

    1

  • seed (facultatif) : l’amorçage détermine le réglage initial du bruit. Utilisez le même amorçage et les mêmes paramètres que lors de l'exécution précédente pour permettre à l'inférence de créer une image similaire. Si vous ne définissez pas cette valeur, ou si elle est égale à 0, un nombre aléatoire est choisi.

    Par défaut Minimum Maximum

    0

    0

    4294967295

  • steps (facultatif) : l’étape de génération détermine le nombre de fois où l’image est échantillonnée. Un plus grand nombre d'étapes contribue à obtenir un résultat plus précis.

    Par défaut Minimum Maximum

    30

    10

    50

  • style_preset (facultatif) : préréglage de style qui guide le modèle d’image vers un style particulier. Cette liste de préréglages de style est susceptible d’être modifiée.

    Énumération : 3d-model, analog-film, animé, cinematic, comic-book, digital-art, enhance, fantasy-art, isometric, line-art, low-poly, modeling-compound, neon-punk, origami, photographic, pixel-art, tile-texture

  • extras (facultatif) : paramètres supplémentaires transmis au moteur. À utiliser avec précaution. Ces paramètres sont utilisés pour des fonctionnalités en cours de développement ou expérimentales et peuvent être modifiés sans avertissement.

Response

Le modèle Stability.ai Diffusion 1.0 renvoie les champs suivants pour un appel d’inférence texte vers image.

{ "result": string, "artifacts": [ { "seed": int, "base64": string, "finishReason": string } ] }
  • result : résultat de l’opération. En cas de succès, la réponse est success.

  • artifacts : tableau d’images, une pour chaque image demandée.

    • seed : valeur de l’amorçage utilisé pour générer l’image.

    • base64 : image codée en base64 générée par le modèle.

    • finishedReason : résultat du processus de génération d’image. Les valeurs valides sont :

      • SUCCESS : le processus de génération d’images a abouti.

      • ERREUR — Une erreur s'est produite.

      • CONTENT_FILTERED : le filtre de contenu a filtré l’image et celle-ci est peut-être floue.

Le modèle Stability.ai Diffusion 1.0 comporte les paramètres d’inférence suivants pour un appel d’inférence image vers image (masquage).

{ "text_prompts": [ { "text": string, "weight": float } ], "init_image" : string , "mask_source" : string, "mask_image" : string, "cfg_scale": float, "clip_guidance_preset": string, "sampler": string, "samples" : int, "seed": int, "steps": int, "style_preset": string, "extras" : json object }

Les paramètres suivants sont obligatoires.

  • text_prompt (obligatoire) : tableau d’invites de texte à utiliser pour la génération. Chaque élément est un objet JSON qui contient une invite et une pondération pour l’invite.

    • text : invite que vous souhaitez transmettre au modèle.

      Minimum Maximum

      0

      2000

    • weight (facultatif) : pondération que le modèle doit appliquer à l’invite. Une valeur inférieure à zéro indique une invite négative. Utilisez une invite négative pour indiquer au modèle d’éviter certains concepts. La valeur par défaut de weight est un.

  • init_image (obligatoire) : image codée en base64 que vous souhaitez utiliser pour initialiser le processus de diffusion.

  • mask_source (obligatoire) : détermine d’où provient le masque. Les valeurs possibles sont :

    • MASK_IMAGE_WHITE : utilisez les pixels blancs de l’image de masque indiquée dans mask_image comme masque. Les pixels blancs sont remplacés et les pixels noirs restent inchangés.

    • MASK_IMAGE_BLACK : utilisez les pixels noirs de l’image de masque indiquée dans mask_image comme masque. Les pixels noirs sont remplacés et les pixels blancs restent inchangés.

    • INIT_IMAGE_ALPHA : utilisez le canal alpha de l’image indiquée dans init_image comme masque. Les pixels entièrement transparents sont remplacés et les pixels totalement opaques restent inchangés.

  • mask_image (obligatoire) : image de masque codée en base64 que vous souhaitez utiliser comme masque pour l’image source dans init_image. Ses dimensions doivent être identiques à celles de l’image source. Utilisez l’option mask_source pour spécifier les pixels à remplacer.

Les paramètres suivants sont facultatifs.

  • cfg_scale (facultatif) : détermine dans quelle mesure l’image finale représente l’invite. Utilisez un nombre inférieur pour augmenter le caractère aléatoire de la génération.

    Par défaut Minimum Maximum

    7

    0

    35

  • clip_guidance_preset (facultatif) : énumération : FAST_BLUE, FAST_GREEN, NONE, SIMPLE, SLOW, SLOWER, SLOWEST.

  • sampler (facultatif) : échantillonneur à utiliser pour le processus de diffusion. Si cette valeur est omise, le modèle sélectionne automatiquement un échantillonneur approprié.

    Énumération : DDIM, DDPM, K_DPMPP_2M, K_DPMPP_2S_ANCESTRAL, K_DPM_2, K_DPM_2_ANCESTRAL, K_EULER, K_EULER_ANCESTRAL, K_HEUN K_LMS.

  • samples (facultatif) : nombre d’images à générer. Amazon Bedrock prend actuellement en charge la génération d’une seule image. Si vous fournissez une valeur pour samples, elle doit être égale à un.

    Par défaut Minimum Maximum

    1

    1

    1

  • seed (facultatif) : l’amorçage détermine le réglage initial du bruit. Utilisez le même amorçage et les mêmes paramètres que lors de l'exécution précédente pour permettre à l'inférence de créer une image similaire. Si vous ne définissez pas cette valeur, ou si elle est égale à 0, un nombre aléatoire est choisi.

    Par défaut Minimum Maximum

    0

    0

    4294967295

  • steps (facultatif) : l’étape de génération détermine le nombre de fois où l’image est échantillonnée. Un plus grand nombre d'étapes contribue à obtenir un résultat plus précis.

    Par défaut Minimum Maximum

    30

    10

    50

  • style_preset (facultatif) : préréglage de style qui guide le modèle d’image vers un style particulier. Cette liste de préréglages de style est susceptible d’être modifiée.

    Énumération : 3d-model, analog-film, animé, cinematic, comic-book, digital-art, enhance, fantasy-art, isometric, line-art, low-poly, modeling-compound, neon-punk, origami, photographic, pixel-art, tile-texture

  • extras (facultatif) : paramètres supplémentaires transmis au moteur. À utiliser avec précaution. Ces paramètres sont utilisés pour des fonctionnalités en cours de développement ou expérimentales et peuvent être modifiés sans avertissement.

ConfidentialitéConditions d'utilisation du sitePréférences de cookies
© 2025, Amazon Web Services, Inc. ou ses affiliés. Tous droits réservés.