Stability.ai Difusi 1.0 gambar ke gambar (masking)

Model Stability.ai Diffusion 1.0 memiliki parameter inferensi dan respons model berikut untuk menggunakan topeng dengan panggilan inferensi gambar ke gambar.

Permintaan dan Tanggapan

Badan permintaan diteruskan di body bidang permintaan ke InvokeModelatau InvokeModelWithResponseStream.

Untuk informasi lebih lanjut, lihat https://platform.stability.ai/docs/api-reference#tag/v1generation/operation/masking.

Request

Model Stability.ai Diffusion 1.0 memiliki parameter inferensi berikut untuk panggilan inferensi image to image (masking).


{
        "text_prompts": [
            {
                "text": string,
                "weight": float
            }
        ],
        "init_image" : string ,
        "mask_source" : string,
        "mask_image" : string,
        "cfg_scale": float,
        "clip_guidance_preset": string,
        "sampler": string,
        "samples" : int,
        "seed": int,
        "steps": int,
        "style_preset": string,
        "extras" : json object
}

Berikut ini adalah parameter yang diperlukan.

text_prompt — (Wajib) Sebuah array teks meminta untuk digunakan untuk generasi. Setiap elemen adalah JSON objek yang berisi prompt dan bobot untuk prompt.

text — Prompt yang ingin Anda teruskan ke model.

Minimum	Maksimum
0	2000

berat - (Opsional) Bobot yang harus diterapkan model pada prompt. Nilai yang kurang dari nol menyatakan prompt negatif. Gunakan prompt negatif untuk memberi tahu model untuk menghindari konsep tertentu. Nilai default untuk weight adalah satu.

init_image - (Wajib) Gambar berenkode base64 yang ingin Anda gunakan untuk menginisialisasi proses difusi.
mask_source — (Wajib) Menentukan dari mana sumber topeng. Kemungkinan nilainya adalah:
- MASK_ IMAGE _ WHITE — Gunakan piksel putih dari gambar topeng mask_image sebagai topeng. Piksel putih diganti dan piksel hitam dibiarkan tidak berubah.
- MASK_ IMAGE _ BLACK — Gunakan piksel hitam dari gambar topeng mask_image sebagai topeng. Piksel hitam diganti dan piksel putih dibiarkan tidak berubah.
- INIT_ IMAGE _ ALPHA — Gunakan saluran alfa gambar init_image sebagai topeng, Piksel transparan sepenuhnya diganti dan piksel buram sepenuhnya dibiarkan tidak berubah.
mask_image - (Diperlukan) Gambar topeng berenkode base64 yang ingin Anda gunakan sebagai topeng untuk gambar sumber. init_image Harus memiliki dimensi yang sama dengan gambar sumber. Gunakan mask_source opsi untuk menentukan piksel mana yang harus diganti.

Berikut ini adalah parameter opsional.

cfg_scale — (Opsional) Menentukan seberapa banyak gambar akhir menggambarkan prompt. Gunakan angka yang lebih rendah untuk meningkatkan keacakan dalam generasi.

Default	Minimum	Maksimum
7	0	35

clip_guidance_preset — (Opsional) Enum:. FAST_BLUE, FAST_GREEN, NONE, SIMPLE, SLOW, SLOWER, SLOWEST
sampler — (Opsional) Sampler yang digunakan untuk proses difusi. Jika nilai ini dihilangkan, model secara otomatis memilih sampler yang sesuai untuk Anda.

Enum:DDIM, DDPM, K_DPMPP_2M, K_DPMPP_2S_ANCESTRAL, K_DPM_2, K_DPM_2_ANCESTRAL, K_EULER, K_EULER_ANCESTRAL, K_HEUN K_LMS.

sampel - (Opsional) Jumlah gambar yang akan dihasilkan. Saat ini Amazon Bedrock mendukung pembuatan satu gambar. Jika Anda memberikan nilai untuksamples, nilainya harus satu. menghasilkan

Default	Minimum	Maksimum
1	1	1

benih — (Opsional) Benih menentukan pengaturan kebisingan awal. Gunakan seed yang sama dan pengaturan yang sama seperti proses sebelumnya untuk memungkinkan inferensi membuat gambar serupa. Jika Anda tidak menetapkan nilai ini, atau nilainya 0, itu ditetapkan sebagai angka acak.

Default	Minimum	Maksimum
0	0	4294967295

langkah - (Opsional) Langkah pembuatan menentukan berapa kali gambar diambil sampelnya. Lebih banyak langkah dapat menghasilkan hasil yang lebih akurat.

Default	Minimum	Maksimum
30	10	50

style_preset — (Opsional) Preset gaya yang memandu model gambar menuju gaya tertentu. Daftar preset gaya ini dapat berubah.

Enum: 3d-model, analog-film, animé, cinematic, comic-book, digital-art, enhance, fantasy-art, isometric, line-art, low-poly, modeling-compound, neon-punk, origami, photographic, pixel-art, tile-texture
ekstra — (Opsional) Parameter ekstra diteruskan ke mesin. Berhati-hatilah saat menggunakannya. Parameter ini digunakan untuk fitur dalam pengembangan atau eksperimental dan dapat berubah tanpa peringatan.

Response

Model Stability.ai Diffusion 1.0 mengembalikan bidang berikut untuk panggilan inferensi teks ke gambar.


{
    "result": string,
    "artifacts": [
        {
            "seed": int,
            "base64": string,
            "finishReason": string
        }
    ]
}

Hasil - Hasil dari operasi. Jika berhasil, jawabannya adalahsuccess.
artefak — Sebuah array gambar, satu untuk setiap gambar yang diminta.
- seed — Nilai benih yang digunakan untuk menghasilkan gambar.
- base64 - Gambar yang dikodekan base64 yang dihasilkan model.
- finishedReason— Hasil dari proses pembuatan gambar. Nilai yang valid adalah:
  - SUCCESS— Proses pembuatan gambar berhasil.
  - ERROR— Terjadi kesalahan.
  - CONTENT_ FILTERED — Filter konten memfilter gambar dan gambar mungkin kabur.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Permintaan dan respons Stabil Image Ultra

Stability.ai Stable Diffusion 3