Model Amazon Titan Image Generator G1 - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Model Amazon Titan Image Generator G1

Amazon Titan Image Generator G1 adalah model generasi gambar. Muncul dalam dua versi v1 dan v2.

Amazon Titan Image Generator v1 memungkinkan pengguna untuk menghasilkan dan mengedit gambar dengan cara serbaguna. Pengguna dapat membuat gambar yang sesuai dengan deskripsi berbasis teks mereka hanya dengan memasukkan petunjuk bahasa alami. Selain itu, mereka dapat mengunggah dan mengedit gambar yang ada, termasuk menerapkan petunjuk berbasis teks tanpa perlu topeng, atau mengedit bagian tertentu dari gambar menggunakan topeng gambar. Model ini juga mendukung outpainting, yang memperluas batas-batas gambar, dan inpainting, yang mengisi area yang hilang. Ini menawarkan kemampuan untuk menghasilkan variasi gambar berdasarkan prompt teks opsional, serta opsi penyesuaian instan yang memungkinkan pengguna untuk mentransfer gaya menggunakan gambar referensi atau menggabungkan gaya dari beberapa referensi, semua tanpa memerlukan fine-tuning.

Titan Image Generator v2 mendukung semua fitur yang ada dari Titan Image Generator v1 dan menambahkan beberapa kemampuan baru. Hal ini memungkinkan pengguna untuk memanfaatkan gambar referensi untuk memandu pembuatan gambar, di mana gambar output sejajar dengan tata letak dan komposisi gambar referensi sambil tetap mengikuti prompt tekstual. Ini juga mencakup fitur penghapusan latar belakang otomatis, yang dapat menghapus latar belakang dari gambar yang berisi banyak objek tanpa input pengguna. Model ini memberikan kontrol yang tepat atas palet warna gambar yang dihasilkan, memungkinkan pengguna untuk mempertahankan identitas visual merek tanpa persyaratan untuk fine-tuning tambahan. Selain itu, fitur konsistensi subjek memungkinkan pengguna untuk menyempurnakan model dengan gambar referensi untuk mempertahankan subjek yang dipilih (misalnya, hewan peliharaan, sepatu atau tas tangan) dalam gambar yang dihasilkan. Rangkaian fitur komprehensif ini memberdayakan pengguna untuk melepaskan potensi kreatif mereka dan mewujudkan visi imajinatif mereka.

Untuk informasi selengkapnya tentang pedoman teknik cepat model Amazon Titan Image Generator G1, lihat Praktik Terbaik Rekayasa Prompt Amazon Titan Image Generator.

Untuk terus mendukung praktik terbaik dalam penggunaan AI yang bertanggung jawab, Titan Foundation Models (FMs) dibangun untuk mendeteksi dan menghapus konten berbahaya dalam data, menolak konten yang tidak pantas dalam input pengguna, dan memfilter keluaran model yang mengandung konten yang tidak pantas (seperti ujaran kebencian, kata-kata kotor, dan kekerasan). Titan Image Generator FM menambahkan watermark tak terlihat dan metadata C2PA ke semua gambar yang dihasilkan.

Anda dapat menggunakan fitur deteksi tanda air di konsol Amazon Bedrock atau hubungi deteksi tanda air Amazon Bedrock API (pratinjau) untuk memeriksa apakah gambar berisi tanda air dari Titan Image Generator. Anda juga dapat menggunakan situs-situs seperti Content Credentials Verify untuk memeriksa apakah gambar dihasilkan oleh Titan Image Generator.

Ikhtisar Amazon Titan Image Generator v1

  • ID Modelamazon.titan-image-generator-v1

  • Karakter masukan maks - 512 karakter

  • Ukuran gambar input maksimum - 5 MB (hanya beberapa resolusi tertentu yang didukung)

  • Ukuran gambar maks menggunakan in/outpainting - 1,408 x 1,408 px px

  • Ukuran gambar maks menggunakan variasi gambar - 4.096 x 4.096 px

  • Bahasa — Bahasa Inggris

  • Jenis keluaran - gambar

  • Jenis gambar yang didukung -JPEG,JPG, PNG

  • Jenis inferensi — On-Demand, Throughput yang Disediakan

  • Kasus penggunaan yang didukung - pembuatan gambar, pengeditan gambar, variasi gambar

Ikhtisar Amazon Titan Image Generator v2

  • ID Modelamazon.titan-image-generator-v2:0

  • Karakter masukan maks - 512 karakter

  • Ukuran gambar input maksimum - 5 MB (hanya beberapa resolusi tertentu yang didukung)

  • Ukuran gambar maksimal menggunakan in/outpainting, penghapusan latar belakang, pengkondisian gambar, palet warna - 1.408 x 1.408 px

  • Ukuran gambar maks menggunakan variasi gambar - 4.096 x 4.096 px

  • Bahasa — Bahasa Inggris

  • Jenis keluaran - gambar

  • Jenis gambar yang didukung -JPEG,JPG, PNG

  • Jenis inferensi — On-Demand, Throughput yang Disediakan

  • Kasus penggunaan yang didukung - pembuatan gambar, pengeditan gambar, variasi gambar, penghapusan latar belakang, konten yang dipandu warna

Fitur

  • Text-to-image Generasi (T2I) - Masukkan prompt teks dan hasilkan gambar baru sebagai output. Gambar yang dihasilkan menangkap konsep yang dijelaskan oleh prompt teks.

  • Finetuning model T2I - Impor beberapa gambar untuk menangkap gaya dan personalisasi Anda sendiri dan kemudian menyempurnakan model inti T2I. Model yang disetel dengan baik menghasilkan gambar yang mengikuti gaya dan personalisasi pengguna tertentu.

  • Opsi pengeditan gambar - termasuk: inpainting, outpainting, menghasilkan variasi, dan pengeditan otomatis tanpa mask gambar.

  • Inpainting — Menggunakan gambar dan topeng segmentasi sebagai input (baik dari pengguna atau diperkirakan oleh model) dan merekonstruksi wilayah dalam topeng. Gunakan inpainting untuk menghapus elemen bertopeng dan menggantinya dengan piksel latar belakang.

  • Outpainting — Menggunakan gambar dan topeng segmentasi sebagai input (baik dari pengguna atau diperkirakan oleh model) dan menghasilkan piksel baru yang memperluas wilayah dengan mulus. Gunakan pengecatan yang tepat untuk mempertahankan piksel gambar bertopeng saat memperluas gambar ke batas. Gunakan outpainting default untuk memperluas piksel gambar bertopeng ke batas gambar berdasarkan pengaturan segmentasi.

  • Variasi gambar - Menggunakan 1 sampai 5 gambar dan prompt opsional sebagai input. Ini menghasilkan gambar baru yang mempertahankan konten gambar input, tetapi memvariasikan gaya dan latar belakangnya.

  • Pengkondisian gambar - (Hanya V2) Menggunakan gambar referensi input untuk memandu pembuatan gambar. Model menghasilkan gambar keluaran yang selaras dengan tata letak dan komposisi gambar referensi, sambil tetap mengikuti prompt tekstual.

  • Konsistensi subjek - (hanya V2) Konsistensi subjek memungkinkan pengguna untuk menyempurnakan model dengan gambar referensi untuk mempertahankan subjek yang dipilih (misalnya, hewan peliharaan, sepatu, atau tas tangan) dalam gambar yang dihasilkan.

  • Konten yang dipandu warna - (hanya V2) Anda dapat memberikan daftar kode warna hex bersama dengan prompt. Kisaran 1 hingga 10 kode hex dapat disediakan. Gambar yang dikembalikan oleh Titan Image Generator G1 V2 akan menggabungkan palet warna yang disediakan oleh pengguna.

  • Penghapusan latar belakang - (hanya V2) Secara otomatis mengidentifikasi beberapa objek dalam gambar input dan menghapus latar belakang. Gambar output memiliki latar belakang transparan.

  • Asal konten — Gunakan situs seperti Content Credentials Verifikasi untuk memeriksa apakah gambar dihasilkan oleh Titan Image Generator. Ini harus menunjukkan gambar dihasilkan kecuali metadata telah dihapus.

catatan

jika Anda menggunakan model yang disetel dengan baik, Anda tidak dapat menggunakan fitur inpainting, outpainting atau palet warna dari atau model. API

Parameter

Untuk informasi tentang parameter inferensi model Amazon Amazon Titan Image Generator G1, lihat Parameter inferensi model Amazon Titan Image Generator G1.

Penyetelan halus

Untuk informasi selengkapnya tentang menyempurnakan model Amazon Titan Image Generator G1, lihat halaman berikut.

Amazon Titan Image Generator G1 model fine-tuning dan harga

Model menggunakan rumus contoh berikut untuk menghitung harga total per pekerjaan:

Total Harga = Langkah-langkah* Ukuran batch * Harga per gambar yang terlihat

Nilai minimum (auto):

  • Langkah minimum (auto) - 500

  • Ukuran batch minimum - 8

  • Tingkat pembelajaran default - 0,00001

  • Harga per gambar dilihat - 0,005

Pengaturan hyperparameter fine-tuning

Langkah — Berapa kali model diekspos ke setiap batch. Tidak ada set hitungan langkah default. Anda harus memilih angka antara 10 - 40.000, atau nilai String “Otomatis.”

Pengaturan langkah - Otomatis - Amazon Bedrock menentukan nilai yang wajar berdasarkan informasi pelatihan. Pilih opsi ini untuk memprioritaskan kinerja model daripada biaya pelatihan. Jumlah langkah ditentukan secara otomatis. Jumlah ini biasanya antara 1.000 dan 8.000 berdasarkan dataset Anda. Biaya pekerjaan dipengaruhi oleh jumlah langkah yang digunakan untuk mengekspos model ke data. Lihat bagian contoh harga dari detail harga untuk memahami bagaimana biaya pekerjaan dihitung. (Lihat contoh tabel di atas untuk melihat bagaimana jumlah langkah terkait dengan jumlah gambar saat Auto dipilih.)

Pengaturan langkah - Kustom - Anda dapat memasukkan jumlah langkah yang Anda inginkan Bedrock untuk mengekspos model kustom Anda ke data pelatihan. Nilai ini bisa antara 10 dan 40.000. Anda dapat mengurangi biaya per gambar yang dihasilkan oleh model dengan menggunakan nilai hitungan langkah yang lebih rendah.

Ukuran Batch — Jumlah sampel yang diproses sebelum parameter model diperbarui. Nilai ini antara 8 dan 192 dan merupakan kelipatan dari 8.

Tingkat pembelajaran — Tingkat di mana parameter model diperbarui setelah setiap batch data pelatihan. Ini adalah nilai float antara 0 dan 1. Tingkat pembelajaran diatur ke 0,00001 secara default.

Untuk informasi selengkapnya tentang prosedur fine-tuning, lihat Mengirimkan pekerjaan penyesuaian model.

Output

Model Amazon Titan Image Generator G1 menggunakan ukuran dan kualitas gambar output untuk menentukan harga gambar. Amazon Titan Image Generator model G1 memiliki dua segmen harga berdasarkan ukuran: satu untuk 512* 512 gambar dan satu lagi untuk 1024* 1024 gambar. Harga didasarkan pada tinggi ukuran gambar* lebar, kurang dari atau sama dengan 512* 512 atau lebih besar dari 512* 512.

Untuk informasi selengkapnya tentang harga Amazon Bedrock, lihat Harga Amazon Bedrock.

Deteksi tanda air

catatan

Deteksi tanda air untuk konsol Amazon Bedrock dan API tersedia dalam rilis pratinjau publik dan hanya akan mendeteksi tanda air yang dihasilkan dari Titan Image Generator G1. Fitur ini saat ini hanya tersedia di us-west-2 dan us-east-1 wilayah. Deteksi tanda air adalah deteksi yang sangat akurat dari tanda air yang dihasilkan oleh Titan Image Generator G1. Gambar yang dimodifikasi dari gambar asli dapat menghasilkan hasil deteksi yang kurang akurat.

Model ini menambahkan tanda air tak terlihat ke semua gambar yang dihasilkan untuk mengurangi penyebaran informasi yang salah, membantu perlindungan hak cipta, dan melacak penggunaan konten. Deteksi watermark tersedia untuk membantu Anda mengonfirmasi apakah gambar dihasilkan oleh model Titan Image Generator G1, yang memeriksa keberadaan tanda air ini.

catatan

Deteksi API Tanda Air dalam pratinjau dan dapat berubah sewaktu-waktu. Kami menyarankan Anda membuat lingkungan virtual untuk menggunakanSDK. Karena deteksi tanda air APIs tidak tersedia dalam yang terbaruSDKs, kami sarankan Anda menghapus versi terbaru SDK dari lingkungan virtual sebelum menginstal versi dengan deteksi tanda air. APIs

Anda dapat mengunggah gambar Anda untuk mendeteksi jika tanda air dari Titan Image Generator G1 ada pada gambar. Gunakan konsol untuk mendeteksi tanda air dari model ini dengan mengikuti langkah-langkah di bawah ini.

Untuk mendeteksi tanda air dengan Titan Image Generator G1:
  1. Buka konsol Amazon Bedrock di konsol Amazon Bedrock

  2. Pilih Ikhtisar dari panel navigasi di Amazon Bedrock. Pilih tab Build and Test.

  3. Di bagian Safeguards, buka Deteksi tanda air dan pilih Lihat deteksi tanda air.

  4. Pilih Unggah gambar dan cari file yang ada dalam JPG atau PNG format. Ukuran file maksimum yang diizinkan adalah 5 MB.

  5. Setelah diunggah, thumbnail gambar ditampilkan dengan nama, ukuran file, dan tanggal terakhir diubah. Pilih X untuk menghapus atau mengganti gambar dari bagian Unggah.

  6. Pilih Analisis untuk memulai analisis deteksi tanda air.

  7. Gambar dipratinjau di bawah Hasil, dan menunjukkan apakah tanda air terdeteksi dengan Tanda Air terdeteksi di bawah gambar dan spanduk di seluruh gambar. Jika tidak ada tanda air yang terdeteksi, teks di bawah gambar akan mengatakan Tanda air NOT terdeteksi.

  8. Untuk memuat gambar berikutnya, pilih X di thumbnail gambar di bagian Unggah dan pilih gambar baru untuk dianalisis.

Pedoman Rekayasa Prompt

Prompt topeng — Algoritma ini mengklasifikasikan piksel ke dalam konsep. Pengguna dapat memberikan prompt teks yang akan digunakan untuk mengklasifikasikan area gambar yang akan disembunyikan, berdasarkan interpretasi prompt topeng. Opsi prompt dapat menafsirkan prompt yang lebih kompleks, dan menyandikan topeng ke dalam algoritma segmentasi.

Masker gambar - Anda juga dapat menggunakan topeng gambar untuk mengatur nilai topeng. Masker gambar dapat dikombinasikan dengan input cepat untuk topeng untuk meningkatkan akurasi. File mask gambar harus sesuai dengan parameter berikut:

  • Nilai gambar topeng harus 0 (hitam) atau 255 (putih) untuk gambar topeng. Area topeng gambar dengan nilai 0 akan dibuat ulang dengan gambar dari prompt pengguna dan/atau gambar input.

  • maskImageBidang harus berupa string gambar yang dikodekan base64.

  • Gambar topeng harus memiliki dimensi yang sama dengan gambar input (tinggi dan lebar yang sama).

  • Hanya PNG atau JPG file yang dapat digunakan untuk gambar input dan gambar topeng.

  • Gambar topeng hanya boleh menggunakan nilai piksel hitam dan putih.

  • Gambar topeng hanya dapat menggunakan saluran (RGBsaluran alfa tidak didukung).

Untuk informasi selengkapnya tentang rekayasa cepat Amazon Titan Image Generator, lihat Amazon Titan Image Generator G1 model Praktik Terbaik Teknik Prompt.

Untuk pedoman teknik cepat umum, lihat Pedoman Rekayasa Prompt.