Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Gunakan SageMaker Aset untuk berkolaborasi secara mulus dalam proyek pembelajaran mesin dengan individu lain di organisasi Anda. Dengan SageMaker Aset, Anda dan kolaborator membuat dan berbagi model dan tabel data satu sama lain. Dalam SageMaker Aset, model dan tabel data ini dikenal sebagai aset.
SageMaker Aset adalah fitur dalam Amazon SageMaker Studio. Anda atau administrator membuat lingkungan Studio dalam DataZone proyek Amazon. Untuk informasi selengkapnya tentang pengaturan Amazon DataZone, lihatMengatur SageMaker Aset (panduan administrator).
Aset adalah aset ML atau aset data. Aset ML adalah metadata yang menunjuk ke hal-hal berikut:
-
Grup fitur Toko Fitur
-
SageMaker Grup model AI
Grup model dan grup fitur yang mendasari adalah sumber data. Jika Anda memperbarui grup fitur atau grup model, aset untuk grup model atau grup fitur akan diperbarui dalam sehari.
Aset data adalah metadata yang menunjuk ke hal-hal berikut:
-
Tabel Amazon Redshift
-
AWS Glue tabel
Untuk aset data, sumber data adalah mekanisme yang menarik metadata dari tabel dan AWS Glue tabel Amazon Redshift ke dalam aset. Misalnya, sumber data menarik metadata dari AWS Glue tabel ke aset untuk tabel tersebut.
Anda dapat membuat aset terlihat oleh semua orang di organisasi Anda dengan menerbitkannya. Individu dapat meninjau metadata dalam aset dan meminta akses. Jika Anda menyediakan akses, mereka mendapatkan akses ke sumber data atau tabel pembelajaran mesin yang mendasarinya.
Administrator Anda kemungkinan telah memberi Anda akses ke grup fitur, grup model, dan tabel. Jika belum, lihat informasinya Mengatur SageMaker Aset (panduan administrator) untuk membantu Anda memulai.
Bagian berikut memberikan informasi referensi untuk grup fitur dan grup model.
Amazon SageMaker Feature Store menyediakan lokasi terpusat untuk membantu Anda menyimpan dan mengelola fitur Anda. Ini adalah repositori berkinerja tinggi yang dapat Anda gunakan untuk rekayasa fitur.
Dalam Feature Store, fitur disimpan dalam grup fitur. Grup fitur adalah kumpulan fitur yang terkait dengan proyek yang sedang Anda kerjakan. Misalnya, jika Anda sedang mengerjakan proyek yang terkait dengan prediksi harga rumah, grup fitur mungkin menyertakan fitur seperti lokasi atau jumlah kamar tidur.
Untuk informasi selengkapnya tentang bagaimana Anda dapat menggunakan grup fitur untuk merampingkan proses rekayasa fitur, lihatBuat, simpan, dan bagikan fitur dengan Feature Store.
Anda dapat menggunakan grup model SageMaker AI dalam SageMaker Model Registry untuk mengatur dan mengelola berbagai versi model Anda. Anda dapat membandingkan berbagai versi model untuk melihat mana yang berkinerja terbaik untuk kasus penggunaan Anda. Untuk informasi selengkapnya tentang SageMaker Model Registry, lihatPenerapan Registrasi Model dengan Model Registry.
Berikut ini adalah informasi latar belakang tentang Amazon Redshift dan. AWS Glue
Amazon Redshift adalah layanan pergudangan data skala besar yang menyediakan kinerja kueri cepat pada kumpulan data besar. Untuk informasi selengkapnya tentang Amazon Redshift, lihat Amazon Redshift Tanpa Server.
AWS Glue adalah layanan ekstrak, transformasi, beban (ETL) yang dapat Anda gunakan untuk menyederhanakan proses persiapan data. Untuk informasi lebih lanjut tentang AWS Glue, lihat Apa itu AWS Glue?
Anda dapat menggunakan editor SQL untuk menghubungkan AWS Glue dan database Amazon Redshift dan menjalankan kueri. Anda dapat membagikan tabel apa pun yang Anda buat di editor dalam SageMaker Aset. Untuk informasi selengkapnya, lihat Persiapan data dengan SQL di Studio.
Topik
Terminologi dan Konsep
Sebelum Anda mulai menggunakan SageMaker Aset, ada baiknya Anda membiasakan diri dengan terminologi dan konsep berikut:
-
Aset — Metadata yang menunjuk ke model atau tabel data yang Anda bagikan. Anda meminta akses ke aset yang dimiliki orang lain atau berbagi aset Anda dengan orang lain. Anda dan rekan tim Anda mengakses aset dan tabel data dasar atau model yang terkait dengannya.
-
Aset berlangganan — Untuk meminta akses ke aset, Anda mengirimkan permintaan berlangganan. Jika permintaan Anda disetujui, aset akan muncul di bawah aset berlangganan Anda.
-
Aset yang dimiliki — Aset yang telah Anda bagikan dengan rekan tim Anda.
-
Katalog aset — Aset yang telah Anda bagikan di seluruh organisasi.
Langkah 1: Akses SageMaker Aset
Akses SageMaker Aset untuk melihat aset Anda dan membaginya dengan orang lain. Gunakan informasi berikut untuk membantu Anda mulai menggunakannya.
Anda mengakses SageMaker Aset dari proyek dalam DataZone domain Amazon. Proyek adalah kolaborasi antara Anda dan anggota tim Anda. Dalam proyek, Anda dan anggota lain dari proyek Anda memiliki akses ke aset yang Anda dan anggota tim Anda buat dalam katalog inventaris. Anda dapat mempublikasikan aset ke katalog yang diterbitkan untuk membuatnya terlihat oleh orang lain di organisasi Anda.
Orang-orang tersebut dapat meminta akses ke aset Anda. Jika Anda memberi mereka akses, mereka bisa mendapatkan akses ke sumber data yang diperbarui. Misalnya, jika seseorang berlangganan AWS Glue tabel yang Anda perbarui, mereka dapat mengakses AWS Glue tabel yang diperbarui secara real time.
Gunakan prosedur berikut untuk mengakses SageMaker Aset.
Untuk mengakses SageMaker Aset
-
Buka DataZone konsol Amazon
. -
Pilih Lihat domain.
-
Di samping domain yang berisi proyek Anda, pilih Buka portal data.
-
Di bawah Analytics Tools, pilih SageMaker AI Studio.
-
Pilih Buka Amazon SageMaker AI.
-
Pilih Aset.
Aset yang telah dibagikan dengan Anda berada di bawah aset Berlangganan. Aset yang Anda dan anggota proyek Anda buat berada di bawah aset yang Dimiliki. Aset yang Anda dan anggota lain dari organisasi Anda telah diterbitkan ada di katalog Aset.
Langkah 2: Bagikan aset dan kelola akses ke sana
Setelah Anda membuat model pembelajaran mesin, grup fitur, atau tabel data, Anda dapat membuatnya terlihat oleh individu yang berkolaborasi dengan Anda dalam proyek atau organisasi Anda secara lebih luas. Anda dapat menanggapi permintaan akses ke aset. Jika Anda menyetujui permintaan individu, mereka dapat memodifikasi sumber data yang mendasari aset tersebut.
Saat Anda berbagi aset, Anda memiliki dua opsi:
-
Publikasikan ke katalog aset — Buat aset terlihat oleh semua orang di organisasi Anda
-
Publikasikan ke inventaris — Buat aset terlihat oleh semua orang yang mengerjakan proyek Anda
Jika Anda telah menerbitkan aset Anda ke katalog aset, individu di organisasi Anda dapat menemukannya di katalog aset. Mereka dapat melihat metadata aset Anda dan memutuskan apakah mereka ingin meminta akses ke mereka. Jika Anda menyetujui permintaan mereka, mereka mendapatkan akses ke sumber data yang mendasarinya.
Jika Anda mempublikasikan ke inventaris, Anda dan anggota lain dari proyek Anda dapat mengakses aset tanpa tindakan tambahan apa pun.
Aset yang dipublikasikan ke inventaris hanya muncul di bawah aset yang Dimiliki. Aset yang dipublikasikan ke katalog muncul di bawah katalog Aset dan Aset yang Dimiliki.
Saat memublikasikan tabel data, Anda harus membuat sumber data yang menarik metadata dari AWS Glue tabel dasar atau tabel Amazon Redshift ke dalam aset. Gunakan prosedur berikut untuk mempublikasikan tabel Amazon Redshift AWS Glue atau Amazon.
Untuk memublikasikan aset untuk AWS Glue tabel, Anda membuat sumber data untuknya dan mempublikasikannya. Sumber data adalah mekanisme yang menarik metadata dari AWS Glue tabel ke dalam aset.
Gunakan prosedur berikut untuk mempublikasikan AWS Glue tabel.
Untuk mempublikasikan AWS Glue tabel
-
Arahkan ke halaman landing SageMaker Assets.
-
Pilih Aset yang Dimiliki.
-
Pilih Lihat sumber data.
-
Pilih Buat sumber data.
-
Untuk Nama, tentukan nama untuk sumber data.
-
Untuk Deskripsi, berikan deskripsi.
-
Untuk Jenis, pilih AWS Glue.
-
Untuk pemilihan Data, pilih database yang berisi AWS Glue tabel.
-
Untuk kriteria pemilihan Tabel, tentukan nama tabel.
catatan
Meskipun Anda dapat menentukan lebih dari satu tabel, kami sangat menyarankan hanya menyediakan satu nama tabel.
-
Pilih Berikutnya.
-
-
Untuk Publikasikan aset ke katalog, pilih Ya untuk mempublikasikan ke katalog aset.
-
Untuk Publikasikan aset ke katalog, pilih Tidak untuk dipublikasikan ke katalog aset.
-
-
Pilih Berikutnya.
-
Di bawah Detail aset, pilih Jalankan sesuai jadwal atau Jalankan sesuai permintaan untuk menentukan bagaimana metadata dari AWS Glue tabel ditarik ke aset.
-
(Opsional) Jika Anda memilih Jalankan sesuai jadwal, tentukan jadwal yang menarik metadata ke dalam aset.
-
Pilih Berikutnya.
-
Pilih Buat.
-
(Opsional) Jika Anda belum membuat jadwal, pilih Jalankan untuk membawa metadata dari AWS Glue tabel ke aset.
Gunakan prosedur berikut untuk mempublikasikan aset untuk grup fitur atau grup paket model.
Gunakan prosedur berikut untuk menavigasi ke grup fitur yang telah Anda buat dan mempublikasikannya ke aset atau katalog aset milik Anda.
Untuk memublikasikan grup fitur ke aset atau katalog aset milik Anda
-
Di dalam Studio, pilih Data di navigasi sebelah kiri.
-
Pilih grup fitur yang Anda terbitkan.
-
Pilih
ikon.
-
-
Pilih Publikasikan ke katalog aset untuk dipublikasikan ke katalog aset.
-
Pilih Publikasikan ke inventaris untuk dipublikasikan ke aset yang dimiliki grup Anda.
-
Gunakan prosedur berikut untuk mempublikasikan aset dari aset milik Anda ke katalog aset.
Untuk memublikasikan SageMaker aset dari halaman Aset
-
Di dalam Studio, arahkan ke Aset.
-
Pilih Aset yang Dimiliki.
-
Tentukan nama aset Anda di bilah pencarian.
-
Pilih asetnya.
-
Pilih Terbitkan.
Anda dapat menggunakan kode SDK SageMaker Python berikut untuk mempublikasikan grup fitur atau grup paket model. Kode mengasumsikan bahwa Anda telah membuat grup fitur atau grup paket model.
from sagemaker.asset import AssetManager
publisher = AssetPublisher()
publisher.publish_to_catalog(name-of-your-feature-group-or-model-package
)
Langkah 3: Kelola permintaan akses
Setelah Anda menerbitkan aset, pengguna di luar proyek Anda mungkin ingin mengaksesnya. Anda dapat memberikan, menolak, atau mencabut permintaan akses. Anda juga dapat menghapus aset untuk hanya membuat sumber data yang mendasarinya hanya tersedia untuk Anda sendiri.
Gunakan prosedur berikut untuk menanggapi permintaan berlangganan.
Untuk menyetujui permintaan berlangganan
-
Arahkan ke halaman SageMaker Aset.
-
Pilih Kelola aset aset.
-
Pilih Permintaan langganan masuk.
-
-
(Opsional) Pilih Menyetujui dan memberikan alasan.
-
(Opsional) Pilih Tolak.
-
Anda dapat mencabut akses ke aset yang telah Anda setujui sebelumnya. Jika Anda memilih untuk mencabut akses, pengguna kehilangan akses ke aset dan aset dasar. sumber. Gunakan prosedur berikut untuk mencabut akses.
Untuk mencabut akses
-
Arahkan ke halaman SageMaker Aset.
-
Pilih Kelola aset aset.
-
Pilih Permintaan langganan masuk.
-
Pilih tab Disetujui.
-
Pilih Cabut di sebelah aset.
Anda juga dapat membatalkan publikasi aset, membuatnya hanya muncul sebagai aset yang dimiliki. Aset tidak akan terlihat di katalog resouce, tetapi individu yang permintaan langganannya telah disetujui masih dapat mengaksesnya.
Untuk membatalkan publikasi aset
-
Arahkan ke halaman SageMaker Aset.
-
Di bawah Aset yang Dimiliki, pilih aset yang Anda batalkan penerbitan.
-
Pilih Batalkan Publikasikan.
Anda juga dapat menghapus aset dari halaman yang sama tempat Anda membatalkan penerbitannya. Menghapus aset tidak menghapus sumber data. Penghapusan aset hanya membuat aset tidak terlihat oleh anggota lain dari proyek atau organisasi Anda.
Langkah 4: Temukan aset dan minta akses ke sana
Anda dapat meminta akses ke aset yang telah dipublikasikan pengguna lain ke katalog sumber daya. Jika mereka menyetujui permintaan berlangganan, Anda mendapatkan akses ke sumber data yang mendasarinya.
Di bagian atas halaman SageMaker Aset, Anda dapat menentukan kueri penelusuran untuk menemukan aset yang telah dipublikasikan oleh pengguna lain di organisasi Anda. Anda juga dapat memilih jenis aset untuk melihat semua aset yang dipublikasikan dari jenis tersebut. Misalnya, Anda dapat memilih Glue Table untuk melihat semua AWS Glue tabel yang diterbitkan.
Anda juga dapat melihat jenis aset secara langsung di bawah nama aset. Berikut ini adalah nama-nama yang tersedia untuk jenis aset:
-
Tabel pergeseran merah
-
Glue meja
-
Model
-
Grup fitur
catatan
Grup fitur di toko-toko berikut memiliki jenis tabel Glue:
-
Offline
-
Offline dan online
Untuk membuat permintaan berlangganan
-
Arahkan ke halaman SageMaker Aset.
-
-
Di bilah pencarian, tentukan nama aset dan pilih Cari.
-
Untuk Jenis, pilih jenis aset dan temukan aset yang Anda akses dalam katalog sumber daya.
-
-
Pilih asetnya.
-
Pilih Langganan.
-
Berikan alasan untuk permintaan tersebut.
-
Pilih Kirim.
Permintaan langganan Anda muncul di bawah Permintaan langganan keluar di bawah Kelola permintaan aset. Jika penerbit aset menyetujui permintaan Anda, itu muncul di bawah Aset berlangganan. Sekarang Anda dapat menggunakan sumber data Amazon Redshift, AWS Glue tabel, atau ML dalam alur kerja pembelajaran mesin Anda.
Langkah 5: Gunakan aset bersama dalam alur kerja pembelajaran mesin Anda
Jika permintaan berlangganan ke aset disetujui, Anda dapat menggunakannya dalam alur kerja pembelajaran mesin.
Grup fitur yang telah Anda akses akan muncul di daftar grup fitur di Studio.
Grup model yang Anda telah diberi akses muncul dalam daftar grup model di Studio. Anda dapat membuka grup model Anda di registri model dari SageMaker Aset. Gunakan prosedur berikut untuk membuka grup model dalam registri model. Aset berlangganan.
Untuk membuka grup model dari SageMaker Aset
-
Pilih grup model.
-
Pilih Buka di Registri Model.
Anda dapat mengakses AWS Glue atau tabel Amazon Redshift di Data Wrangler dalam Canvas. SageMaker SageMaker Canvas adalah aplikasi yang memungkinkan Anda melakukan analisis data eksplorasi (EDA) dan melatih model tanpa kode. Untuk informasi selengkapnya tentang SageMaker Canvas, lihat SageMaker Kanvas Amazon.
Anda juga dapat membawa data dari tabel Amazon Redshift Anda AWS Glue atau Amazon ke notebook Jupyter Anda dengan menggunakan ekstensi SQL. Anda dapat mengonversi data Anda menjadi kerangka data panda untuk alur kerja pembelajaran mesin Anda. Untuk informasi selengkapnya, lihat Persiapan data dengan SQL di Studio.