Konsep Toko Fitur - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Konsep Toko Fitur

Kami mencantumkan istilah umum yang digunakan di Amazon SageMaker Feature Store, diikuti dengan contoh diagram untuk memvisualisasikan beberapa konsep:

  • Feature Store: Lapisan penyimpanan dan manajemen data untuk fitur pembelajaran mesin (ML). Berfungsi sebagai satu-satunya sumber kebenaran untuk menyimpan, mengambil, menghapus, melacak, berbagi, menemukan, dan mengontrol akses ke fitur. Dalam diagram contoh berikut, Feature Store adalah toko untuk grup fitur Anda, yang berisi data ML Anda, dan menyediakan layanan tambahan.

  • Toko online: Latensi rendah, toko ketersediaan tinggi untuk grup fitur yang memungkinkan pencarian catatan secara real-time. Toko online memungkinkan akses cepat ke catatan terbaru melalui GetRecordAPI.

  • Toko offline: Menyimpan data historis di bucket Amazon S3 Anda. Toko offline digunakan ketika pembacaan latensi rendah (sub-detik) tidak diperlukan. Misalnya, toko offline dapat digunakan saat Anda ingin menyimpan dan menyajikan fitur untuk eksplorasi, pelatihan model, dan inferensi batch.

  • Grup fitur: Sumber daya utama Feature Store yang berisi data dan metadata yang digunakan untuk pelatihan atau prediksi dengan model ML. Grup fitur adalah pengelompokan logis fitur yang digunakan untuk menggambarkan catatan. Dalam contoh diagram berikut, grup fitur berisi data ML Anda.

  • Fitur: Properti yang digunakan sebagai salah satu input untuk melatih atau memprediksi menggunakan model ML Anda. Di Feature StoreAPI, fitur adalah atribut catatan. Dalam contoh diagram berikut, fitur menjelaskan kolom dalam tabel data ML Anda.

  • Definisi fitur: Terdiri dari nama dan salah satu tipe data: integral, string atau fraksional. Grup fitur berisi daftar definisi fitur. Untuk informasi selengkapnya tentang tipe data Toko Fitur, lihatJenis data.

  • Rekam: Kumpulan nilai untuk fitur untuk pengenal rekaman tunggal. Kombinasi pengenal rekaman dan nilai waktu peristiwa secara unik mengidentifikasi catatan dalam grup fitur. Dalam contoh diagram berikut, catatan adalah baris dalam tabel data ML Anda.

  • Nama pengenal rekaman: Nama pengenal catatan adalah nama fitur yang mengidentifikasi catatan. Ini harus merujuk ke salah satu nama fitur yang didefinisikan dalam definisi fitur grup fitur. Setiap grup fitur didefinisikan dengan nama pengenal catatan.

  • Waktu acara: Stempel waktu yang Anda berikan sesuai dengan saat peristiwa rekaman terjadi. Semua catatan dalam grup fitur harus memiliki waktu acara yang sesuai. Toko online hanya berisi catatan yang sesuai dengan waktu acara terbaru, sedangkan toko offline berisi semua catatan sejarah. Untuk informasi selengkapnya tentang format waktu acara, lihatJenis data.

  • Ingestion: Menambahkan catatan baru ke grup fitur. Tertelan biasanya dicapai melalui. PutRecord API

Diagram ikhtisar konsep

Contoh diagram berikut mengkonseptualisasikan beberapa konsep Feature Store:

An example representation of a feature group using an example table as reference.

Toko Fitur berisi grup fitur Anda dan grup fitur berisi data ML Anda. Dalam diagram contoh, grup fitur asli berisi tabel data yang memiliki tiga fitur (masing-masing menggambarkan kolom) dan dua catatan (baris).

  • Definisi fitur menjelaskan nama fitur dan tipe data dari nilai fitur yang terkait dengan catatan.

  • Catatan berisi nilai fitur dan diidentifikasi secara unik oleh pengidentifikasi catatannya dan harus menyertakan waktu acara.

Diagram konsumsi

Ingestion adalah tindakan menambahkan catatan atau catatan ke grup fitur yang ada. Toko online dan offline diperbarui secara berbeda untuk kasus penggunaan penyimpanan yang berbeda.

Tertelan ke contoh toko online

Toko online bertindak sebagai pencarian catatan waktu nyata dan hanya menyimpan sebagian besar up-to-date catatan. Setelah catatan dicerna ke toko online yang ada, toko online yang diperbarui hanya akan menyimpan catatan dengan waktu acara terbaru.

Dalam contoh diagram berikut, toko online asli berisi tabel data ML dengan satu catatan. Rekaman dicerna dengan nama pengenal rekaman yang sama dengan catatan asli, dan catatan yang dicerna memiliki waktu peristiwa yang lebih awal dari catatan aslinya. Karena toko online yang diperbarui hanya menyimpan catatan dengan waktu acara terbaru, toko online yang diperbarui berisi catatan asli.

An example showing how records are ingested in the online store.

Tertelan ke contoh toko offline

Toko offline bertindak sebagai pencarian sejarah catatan dan menyimpan semua catatan. Setelah catatan baru dicerna ke toko offline yang ada, toko offline yang diperbarui akan menyimpan rekor baru.

Dalam contoh diagram berikut, toko offline asli berisi tabel data ML dengan satu catatan. Rekaman dicerna dengan nama pengenal rekaman yang sama dengan catatan asli, dan catatan yang dicerna memiliki waktu peristiwa lebih awal dari catatan aslinya. Karena toko offline yang diperbarui menyimpan semua catatan, toko offline yang diperbarui berisi kedua catatan.

An example showing how records are ingested in the offline store.