Jenis koleksi - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Jenis koleksi

Jenis koleksi menyediakan cara untuk mengatur dan menyusun data untuk pengambilan dan analisis yang efisien. Mereka digunakan dalam database ML untuk menentukan skema dataset dan elemen-elemennya. Di Amazon SageMaker Feature Store, jenis koleksi yang didukung mencakup daftar, set, dan vektor.

Koleksi adalah pengelompokan elemen di mana setiap elemen dalam koleksi harus memiliki jenis fitur yang sama (String,Integral, atauFractional). Misalnya, koleksi dapat berisi elemen dengan semua jenis fitur elemen sebagaiFractional, tetapi koleksi tidak dapat berisi elemen dengan beberapa jenis fitur sebagai Fractional dan beberapa jenis fitur sebagaiString.

Hanya grup fitur toko InMemory online yang saat ini mendukung jenis koleksi. Daftar berikut menjelaskan opsi jenis koleksi.

Daftar: Kumpulan elemen yang diurutkan.

  • Panjang daftar ditentukan oleh berapa banyak elemen dalam koleksi.

  • Contoh: Anda dapat memiliki daftar seperti ['a', 'b', 'a'], karena daftar mempertahankan urutan dan dapat memiliki elemen pengulangan.

Set: Koleksi elemen unik yang tidak berurutan.

  • Panjang set ditentukan oleh berapa banyak elemen unik dalam koleksi.

  • Contoh: Anda tidak dapat memiliki himpunan seperti ['a', 'b', 'a'], karena mengandung elemen pengulangan. Himpunan akan memiliki elemen ['a', 'b'], karena himpunan hanya berisi elemen unik.

Vektor: Daftar khusus yang mewakili array elemen ukuran tetap. Urutan elemen memiliki signifikansi, sehingga posisi elemen mewakili properti tertentu dari data.

  • Elemen-elemen dalam jenis koleksi vektor harus memiliki tipe Fractional fitur.

  • Anda mungkin hanya memiliki satu jenis koleksi vektor per grup fitur InMemory tingkat toko online.

  • Dimensi (jumlah elemen dalam vektor) vektor ditentukan sebelumnya oleh Anda dan ditentukan menggunakanVectorDimension. Batas dimensi maksimal adalah 8192.

  • Contoh: Anda dapat memiliki vektor seperti [4.2, -6.3, 4.2], di mana elemen pertama, kedua, dan ketiga dapat mewakili posisi x, y, dan z dalam ruang fisik.

Tidak ada batasan panjang koleksi, asalkan tidak melebihi ukuran maksimum rekaman. Untuk ukuran maksimum rekaman, lihatKuota, aturan penamaan, dan tipe data.