API pembelajaran mesin - AWS Glue

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

API pembelajaran mesin

Machine learning API menjelaskan tipe data machine learning, dan menyertakan API untuk membuat, menghapus, atau memperbarui transformasi, atau memulai tugas pembelajaran mesin.

Jenis data

TransformParameters struktur

Parameter spesifik algoritme yang dikaitkan dengan transformasi machine learning.

Bidang
  • TransformTypeWajib: String UTF-8 (nilai yang valid: FIND_MATCHES).

    Jenis transformasi machine learning.

    Untuk informasi tentang jenis transformasi machine learning, lihat Membuat Machine Learning.

  • FindMatchesParameters — Sebuah objek FindMatchesParameter.

    Parameter untuk menemukan kecocokan algoritme.

EvaluationMetrics struktur

Metrik evaluasi memberikan perkiraan kualitas dari transformasi machine learning Anda.

Bidang
  • TransformTypeWajib: String UTF-8 (nilai yang valid: FIND_MATCHES).

    Jenis transformasi machine learning.

  • FindMatchesMetrics — Sebuah objek FindMatchesMetrik.

    Metrik evaluasi untuk algoritme temukan kecocokan.

Struktur MLTransform

Struktur untuk sebuah transformasi machine learning.

Bidang
  • TransformId — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    ID transformasi unik yang dihasilkan untuk transformasi machine learning. ID tersebut dijamin unik dan tidak berubah.

  • Name — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Nama yang ditetapkan pengguna untuk transformasi machine learning. Nama tersebut tidak dijamin unik dan dapat diubah setiap saat.

  • Description — String deskripsi, dengan panjang tidak lebih dari 2048 byte, yang cocok dengan URI address multi-line string pattern.

    Sebuah teks deskripsi dalam bentuk panjang yang ditetapkan pengguna untuk transformasi machine learning. Deskripsi tersebut tidak dijamin unik dan dapat diubah kapan saja.

  • Status – String UTF-8 (nilai yang valid: NOT_READY | READY | DELETING).

    Status transformasi machine learning saat ini.

  • CreatedOn — Stempel waktu.

    Sebuah stempel waktu. Waktu dan tanggal saat transformasi machine learning ini diciptakan.

  • LastModifiedOn — Stempel waktu.

    Sebuah stempel waktu. Titik dalam waktu terakhir ketika transformasi machine learning ini dimodifikasi.

  • InputRecordTables — Susunan objek GlueTable, tidak lebih dari 10 struktur.

    Daftar definisi AWS Glue tabel yang digunakan oleh transformasi.

  • Parameters — Sebuah objek TransformParameters.

    Sebuah objek TransformParameters. Anda dapat menggunakan parameter untuk menyetel (menyesuaikan) perilaku transformasi machine learning dengan menentukan data apa yang dipelajari dan preferensi Anda pada berbagai tradeoff (seperti precious vs recall, atau akurasi vs biaya).

  • EvaluationMetrics — Sebuah objek EvaluationMetrics.

    Sebuah objek EvaluationMetrics. Metrik evaluasi memberikan perkiraan kualitas dari transformasi machine learning Anda.

  • LabelCount — Nomor (bilangan bulat).

    Pengidentifikasi hitungan untuk file pelabelan yang dihasilkan oleh AWS Glue untuk transformasi ini. Karena Anda membuat transformasi yang lebih baik, maka Anda dapat secara berulang mengunduh, label, dan mengunggah file pelabelan.

  • Schema — Susunan objek SchemaColumn, tidak lebih dari 100 struktur.

    Sebuah peta pasangan nilai-kunci yang mewakili kolom dan tipe data yang dapat dijalankan oleh transformasi ini terhadapnya. Memiliki batas atas 100 kolom.

  • Role – String UTF-8.

    Nama atau Amazon Resource Name (ARN) dari IAM role dengan izin yang diperlukan. Izin yang diperlukan mencakup izin peran AWS Glue layanan ke AWS Glue sumber daya, dan izin Amazon S3 yang diperlukan oleh transformasi.

    • Peran ini membutuhkan izin peran AWS Glue layanan untuk memungkinkan akses ke sumber daya. AWS Glue Lihat Melampirkan Kebijakan untuk pengguna IAM yang Mengakses AWS Glue.

    • Peran ini memerlukan izin ke sumber Amazon Simple Storage Service (Amazon S3), target, direktori sementara, skrip, dan perpustakaan yang digunakan oleh tugas yang dijalankan untuk transformasi ini.

  • GlueVersion — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Custom string pattern #20.

    Nilai ini menentukan versi transformasi pembelajaran mesin AWS Glue ini yang kompatibel. Glue 1.0 direkomendasikan untuk sebagian besar pelanggan. Jika nilai tidak diatur, maka kompatibilitas Glue secara default diatur ke Glue 0.9. Untuk informasi selengkapnya, lihat Versi AWS Glue dalam panduan developer.

  • MaxCapacity — Nomor (ganda).

    Jumlah unit pemrosesan AWS Glue data (DPU) yang dialokasikan untuk tugas berjalan untuk transformasi ini. Anda dapat mengalokasikan dari 2 hingga 100 DPU; default-nya adalah 10. DPU adalah ukuran relatif daya pemrosesan yang terdiri dari 4 vCPU kapasitas komputasi dan 16 GB memori. Untuk informasi lebih lanjut, lihat halaman harga AWS Glue.

    MaxCapacity adalah pilihan yang eksklusif satu sama lain dengan NumberOfWorkers dan WorkerType.

    • Jika NumberOfWorkers atau WorkerType diatur, maka MaxCapacity tidak dapat diatur.

    • Jika MaxCapacity diatur, maka NumberOfWorkers atau WorkerType tidak dapat diatur.

    • Jika WorkerType diatur, maka NumberOfWorkers wajib (dan sebaliknya).

    • MaxCapacity dan NumberOfWorkers, keduanya minimal harus 1.

    Saat bidang WorkerType diatur ke nilai selain Standard, maka bidang MaxCapacity diatur secara otomatis dan menjadi baca-saja.

  • WorkerType – String UTF-8 (nilai yang valid: Standard="" | G.1X="" | G.2X="" | G.025X="" | G.4X="" | G.8X="" | Z.2X="").

    Jenis pekerja yang telah ditetapkan sebelumnya yang dialokasikan ketika sebuah tugas dari transformasi ini dieksekusi. Menerima nilai Standard, G.1X, atau G.2X.

    • Untuk jenis pekerja Standard, setiap pekerja menyediakan 4 vCPU, memori 16 GB dan disk 50GB, dan 2 pelaksana per pekerja.

    • Untuk jenis pekerja G.1X, setiap pekerja menyediakan 4 vCPU, memori 16 GB dan disk 64GB, dan 1 pelaksana per pekerja.

    • Untuk jenis pekerja G.2X, setiap pekerja menyediakan 8 vCPU, memori 32 GB dan disk 128GB, dan 1 pelaksana per pekerja.

    MaxCapacity adalah pilihan yang eksklusif satu sama lain dengan NumberOfWorkers dan WorkerType.

    • Jika NumberOfWorkers atau WorkerType diatur, maka MaxCapacity tidak dapat diatur.

    • Jika MaxCapacity diatur, maka NumberOfWorkers atau WorkerType tidak dapat diatur.

    • Jika WorkerType diatur, maka NumberOfWorkers wajib (dan sebaliknya).

    • MaxCapacity dan NumberOfWorkers, keduanya minimal harus 1.

  • NumberOfWorkers — Nomor (bilangan bulat).

    Jumlah pekerja dari workerType yang ditentukan yang dialokasikan ketika sebuah tugas dari transformasi berjalan.

    Jika WorkerType diatur, maka NumberOfWorkers wajib (dan sebaliknya).

  • Timeout — Nomor (bilangan bulat), minimal 1.

    Waktu habis dalam hitungan menit dari transformasi machine learning.

  • MaxRetries — Nomor (bilangan bulat).

    Jumlah percobaan maksimum untuk mencoba kembali setelah sebuah MLTaskRun dari transformasi machine learning gagal.

  • TransformEncryption — Sebuah objek TransformEncryption.

    encryption-at-rest Pengaturan transformasi yang berlaku untuk mengakses data pengguna. Transformasi machine learning dapat mengakses data pengguna yang dienkripsi di Amazon S3 menggunakan KMS.

FindMatchesParameters struktur

Parameter untuk mengonfigurasi perubahan kecocokan penemuan.

Bidang
  • PrimaryKeyColumnName — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 1024 byte, yang cocok dengan Single-line string pattern.

    Nama kolom yang secara unik mengidentifikasi baris di tabel sumber. Digunakan untuk membantu mengidentifikasi catatan yang cocok.

  • PrecisionRecallTradeoff — Nomor (ganda), tidak lebih dari 1.0.

    Nilai yang dipilih saat menyetel transformasi Anda untuk keseimbangan antara presisi dan pemanggilan ulang. Nilai 0,5 artinya tidak ada preferensi; nilai 1,0 artinya bias murni untuk presisi, dan nilai 0,0 artinya bias untuk pemanggilan ulang. Karena ini adalah tradeoff, pemilihan nilai yang mendekati 1,0 artinya pemanggilan ulang yang sangat rendah, dan pemilihan nilai yang mendekati 0,0 menghasilkan presisi yang sangat rendah.

    Metrik presisi menunjukkan seberapa sering model Anda benar saat memprediksi kecocokan.

    Metrik pemanggilan ulang menunjukkan bahwa untuk kecocokan aktual, seberapa sering model Anda memprediksi kecocokan.

  • AccuracyCostTradeoff — Nomor (ganda), tidak lebih dari 1.0.

    Nilai yang dipilih saat menyetel perubahan Anda untuk keseimbangan antara akurasi dan biaya. Nilai 0,5 artinya sistem menyeimbangkan masalah akurasi dan biaya. Nilai 1,0 artinya bias murni untuk akurasi, yang biasanya menghasilkan biaya yang lebih tinggi, terkadang sangat tinggi. Nilai 0,0 berarti bias murni untuk biaya, yang menghasilkan perubahan FindMatches yang kurang akurat, terkadang dengan akurasi yang tidak dapat diterima.

    Akurasi mengukur seberapa baik perubahan menemukan positif sejati dan negatif sejati. Peningkatan akurasi memerlukan lebih banyak sumber daya dan biaya mesin. Tetapi, itu juga menghasilkan peningkatan pemanggilan ulang.

    Biaya mengukur berapa banyak sumber daya komputasi, sehingga uang, dikonsumsi untuk menjalankan perubahan.

  • EnforceProvidedLabels – Boolean.

    Nilai yang diaktifkan atau dinonaktifkan untuk memaksa output agar cocok dengan label yang disediakan dari pengguna. Jika nilainya adalah True, perubahan find matches memaksa output agar cocok dengan label yang disediakan. Hasilnya menimpa hasil penggabungan normal. Jika nilainya adalah False, perubahan find matches tidak memastikan semua label yang disediakan diperhatikan, dan hasilnya bergantung pada model terlatih.

    Perhatikan bahwa pengaturan nilai ini ke betul dapat meningkatkan waktu eksekusi penggabungan.

FindMatchesMetrics struktur

Metrik evaluasi untuk algoritme temukan kecocokan. Kualitas transformasi machine learning Anda diukur dengan membuat transformasi Anda memprediksi beberapa kecocokan dan membandingkan hasilnya dengan kecocokan yang diketahui dari set data yang sama. Metrik kualitas didasarkan pada subset data Anda, sehingga mereka tidak tepat.

Bidang
  • AreaUnderPRCurve — Nomor (ganda), tidak lebih dari 1.0.

    Daerah di bawah kurva presisi/recall (AUPRC) adalah sebuah nomor tunggal yang mengukur kualitas keseluruhan transformasi, yang independen dari pilihan yang dibuat untuk presisi vs recall. Nilai yang lebih tinggi menunjukkan bahwa Anda memiliki precision vs. recall tradeoff yang lebih menarik.

    Untuk informasi selengkapnya, lihat Precision dan recall di Wikipedia.

  • Precision — Nomor (ganda), tidak lebih dari 1.0.

    Metrik presisi menunjukkan seberapa sering transformasi Anda benar saat memprediksi kecocokan. Secara khusus, ia mengukur seberapa baik transformasi menemukan kemungkinan positif sejati dari total positif sejati.

    Untuk informasi selengkapnya, lihat Precision dan recall di Wikipedia.

  • Recall — Nomor (ganda), tidak lebih dari 1.0.

    Metrik pemanggilan ulang menunjukkan bahwa untuk kecocokan aktual, seberapa sering transformasi Anda memprediksi kecocokan. Secara khusus, ia mengukur seberapa baik transformasi menemukan benar positif dari total catatan dalam data sumber.

    Untuk informasi selengkapnya, lihat Precision dan recall di Wikipedia.

  • F1 — Nomor (ganda), tidak lebih dari 1.0.

    Metrik F1 maksimal menunjukkan akurasi transformasi antara 0 dan 1, di mana 1 adalah akurasi terbaik.

    Untuk informasi selengkapnya, lihat Skor F1 di Wikipedia.

  • ConfusionMatrix — Sebuah objek ConfusionMatrix.

    Matriks kebingungan menunjukkan kepada Anda apa yang transformasi Anda prediksi secara akurat dan jenis kesalahan apa yang dibuat.

    Untuk informasi selengkapnya, lihat Matriks kebingungan di Wikipedia.

  • ColumnImportances — Susunan objek ColumnImportance, tidak lebih dari 100 struktur.

    Daftar struktur ColumnImportance yang berisi metrik nilai penting kolom, yang diurutkan dalam urutan nilai penting yang semakin menurun.

ConfusionMatrix struktur

Matriks kebingungan menunjukkan kepada Anda apa yang transformasi Anda prediksi secara akurat dan jenis kesalahan apa yang dibuat.

Untuk informasi selengkapnya, lihat Matriks kebingungan di Wikipedia.

Bidang
  • NumTruePositives — Nomor (panjang).

    Jumlah kecocokan dalam data yang dengan benar ditemukan oleh transformasi, dalam matriks kebingungan untuk transformasi Anda.

  • NumFalsePositives — Nomor (panjang).

    Jumlah ketidakcocokan dalam data yang keliru diklasifikasikan oleh transformasi sebagai sebuah kecocokan, dalam matriks kebingungan untuk transformasi Anda.

  • NumTrueNegatives — Nomor (panjang).

    Jumlah ketidakcocokan dalam data yang dengan benar ditolak oleh transformasi, dalam matriks kebingungan untuk transformasi Anda.

  • NumFalseNegatives — Nomor (panjang).

    Jumlah kecocokan dalam data yang tidak ditemukan oleh transformasi, dalam matriks kebingungan untuk transformasi Anda.

GlueTable struktur

Database dan tabel dalam AWS Glue Data Catalog yang digunakan untuk input atau output data.

Bidang
  • DatabaseNameWajib: String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Sebuah nama basis data di AWS Glue Data Catalog.

  • TableNameWajib: String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Sebuah nama tabel di AWS Glue Data Catalog.

  • CatalogId — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Pengidentifikasi unik untuk AWS Glue Data Catalog.

  • ConnectionName — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Nama koneksi ke AWS Glue Data Catalog.

  • AdditionalOptions— Sebuah array peta pasangan kunci-nilai, tidak kurang dari 1 atau lebih dari 10 pasang.

    Masing-masing kunci adalah sebuah string UTF-8, dengan panjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Setiap nilai adalah string Deskripsi, panjangnya tidak lebih dari 2048 byte, cocok dengan. URI address multi-line string pattern

    Opsi tambahan untuk tabel. Saat ini ada dua kunci yang didukung:

    • pushDownPredicate: untuk memfilter pada partisi tanpa harus daftar dan membaca semua file dalam dataset Anda.

    • catalogPartitionPredicate: untuk menggunakan pemangkasan partisi sisi server menggunakan indeks partisi di. AWS Glue Data Catalog

TaskRun struktur

Parameter pengambilan sampel yang dikaitkan dengan transformasi machine learning.

Bidang
  • TransformId — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Pengidentifikasi unik untuk transformasi.

  • TaskRunId — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Pengidentifikasi unik untuk eksekusi tugas ini.

  • Status – String UTF-8 (nilai yang valid: STARTING | RUNNING | STOPPING | STOPPED | SUCCEEDED | FAILED | TIMEOUT).

    Status eksekusi tugas yang diminta saat ini.

  • LogGroupName – String UTF-8.

    Nama grup log untuk pencatatan log yang aman, yang dikaitkan dengan eksekusi tugas ini.

  • Properties — Sebuah objek TaskRunProperti.

    Menentukan properti konfigurasi yang dikaitkan dengan eksekusi tugas ini.

  • ErrorString – String UTF-8.

    Daftar string kesalahan yang dikaitkan dengan eksekusi tugas ini.

  • StartedOn — Stempel waktu.

    Tanggal dan waktu saat eksekusi tugas ini dimulai.

  • LastModifiedOn — Stempel waktu.

    Titik dalam waktu terakhir saat eksekusi tugas yang diminta diperbarui.

  • CompletedOn — Stempel waktu.

    Titik dalam waktu terakhir saat eksekusi tugas yang diminta selesai.

  • ExecutionTime — Nomor (bilangan bulat).

    Jumlah waktu (dalam satuan detik) di mana eksekusi tugas ini menggunakan sumber daya.

TransformFilterCriteria struktur

Kriteria yang digunakan untuk mem-filter transformasi machine learning.

Bidang
  • Name — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Sebuah nama transformasi unik yang digunakan untuk mem-filter transformasi machine learning.

  • TransformType – String UTF-8 (nilai yang valid: FIND_MATCHES).

    Jenis transformasi machine learning yang digunakan untuk mem-filter transformasi machine learning.

  • Status – String UTF-8 (nilai yang valid: NOT_READY | READY | DELETING).

    Memfilter daftar transformasi machine learning berdasarkan status transformasi terakhir yang diketahui (untuk menunjukkan apakah transformasi dapat digunakan atau tidak). Salah satu "NOT_READY", "READY", atau "DELETING".

  • GlueVersion — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Custom string pattern #20.

    Nilai ini menentukan versi transformasi pembelajaran mesin AWS Glue ini yang kompatibel. Glue 1.0 direkomendasikan untuk sebagian besar pelanggan. Jika nilai tidak diatur, maka kompatibilitas Glue secara default diatur ke Glue 0.9. Untuk informasi selengkapnya, lihat Versi AWS Glue dalam panduan developer.

  • CreatedBefore — Stempel waktu.

    Waktu dan tanggal sebelum transformasi dibuat.

  • CreatedAfter — Stempel waktu.

    Waktu dan tanggal setelah transformasi dibuat.

  • LastModifiedBefore — Stempel waktu.

    Filter berdasarkan modifikasi terakhir transformasi sebelum tanggal ini.

  • LastModifiedAfter — Stempel waktu.

    Filter berdasarkan modifikasi terakhir transformasi setelah tanggal ini.

  • Schema — Susunan objek SchemaColumn, tidak lebih dari 100 struktur.

    Filter berdasarkan set data dengan skema tertentu. Objek Map<Column, Type> adalah sebuah rangkaian dari pasangan nilai kunci yang mewakili skema yang diterima transformasi ini, di mana Column adalah nama kolom, dan Type adalah jenis data seperti integer atau string. Memiliki batas atas 100 kolom.

TransformSortCriteria struktur

Kriteria pengurutan yang terkait dengan transformasi machine learning.

Bidang
  • ColumnWajib: String UTF-8 (nilai yang valid: NAME | TRANSFORM_TYPE | STATUS | CREATED | LAST_MODIFIED).

    Kolom yang akan digunakan dalam kriteria pengurutan yang terkait dengan transformasi machine learning.

  • SortDirectionWajib: String UTF-8 (nilai yang valid: DESCENDING | ASCENDING).

    Arah pengurutan yang akan digunakan dalam kriteria pengurutan yang terkait dengan transformasi machine learning.

TaskRunFilterCriteria struktur

Kriteria yang digunakan untuk mem-filter eksekusi tugas untuk transformasi machine learning.

Bidang
  • TaskRunType – String UTF-8 (nilai yang valid: EVALUATION | LABELING_SET_GENERATION | IMPORT_LABELS | EXPORT_LABELS | FIND_MATCHES).

    Jenis eksekusi tugas.

  • Status – String UTF-8 (nilai yang valid: STARTING | RUNNING | STOPPING | STOPPED | SUCCEEDED | FAILED | TIMEOUT).

    Status eksekusi tugas saat ini.

  • StartedBefore — Stempel waktu.

    Filter berdasarkan eksekusi tugas yang dimulai sebelum tanggal ini.

  • StartedAfter — Stempel waktu.

    Filter berdasarkan eksekusi tugas yang dimulai setelah tanggal ini.

TaskRunSortCriteria struktur

Kriteria pemilahan yang digunakan untuk mengurutkan daftar eksekusi tugas untuk transformasi machine learning.

Bidang
  • ColumnWajib: String UTF-8 (nilai yang valid: TASK_RUN_TYPE | STATUS | STARTED).

    Kolom yang akan digunakan untuk mengurutkan daftar eksekusi tugas untuk transformasi machine learning.

  • SortDirectionWajib: String UTF-8 (nilai yang valid: DESCENDING | ASCENDING).

    Arah pengurutan yang akan digunakan untuk mengurutkan daftar eksekusi tugas untuk transformasi machine learning.

TaskRunProperties struktur

Properti konfigurasi untuk eksekusi tugas.

Bidang
  • TaskType – String UTF-8 (nilai yang valid: EVALUATION | LABELING_SET_GENERATION | IMPORT_LABELS | EXPORT_LABELS | FIND_MATCHES).

    Jenis eksekusi tugas.

  • ImportLabelsTaskRunProperties — Sebuah objek ImportLabelsTaskRunProperti.

    Properti konfigurasi untuk eksekusi tugas label impor.

  • ExportLabelsTaskRunProperties — Sebuah objek ExportLabelsTaskRunProperti.

    Properti konfigurasi untuk eksekusi tugas label ekspor.

  • LabelingSetGenerationTaskRunProperties — Sebuah objek LabelingSetGenerationTaskRunProperties.

    Properti konfigurasi untuk eksekusi tugas pembuatan label set.

  • FindMatchesTaskRunProperties — Sebuah objek FindMatchesTaskRunProperti.

    Properti konfigurasi untuk eksekusi tugas temukan kecocokan.

FindMatchesTaskRunProperties struktur

Menentukan properti konfigurasi untuk eksekusi tugas Temukan Kecocokan.

Bidang
  • JobId — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    ID tugas untuk eksekusi tugas Temukan Kecocokan.

  • JobName — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Nama yang ditetapkan untuk tugas untuk eksekusi tugas Temukan Kecocokan.

  • JobRunId — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    ID eksekusi tugas untuk eksekusi tugas Temukan Kecocokan.

ImportLabelsTaskRunProperties struktur

Menentukan properti konfigurasi untuk eksekusi tugas label impor.

Bidang
  • InputS3Path – String UTF-8.

    Path Amazon Simple Storage Service (Amazon S3) tempat Anda akan mengimpor label.

  • Replace – Boolean.

    Menunjukkan apakah akan menimpa label yang ada.

ExportLabelsTaskRunProperties struktur

Menentukan properti konfigurasi untuk eksekusi tugas label ekspor.

Bidang
  • OutputS3Path – String UTF-8.

    Path Amazon Simple Storage Service (Amazon S3) tempat Anda akan mengekspor label.

LabelingSetGenerationTaskRunProperties struktur

Menentukan properti konfigurasi untuk eksekusi tugas pembuatan label set.

Bidang
  • OutputS3Path – String UTF-8.

    Path Amazon Simple Storage Service (Amazon S3) tempat Anda akan membuat set pelabelan.

SchemaColumn struktur

Sebuah pasangan nilai-kunci yang mewakili kolom dan tipe data yang dapat dijalankan oleh transformasi ini terhadapnya. Parameter Schema dari MLTransform yang mungkin terdiri hingga 100 struktur ini.

Bidang
  • Name — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 1024 byte, yang cocok dengan Single-line string pattern.

    Nama kolom.

  • DataType — String UTF-8, sepanjang tidak lebih dari 131072, yang cocok dengan Single-line string pattern.

    Jenis data dalam kolom.

TransformEncryption struktur

encryption-at-rest Pengaturan transformasi yang berlaku untuk mengakses data pengguna. Transformasi machine learning dapat mengakses data pengguna yang dienkripsi di Amazon S3 menggunakan KMS.

Selain itu, label yang diimpor dan transformasi yang dilatih sekarang dapat dienkripsi menggunakan kunci KMS yang disediakan pelanggan.

Bidang
  • MlUserDataEncryption — Sebuah objek UserDataEnkripsi ML.

    Sebuah objek MLUserDataEncryption yang berisi mode enkripsi dan ID kunci KMS yang disediakan pelanggan.

  • TaskRunSecurityConfigurationName — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Nama konfigurasi keamanan.

UserDataEncryption Struktur ML

encryption-at-rest Pengaturan transformasi yang berlaku untuk mengakses data pengguna.

Bidang
  • MlUserDataEncryptionModeWajib: String UTF-8 (nilai yang valid: DISABLED | SSE-KMS="SSEKMS").

    Mode enkripsi yang diterapkan untuk data pengguna. Nilai yang valid adalah:

    • DISABLED: enkripsi dinonaktifkan

    • SSEKMS: penggunaan enkripsi sisi server dengan AWS Key Management Service (SSE-KMS) untuk data pengguna yang disimpan di Amazon S3.

  • KmsKeyId — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    ID untuk kunci KMS yang disediakan oleh pelanggan.

ColumnImportance struktur

Sebuah struktur yang berisi nama kolom dan skor nilai penting kolom untuk sebuah kolom.

Nilai penting kolom membantu Anda memahami bagaimana kolom berkontribusi pada model Anda, dengan mengidentifikasi kolom mana dalam catatan Anda yang lebih penting daripada kolom yang lain.

Bidang
  • ColumnName — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Nama sebuah kolom.

  • Importance — Nomor (ganda), tidak lebih dari 1.0.

    Skor nilai penting kolom untuk kolom, dalam desimal.

Operasi

Tindakan CreateMelTransform (Python: create_ml_transform)

Menciptakan transformasi pembelajaran AWS Glue mesin. Operasi ini menciptakan transformasi dan semua parameter yang diperlukan untuk melatih transformasi tersebut.

Panggil operasi ini sebagai langkah pertama dalam proses menggunakan sebuah transformasi machine learning (seperti transformasi FindMatches) untuk deduplikasi data. Anda dapat memberikan opsi Description, selain parameter yang ingin Anda gunakan untuk algoritme Anda.

Anda juga harus menentukan parameter tertentu untuk tugas yang AWS Glue berjalan atas nama Anda sebagai bagian dari pembelajaran dari data Anda dan membuat transformasi pembelajaran mesin berkualitas tinggi. Parameter ini mencakup Role, dan opsional, AllocatedCapacity, Timeout, dan MaxRetries. Untuk informasi lebih lanjut, lihat Tugas.

Permintaan
  • NameWajib: String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Nama unik yang Anda berikan untuk transformasi pada saat Anda membuatnya.

  • Description — String deskripsi, dengan panjang tidak lebih dari 2048 byte, yang cocok dengan URI address multi-line string pattern.

    Sebuah deskripsi dari transformasi machine learning yang sedang didefinisikan. Default-nya adalah string kosong.

  • InputRecordTablesWajib: Susunan objek GlueTable, tidak lebih dari 10 struktur.

    Daftar definisi AWS Glue tabel yang digunakan oleh transformasi.

  • ParametersWajib: Sebuah objek TransformParameters.

    Parameter algoritmik yang spesifik untuk jenis transformasi yang digunakan. Secara kondisional tergantung pada jenis transformasi.

  • RoleWajib: String UTF-8.

    Nama atau Amazon Resource Name (ARN) dari IAM role dengan izin yang diperlukan. Izin yang diperlukan mencakup izin peran AWS Glue layanan ke AWS Glue sumber daya, dan izin Amazon S3 yang diperlukan oleh transformasi.

    • Peran ini membutuhkan izin peran AWS Glue layanan untuk memungkinkan akses ke sumber daya. AWS Glue Lihat Melampirkan Kebijakan untuk pengguna IAM yang Mengakses AWS Glue.

    • Peran ini memerlukan izin ke sumber Amazon Simple Storage Service (Amazon S3), target, direktori sementara, skrip, dan perpustakaan yang digunakan oleh tugas yang dijalankan untuk transformasi ini.

  • GlueVersion — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Custom string pattern #20.

    Nilai ini menentukan versi transformasi pembelajaran mesin AWS Glue ini yang kompatibel. Glue 1.0 direkomendasikan untuk sebagian besar pelanggan. Jika nilai tidak diatur, maka kompatibilitas Glue secara default diatur ke Glue 0.9. Untuk informasi selengkapnya, lihat Versi AWS Glue dalam panduan developer.

  • MaxCapacity — Nomor (ganda).

    Jumlah unit pemrosesan AWS Glue data (DPU) yang dialokasikan untuk tugas berjalan untuk transformasi ini. Anda dapat mengalokasikan dari 2 hingga 100 DPU; default-nya adalah 10. DPU adalah ukuran relatif daya pemrosesan yang terdiri dari 4 vCPU kapasitas komputasi dan 16 GB memori. Untuk informasi lebih lanjut, lihat halaman harga AWS Glue.

    MaxCapacity adalah pilihan yang eksklusif satu sama lain dengan NumberOfWorkers dan WorkerType.

    • Jika NumberOfWorkers atau WorkerType diatur, maka MaxCapacity tidak dapat diatur.

    • Jika MaxCapacity diatur, maka NumberOfWorkers atau WorkerType tidak dapat diatur.

    • Jika WorkerType diatur, maka NumberOfWorkers wajib (dan sebaliknya).

    • MaxCapacity dan NumberOfWorkers, keduanya minimal harus 1.

    Saat bidang WorkerType diatur ke nilai selain Standard, maka bidang MaxCapacity diatur secara otomatis dan menjadi baca-saja.

    Saat bidang WorkerType diatur ke nilai selain Standard, maka bidang MaxCapacity diatur secara otomatis dan menjadi baca-saja.

  • WorkerType – String UTF-8 (nilai yang valid: Standard="" | G.1X="" | G.2X="" | G.025X="" | G.4X="" | G.8X="" | Z.2X="").

    Jenis pekerja yang telah ditetapkan sebelumnya yang dialokasikan ketika tugas ini dieksekusi. Menerima nilai Standard, G.1X, atau G.2X.

    • Untuk jenis pekerja Standard, setiap pekerja menyediakan 4 vCPU, memori 16 GB dan disk 50GB, dan 2 pelaksana per pekerja.

    • Untuk jenis pekerja G.1X, setiap pekerja menyediakan 4 vCPU, memori 16 GB dan disk 64GB, dan 1 pelaksana per pekerja.

    • Untuk jenis pekerja G.2X, setiap pekerja menyediakan 8 vCPU, memori 32 GB dan disk 128GB, dan 1 pelaksana per pekerja.

    MaxCapacity adalah pilihan yang eksklusif satu sama lain dengan NumberOfWorkers dan WorkerType.

    • Jika NumberOfWorkers atau WorkerType diatur, maka MaxCapacity tidak dapat diatur.

    • Jika MaxCapacity diatur, maka NumberOfWorkers atau WorkerType tidak dapat diatur.

    • Jika WorkerType diatur, maka NumberOfWorkers wajib (dan sebaliknya).

    • MaxCapacity dan NumberOfWorkers, keduanya minimal harus 1.

  • NumberOfWorkers — Nomor (bilangan bulat).

    Jumlah pekerja dari workerType ditentukan yang dialokasikan ketika tugas ini dieksekusi.

    Jika WorkerType diatur, maka NumberOfWorkers wajib (dan sebaliknya).

  • Timeout — Nomor (bilangan bulat), minimal 1.

    Waktu habis untuk eksekusi tugas untuk transformasi ini, dalam satuan menit. Ini adalah waktu maksimum yang bisa digunakan oleh eksekusi tugas untuk transformasi ini untuk menggunakan sumber daya sebelum eksekusi dihentikan dan memasuki status TIMEOUT. Nilai default-nya adalah 2.880 menit (48 jam).

  • MaxRetries — Nomor (bilangan bulat).

    Jumlah percobaan maksimum untuk mencoba kembali tugas untuk transformasi ini setelah eksekusi tugas gagal.

  • Tags — Sebuah rangkaian peta pasangan nilai kunci, tidak lebih dari 50 pasang.

    Masing-masing kunci adalah sebuah string UTF-8, dengan panjang tidak kurang dari 1 atau lebih dari 128 byte.

    Masing-masing kunci adalah sebuah string UTF-8, dengan panjang tidak lebih dari 256 byte.

    Tag yang akan digunakan dengan transformasi machine learning ini. Anda dapat menggunakan tag untuk membatasi akses ke transformasi machine learning tersebut. Untuk informasi selengkapnya tentang AWS tag AWS Glue, lihat Tag AWS Glue di panduan pengembang.

  • TransformEncryption — Sebuah objek TransformEncryption.

    encryption-at-rest Pengaturan transformasi yang berlaku untuk mengakses data pengguna. Transformasi machine learning dapat mengakses data pengguna yang dienkripsi di Amazon S3 menggunakan KMS.

Respons
  • TransformId — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Sebuah pengenal unik yang dihasilkan untuk transformasi.

Kesalahan
  • AlreadyExistsException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

  • AccessDeniedException

  • ResourceNumberLimitExceededException

  • IdempotentParameterMismatchException

Tindakan updateMLTransform (Python: update_ml_transform)

Memperbarui transformasi machine learning yang ada. Panggil operasi ini untuk menyetel parameter algoritme untuk mencapai hasil yang lebih baik.

Setelah memanggil operasi ini, Anda dapat memanggil operasi StartMLEvaluationTaskRun untuk menilai seberapa baik parameter baru Anda mencapai tujuan Anda (seperti meningkatkan kualitas transformasi machine learning Anda, atau membuatnya menjadi lebih hemat biaya).

Permintaan
  • TransformIdWajib: String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Pengenal unik yang dihasilkan saat transformasi dibuat.

  • Name — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Nama unik yang Anda berikan pada transformasi saat Anda membuatnya.

  • Description — String deskripsi, dengan panjang tidak lebih dari 2048 byte, yang cocok dengan URI address multi-line string pattern.

    Sebuah deskripsi transformasi. Default-nya adalah string kosong.

  • Parameters — Sebuah objek TransformParameters.

    Parameter konfigurasi yang spesifik untuk jenis transformasi (algoritme) yang digunakan. Secara kondisional tergantung pada jenis transformasi.

  • Role – String UTF-8.

    Nama atau Amazon Resource Name (ARN) dari IAM role dengan izin yang diperlukan.

  • GlueVersion — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Custom string pattern #20.

    Nilai ini menentukan versi transformasi pembelajaran mesin AWS Glue ini yang kompatibel. Glue 1.0 direkomendasikan untuk sebagian besar pelanggan. Jika nilai tidak diatur, maka kompatibilitas Glue secara default diatur ke Glue 0.9. Untuk informasi selengkapnya, lihat Versi AWS Glue dalam panduan developer.

  • MaxCapacity — Nomor (ganda).

    Jumlah unit pemrosesan AWS Glue data (DPU) yang dialokasikan untuk tugas berjalan untuk transformasi ini. Anda dapat mengalokasikan dari 2 hingga 100 DPU; default-nya adalah 10. DPU adalah ukuran relatif daya pemrosesan yang terdiri dari 4 vCPU kapasitas komputasi dan 16 GB memori. Untuk informasi lebih lanjut, lihat halaman harga AWS Glue.

    Saat bidang WorkerType diatur ke nilai selain Standard, maka bidang MaxCapacity diatur secara otomatis dan menjadi baca-saja.

  • WorkerType – String UTF-8 (nilai yang valid: Standard="" | G.1X="" | G.2X="" | G.025X="" | G.4X="" | G.8X="" | Z.2X="").

    Jenis pekerja yang telah ditetapkan sebelumnya yang dialokasikan ketika tugas ini dieksekusi. Menerima nilai Standard, G.1X, atau G.2X.

    • Untuk jenis pekerja Standard, setiap pekerja menyediakan 4 vCPU, memori 16 GB dan disk 50GB, dan 2 pelaksana per pekerja.

    • Untuk jenis pekerja G.1X, setiap pekerja menyediakan 4 vCPU, memori 16 GB dan disk 64GB, dan 1 pelaksana per pekerja.

    • Untuk jenis pekerja G.2X, setiap pekerja menyediakan 8 vCPU, memori 32 GB dan disk 128GB, dan 1 pelaksana per pekerja.

  • NumberOfWorkers — Nomor (bilangan bulat).

    Jumlah pekerja dari workerType ditentukan yang dialokasikan ketika tugas ini dieksekusi.

  • Timeout — Nomor (bilangan bulat), minimal 1.

    Waktu habis untuk sebuah eksekusi tugas untuk transformasi ini, dalam satuan menit. Ini adalah waktu maksimum yang bisa digunakan oleh eksekusi tugas untuk transformasi ini untuk menggunakan sumber daya sebelum eksekusi dihentikan dan memasuki status TIMEOUT. Nilai default-nya adalah 2.880 menit (48 jam).

  • MaxRetries — Nomor (bilangan bulat).

    Jumlah percobaan maksimum untuk mencoba kembali tugas untuk transformasi ini setelah eksekusi tugas gagal.

Respons
  • TransformId — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Pengidentifikasi unik untuk transformasi yang sudah diperbarui.

Kesalahan
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

  • AccessDeniedException

Tindakan DeletemlTransform (Python: delete_ml_transform)

Menghapus transformasi pembelajaran AWS Glue mesin. Transformasi machine learning adalah jenis transformasi khusus yang menggunakan machine learning untuk mempelajari detail transformasi yang akan dilakukan dengan belajar dari contoh yang diberikan oleh manusia. Transformasi ini kemudian diselamatkan oleh AWS Glue. Jika Anda tidak lagi memerlukan sebuah transformasi, maka Anda dapat menghapusnya dengan memanggil DeleteMLTransforms. Namun, AWS Glue pekerjaan apa pun yang masih mereferensikan transformasi yang dihapus tidak akan berhasil lagi.

Permintaan
  • TransformIdWajib: String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Pengidentifikasi unik dari transformasi yang akan dihapus.

Respons
  • TransformId — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Pengidentifikasi unik dari transformasi yang sudah dihapus.

Kesalahan
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

Tindakan getmlTransform (Python: get_ml_transform)

Mendapat artefak transformasi pembelajaran AWS Glue mesin dan semua metadata yang sesuai. Transformasi machine learning adalah jenis transformasi khusus yang menggunakan machine learning untuk mempelajari detail transformasi yang akan dilakukan dengan belajar dari contoh yang diberikan oleh manusia. Transformasi ini kemudian diselamatkan oleh AWS Glue. Anda dapat mengambil metadata mereka dengan memanggil GetMLTransform.

Permintaan
  • TransformIdWajib: String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Pengidentifikasi unik transformasi, yang dihasilkan pada saat transformasi dibuat.

Respons
  • TransformId — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Pengidentifikasi unik transformasi, yang dihasilkan pada saat transformasi dibuat.

  • Name — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Nama unik yang diberikan pada transformasi saat transformasi tersebut dibuat.

  • Description — String deskripsi, dengan panjang tidak lebih dari 2048 byte, yang cocok dengan URI address multi-line string pattern.

    Sebuah deskripsi transformasi.

  • Status – String UTF-8 (nilai yang valid: NOT_READY | READY | DELETING).

    Status terakhir yang diketahui dari transformasi (untuk menunjukkan apakah transformasi dapat digunakan atau tidak). Salah satu "NOT_READY", "READY", atau "DELETING".

  • CreatedOn — Stempel waktu.

    Tanggal dan waktu saat transformasi dibuat.

  • LastModifiedOn — Stempel waktu.

    Tanggal dan waktu saat transformasi terakhir diubah.

  • InputRecordTables — Susunan objek GlueTable, tidak lebih dari 10 struktur.

    Daftar definisi AWS Glue tabel yang digunakan oleh transformasi.

  • Parameters — Sebuah objek TransformParameters.

    Parameter konfigurasi khusus untuk algoritme yang digunakan.

  • EvaluationMetrics — Sebuah objek EvaluationMetrics.

    Metrik evaluasi terbaru.

  • LabelCount — Nomor (bilangan bulat).

    Jumlah label yang tersedia untuk transformasi ini.

  • Schema — Susunan objek SchemaColumn, tidak lebih dari 100 struktur.

    Objek Map<Column, Type> yang mewakili skema yang diterima transformasi ini. Memiliki batas atas 100 kolom.

  • Role – String UTF-8.

    Nama atau Amazon Resource Name (ARN) dari IAM role dengan izin yang diperlukan.

  • GlueVersion — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Custom string pattern #20.

    Nilai ini menentukan versi transformasi pembelajaran mesin AWS Glue ini yang kompatibel. Glue 1.0 direkomendasikan untuk sebagian besar pelanggan. Jika nilai tidak diatur, maka kompatibilitas Glue secara default diatur ke Glue 0.9. Untuk informasi selengkapnya, lihat Versi AWS Glue dalam panduan developer.

  • MaxCapacity — Nomor (ganda).

    Jumlah unit pemrosesan AWS Glue data (DPU) yang dialokasikan untuk tugas berjalan untuk transformasi ini. Anda dapat mengalokasikan dari 2 hingga 100 DPU; default-nya adalah 10. DPU adalah ukuran relatif daya pemrosesan yang terdiri dari 4 vCPU kapasitas komputasi dan 16 GB memori. Untuk informasi lebih lanjut, lihat halaman harga AWS Glue.

    Saat bidang WorkerType diatur ke nilai selain Standard, maka bidang MaxCapacity diatur secara otomatis dan menjadi baca-saja.

  • WorkerType – String UTF-8 (nilai yang valid: Standard="" | G.1X="" | G.2X="" | G.025X="" | G.4X="" | G.8X="" | Z.2X="").

    Jenis pekerja yang telah ditetapkan sebelumnya yang dialokasikan ketika tugas ini dieksekusi. Menerima nilai Standard, G.1X, atau G.2X.

    • Untuk jenis pekerja Standard, setiap pekerja menyediakan 4 vCPU, memori 16 GB dan disk 50GB, dan 2 pelaksana per pekerja.

    • Untuk jenis pekerja G.1X, setiap pekerja menyediakan 4 vCPU, memori 16 GB dan disk 64GB, dan 1 pelaksana per pekerja.

    • Untuk jenis pekerja G.2X, setiap pekerja menyediakan 8 vCPU, memori 32 GB dan disk 128GB, dan 1 pelaksana per pekerja.

  • NumberOfWorkers — Nomor (bilangan bulat).

    Jumlah pekerja dari workerType ditentukan yang dialokasikan ketika tugas ini dieksekusi.

  • Timeout — Nomor (bilangan bulat), minimal 1.

    Waktu habis untuk sebuah eksekusi tugas untuk transformasi ini, dalam satuan menit. Ini adalah waktu maksimum yang bisa digunakan oleh eksekusi tugas untuk transformasi ini untuk menggunakan sumber daya sebelum eksekusi dihentikan dan memasuki status TIMEOUT. Nilai default-nya adalah 2.880 menit (48 jam).

  • MaxRetries — Nomor (bilangan bulat).

    Jumlah percobaan maksimum untuk mencoba kembali tugas untuk transformasi ini setelah eksekusi tugas gagal.

  • TransformEncryption — Sebuah objek TransformEncryption.

    encryption-at-rest Pengaturan transformasi yang berlaku untuk mengakses data pengguna. Transformasi machine learning dapat mengakses data pengguna yang dienkripsi di Amazon S3 menggunakan KMS.

Kesalahan
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

Tindakan getmlTransforms (Python: get_ml_transforms)

Mendapat daftar transformasi pembelajaran AWS Glue mesin yang dapat diurutkan dan dapat disaring. Transformasi machine learning adalah jenis transformasi khusus yang menggunakan machine learning untuk mempelajari detail transformasi yang akan dilakukan dengan belajar dari contoh yang diberikan oleh manusia. Transformasi ini kemudian disimpan oleh AWS Glue, dan Anda dapat mengambil metadata mereka dengan menelepon. GetMLTransforms

Permintaan
  • NextToken – String UTF-8.

    Sebuah token pemberian nomor halaman untuk mengimbangi hasil.

  • MaxResults — Nomor (bilangan bulat), tidak kurang dari 1 atau lebih dari 1000.

    Jumlah hasil maksimum yang akan dikembalikan.

  • Filter — Sebuah objek TransformFilterKriteria.

    Kriteria transformasi filter.

  • Sort — Sebuah objek TransformSortKriteria.

    Kriteria pengurutan.

Respons
  • TransformsWajib: Susunan objek MLTransform.

    Sebuah daftar transformasi machine learning.

  • NextToken – String UTF-8.

    Sebuah token pemberian nomor halaman, jika ada lebih banyak hasil yang tersedia.

Kesalahan
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

Tindakan ListmlTransforms (Python: list_ml_transforms)

Mengambil daftar yang dapat diurutkan dan disaring dari transformasi pembelajaran AWS Glue mesin yang ada di AWS akun ini, atau sumber daya dengan tag yang ditentukan. Operasi ini mengambil kolom Tags opsional, yang dapat Anda gunakan sebagai sebuah filter respon sehingga tag sumber daya dapat diambil sebagai sebuah grup. Jika Anda memilih untuk menggunakan pem-filter-an tag, maka hanya sumber daya dengan tag saja yang diambil.

Permintaan
  • NextToken – String UTF-8.

    Sebuah token kelanjutan, jika ini adalah permintaan kelanjutan.

  • MaxResults — Nomor (bilangan bulat), tidak kurang dari 1 atau lebih dari 1000.

    Ukuran maksimum daftar yang akan dikembalikan.

  • Filter — Sebuah objek TransformFilterKriteria.

    Sebuah TransformFilterCriteria yang digunakan untuk mem-filter transformasi machine learning.

  • Sort — Sebuah objek TransformSortKriteria.

    Sebuah TransformSortCriteria yang digunakan untuk mengurutkan transformasi machine learning.

  • Tags — Sebuah rangkaian peta pasangan nilai kunci, tidak lebih dari 50 pasang.

    Masing-masing kunci adalah sebuah string UTF-8, dengan panjang tidak kurang dari 1 atau lebih dari 128 byte.

    Masing-masing kunci adalah sebuah string UTF-8, dengan panjang tidak lebih dari 256 byte.

    Menentukan untuk mengembalikan hanya sumber daya ditandai saja.

Respons
  • TransformIdsWajib: Susunan string UTF-8.

    Pengidentifikasi semua transformasi machine learning dalam akun, atau transformasi machine learning dengan tag yang ditentukan.

  • NextToken – String UTF-8.

    Sebuah token kelanjutan, jika daftar yang dikembalikan tidak berisi metrik terakhir yang tersedia.

Kesalahan
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

EvaluationTaskRun Tindakan startML (Python: start_ml_evaluation_task_run)

Memulai tugas untuk memperkirakan kualitas transformasi.

Ketika Anda memberikan set label sebagai contoh kebenaran, pembelajaran AWS Glue mesin menggunakan beberapa contoh tersebut untuk belajar darinya. Selebihnya label digunakan sebagai pengujian untuk memperkirakan kualitas.

Mengembalikan sebuah pengidentifikasi unik untuk eksekusi. Anda dapat memanggil GetMLTaskRun untuk mendapatkan informasi lebih lanjut tentang statistik EvaluationTaskRun.

Permintaan
  • TransformIdWajib: String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Pengidentifikasi unik dari transformasi machine learning.

Respons
  • TaskRunId — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Pengidentifikasi unik yang terkait dengan eksekusi ini.

Kesalahan
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

  • ConcurrentRunsExceededException

  • MLTransformNotReadyException

LabelingSetGenerationTaskRun Tindakan startML (Python: start_ml_labeling_set_generation_task_run)

Memulai alur kerja pembelajaran aktif untuk transformasi machine learning Anda untuk meningkatkan kualitas transformasi dengan menghasilkan set label dan menambahkan label.

Saat StartMLLabelingSetGenerationTaskRun selesai, AWS Glue akan menghasilkan "set pelabelan" atau serangkaian pertanyaan yang harus dijawab oleh manusia.

Dalam kasus transformasi FindMatches, pertanyaan-pertanyaan ini berbentuk, "Apa cara yang benar untuk mengelompokkan baris ini bersama-sama ke dalam grup yang seluruhnya terdiri dari catatan yang cocok?"

Setelah proses pelabelan selesai, Anda dapat mengunggah label Anda dengan memanggil StartImportLabelsTaskRun. Setelah StartImportLabelsTaskRun selesai, semua eksekusi transformasi machine learning di masa depan akan menggunakan label baru dan yang telah ditingkatkan dan melakukan transformasi kualitas yang lebih tinggi.

Permintaan
  • TransformIdWajib: String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Pengidentifikasi unik dari transformasi machine learning.

  • OutputS3PathWajib: String UTF-8.

    Path Amazon Simple Storage Service (Amazon S3) tempat Anda membuat set pelabelan.

Respons
  • TaskRunId — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Pengidentifikasi eksekusi unik yang dikaitkan dengan eksekusi tugas ini.

Kesalahan
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

  • ConcurrentRunsExceededException

TaskRun Tindakan GetMl (Python: get_ml_task_run)

Mendapatkan detail untuk eksekusi tugas tertentu pada sebuah transformasi machine learning. Proses tugas pembelajaran mesin adalah tugas asinkron yang AWS Glue berjalan atas nama Anda sebagai bagian dari berbagai alur kerja pembelajaran mesin. Anda dapat memeriksa statistik dari setiap tugas yang dijalankan dengan memanggil GetMLTaskRun dengan TaskRunID dan TransformID dari transformasi induknya.

Permintaan
  • TransformIdWajib: String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Pengidentifikasi unik dari transformasi machine learning.

  • TaskRunIdWajib: String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Pengidentifikasi unik eksekusi tugas.

Respons
  • TransformId — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Pengidentifikasi unik eksekusi tugas.

  • TaskRunId — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Pengidentifikasi eksekusi unik yang dikaitkan dengan eksekusi ini.

  • Status – String UTF-8 (nilai yang valid: STARTING | RUNNING | STOPPING | STOPPED | SUCCEEDED | FAILED | TIMEOUT).

    Status untuk eksekusi tugas ini.

  • LogGroupName – String UTF-8.

    Nama-nama grup log yang dikaitkan dengan eksekusi tugas.

  • Properties — Sebuah objek TaskRunProperti.

    Daftar properti yang dikaitkan dengan eksekusi tugas.

  • ErrorString – String UTF-8.

    String kesalahan yang dikaitkan dengan eksekusi tugas.

  • StartedOn — Stempel waktu.

    Tanggal dan waktu ketika eksekusi tugas ini dimulai.

  • LastModifiedOn — Stempel waktu.

    Tanggal dan waktu ketika eksekusi tugas ini terakhir diubah.

  • CompletedOn — Stempel waktu.

    Tanggal dan waktu ketika eksekusi tugas ini selesai.

  • ExecutionTime — Nomor (bilangan bulat).

    Jumlah waktu (dalam satuan detik) di mana eksekusi tugas ini menggunakan sumber daya.

Kesalahan
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

TaskRuns Tindakan GetMl (Python: get_ml_task_runs)

Mendapatkan sebuah daftar eksekusi untuk transformasi machine learning. Proses tugas pembelajaran mesin adalah tugas asinkron yang AWS Glue berjalan atas nama Anda sebagai bagian dari berbagai alur kerja pembelajaran mesin. Anda bisa mendapatkan daftar tugas machine learning yang dapat diurutkan dan disaring dengan memanggil GetMLTaskRuns dengan TransformID dari transformasi induknya dan parameter opsional lainnya seperti yang didokumentasikan di bagian ini.

Operasi ini mengembalikan daftar eksekusi historis dan harus diberi nomor halaman.

Permintaan
  • TransformIdWajib: String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Pengidentifikasi unik dari transformasi machine learning.

  • NextToken – String UTF-8.

    Sebuah token untuk pemberian nomor halaman hasil. Nilai default adalah (kosong).

  • MaxResults — Nomor (bilangan bulat), tidak kurang dari 1 atau lebih dari 1000.

    Jumlah hasil maksimum yang akan dikembalikan.

  • Filter — Sebuah objek TaskRunFilterCriteria.

    Kriteria filter, dalam struktur TaskRunFilterCriteria, untuk eksekusi tugas.

  • Sort — Sebuah objek TaskRunSortCriteria.

    Kriteria pengurutan, dalam struktur TaskRunSortCriteria, untuk eksekusi tugas.

Respons
  • TaskRuns – Susunan objek TaskRun.

    Daftar eksekusi tugas yang dikaitkan dengan transformasi.

  • NextToken – String UTF-8.

    Sebuah token pemberian nomor halaman, jika ada lebih banyak hasil yang tersedia.

Kesalahan
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

TaskRun Tindakan CancelMl (Python: cancel_ml_task_run)

Membatalkan (menghentikan) sebuah eksekusi tugas. Proses tugas pembelajaran mesin adalah tugas asinkron yang AWS Glue berjalan atas nama Anda sebagai bagian dari berbagai alur kerja pembelajaran mesin. Anda dapat membatalkan sebuah eksekusi tugas machine learning kapan saja dengan memanggil CancelMLTaskRun dengan TransformID transformasi induk dari sebuah eksekusi tugas dan TaskRunId dari eksekusi tugas.

Permintaan
  • TransformIdWajib: String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Pengidentifikasi unik dari transformasi machine learning.

  • TaskRunIdWajib: String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Sebuah pengidentifikasi unik untuk eksekusi tugas.

Respons
  • TransformId — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Pengidentifikasi unik dari transformasi machine learning.

  • TaskRunId — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Pengidentifikasi unik untuk eksekusi tugas.

  • Status – String UTF-8 (nilai yang valid: STARTING | RUNNING | STOPPING | STOPPED | SUCCEEDED | FAILED | TIMEOUT).

    Status untuk eksekusi ini.

Kesalahan
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

StartExportLabelsTaskRun tindakan (Python: start_export_labels_task_run)

Memulai tugas asinkron untuk mengekspor semua data berlabel untuk sebuah transformasi tertentu. Tugas ini adalah satu-satunya panggilan API terkait label yang bukan merupakan bagian dari alur kerja pembelajaran yang tipikal. Anda biasanya menggunakan StartExportLabelsTaskRun saat Anda ingin bekerja dengan semua label yang ada pada saat yang sama, seperti saat Anda ingin menghapus atau mengubah label yang sebelumnya dikirimkan sebagai kebenaran. Operasi API ini menerima TransformId yang labelnya ingin Anda ekspor dan path Amazon Simple Storage Service (Amazon S3) yang akan digunakan untuk mengekspor label. Operasi tersebut mengembalikan TaskRunId. Anda dapat memeriksa status dari eksekusi tugas Anda dengan memanggil API GetMLTaskRun.

Permintaan
  • TransformIdWajib: String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Pengidentifikasi unik dari transformasi machine learning.

  • OutputS3PathWajib: String UTF-8.

    Path Amazon S3 di mana Anda mengekspor label.

Respons
  • TaskRunId — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Pengidentifikasi unik untuk eksekusi tugas.

Kesalahan
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

StartImportLabelsTaskRun tindakan (Python: start_import_labels_task_run)

Memungkinkan Anda untuk memberikan label tambahan (contoh kebenaran) yang akan digunakan untuk mengajarkan transformasi machine learning dan meningkatkan kualitasnya. Operasi API ini pada umumnya digunakan sebagai bagian dari alur kerja pembelajaran aktif yang dimulai dengan panggilan StartMLLabelingSetGenerationTaskRun dan yang akhirnya menghasilkan peningkatan kualitas pada transformasi machine learning Anda.

Setelah StartMLLabelingSetGenerationTaskRun selesai, machine learning AWS Glue akan menghasilkan serangkaian pertanyaan yang akan dijawab oleh manusia. (Menjawab pertanyaan-pertanyaan ini sering disebut 'pelabelan' dalam alur kerja machine learning). Dalam kasus transformasi FindMatches, pertanyaan-pertanyaan ini berbentuk, "Apa cara yang benar untuk mengelompokkan baris ini bersama-sama ke dalam grup yang seluruhnya terdiri dari catatan yang cocok?" Setelah proses pelabelan selesai, pengguna mengunggah jawaban/label mereka dengan sebuah panggilan ke StartImportLabelsTaskRun. Setelah StartImportLabelsTaskRun selesai, semua eksekusi transformasi machine learning di masa depan menggunakan label baru dan yang telah ditingkatkan dan melakukan transformasi kualitas yang lebih tinggi.

Secara default, StartMLLabelingSetGenerationTaskRun terus belajar dari dan menggabungkan semua label yang Anda unggah kecuali Anda mengatur Replace ke BETUL. Jika Anda mengatur Replace ke BETUL, StartImportLabelsTaskRun akan menghapus dan melupakan semua label yang diunggah sebelumnya dan hanya belajar hanya dari set yang Anda unggah. Mengganti label dapat membantu jika Anda menyadari bahwa Anda sebelumnya mengunggah label yang salah, dan Anda meyakini bahwa label tersebut memiliki efek negatif pada kualitas transformasi Anda.

Anda dapat memeriksa status dari eksekusi tugas Anda dengan memanggil operasi GetMLTaskRun.

Permintaan
  • TransformIdWajib: String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Pengidentifikasi unik dari transformasi machine learning.

  • InputS3PathWajib: String UTF-8.

    Path Amazon Simple Storage Service (Amazon S3) tempat Anda mengimpor label.

  • ReplaceAllLabels – Boolean.

    Menunjukkan apakah akan menimpa label yang ada.

Respons
  • TaskRunId — String UTF-8, sepanjang tidak kurang dari 1 atau lebih dari 255 byte, yang cocok dengan Single-line string pattern.

    Pengidentifikasi unik untuk eksekusi tugas.

Kesalahan
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • ResourceNumberLimitExceededException

  • InternalServiceException