機器學習 API - AWS Glue

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

機器學習 API

機器學習 API 說明機器學習資料類型,包含建立、刪除或更新轉換或啟動機器學習任務執行的 API。

資料類型

TransformParameters 結構

與機器學習轉換相關聯的演算法特定參數。

欄位
  • TransformType必要:UTF-8 字串 (有效值:FIND_MATCHES)。

    機器學習轉換的類型。

    如需機器學習轉換類型的資訊,請參閱建立機器學習轉換

  • FindMatchesParametersFindMatches參數 物件。

    find matches 演算法的參數。

EvaluationMetrics 結構

評估指標會提供機器學習轉換品質的預估值。

欄位
  • TransformType必要:UTF-8 字串 (有效值:FIND_MATCHES)。

    機器學習轉換的類型。

  • FindMatchesMetricsFindMatches度量 物件。

    find matches 演算法的評估指標。

MLTransform 結構

機器學習轉換的結構。

欄位
  • TransformId – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    針對機器學習轉換產生的唯一轉換 ID。此 ID 保證是唯一的,且不會變更。

  • Name – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    機器學習轉換的使用者定義名稱。名稱不保證唯一,且可隨時變更。

  • Description – 描述字串,長度不可超過 2048 個位元組,需符合URI address multi-line string pattern

    機器學習轉換的使用者定義描述長文。描述不保證唯一,且可隨時變更。

  • Status – UTF-8 字串 (有效值:NOT_READY | READY | DELETING)。

    機器學習轉換目前的狀態。

  • CreatedOn – 時間戳記。

    時間戳記。此機器學習轉換建立的時間和日期。

  • LastModifiedOn – 時間戳記。

    時間戳記。此機器學習轉換最後一次修改的時間點。

  • InputRecordTables – 一個 GlueTable 物件陣列,不可超過 10 個結構。

    轉換所使用的 AWS Glue 資料表定義清單。

  • ParametersTransformParameters 物件。

    TransformParameters 物件。您可以透過指定學習資料和各種權衡的偏好設定 (如精確率與回收率,或準確性與成本),使用參數來調整 (自訂) 機器學習轉換的行為。

  • EvaluationMetricsEvaluationMetrics 物件。

    EvaluationMetrics 物件。評估指標會提供機器學習轉換品質的預估值。

  • LabelCount – 數字 (整數)。

    針對此轉換產生的標籤檔案的 AWS Glue 計數識別碼。當您建立更佳的轉換時,您就可以反覆下載、標記和上傳標記檔案。

  • Schema – 一個 SchemaColumn 物件陣列,不可超過 100 個結構。

    表示欄和資料類型的鍵/值對映射,可以執行此轉換。已有 100 個欄的上限。

  • Role – UTF-8 字串。

    IAM 角色的名稱或 Amazon Resource Name (ARN) 與所需的許可。所需許可包括 AWS Glue 資源的 AWS Glue 服務角色許可,以及轉換所需的 Amazon S3 許可。

    • 此角色需要 AWS Glue 服務角色權限才能允許存取中的資源 AWS Glue。請參閱連接政策到存取 AWS Glue的 IAM 使用者

    • 此角色需要此轉換任務回合所用的 Amazon Simple Storage Service (Amazon S3) 來源、目標、暫時目錄、指令碼和任何程式庫的許可。

  • GlueVersion – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Custom string pattern #20

    此值決定 AWS Glue 此機器學習轉換與哪個版本相容。Glue 1.0 是建議大多數客戶使用的版本。如果未設定此值,Glue 相容性預設為 Glue 0.9。如需詳細資訊,請參閱開發人員指南中的 AWS Glue 版本

  • MaxCapacity – 數字 (雙位數)。

    為此轉換配置給工作執行的 AWS Glue 資料處理單元 (DPU) 數目。您可以分配從 2 到 100 個 DPU,預設值為 10。DPU 是相對的處理能力,包含 4 個 vCPU 的運算容量和 16 GB 的記憶體。如需詳細資訊,請參閱 AWS Glue 定價頁面

    MaxCapacityNumberOfWorkersWorkerType 的互斥選項。

    • 如果設定 NumberOfWorkersWorkerType,則無法設定 MaxCapacity

    • 如果設定 MaxCapacity,則無法設定 NumberOfWorkersWorkerType

    • 如果設定 WorkerType,則 NumberOfWorkers 為必要 (反之亦然)。

    • MaxCapacityNumberOfWorkers 都必須至少為 1。

    如果 WorkerType 欄位設成 Standard 以外的值,就會自動設定 MaxCapacity 欄位並且變成唯讀。

  • WorkerType – UTF-8 字串 (有效值:Standard="" | G.1X="" | G.2X="" | G.025X="" | G.4X="" | G.8X="" | Z.2X="")。

    此轉換執行任務時所配置的預先定義工作者類型。可接受值為標準、G.1X 或 G.2X

    • 用於 Standard 工作者類型時,每個工作者提供 4 個 vCPU、16 GB 的記憶體和 50 GB 磁碟,以及每個工作者 2 個執行器。

    • 用於 G.1X 工作者類型時,每個工作者提供 4 個 vCPU、16 GB 的記憶體和 64 GB 磁碟,以及每個工作者 1 個執行器。

    • 用於 G.2X 工作者類型時,每個工作者提供 8 個 vCPU、32 GB 的記憶體和 128 GB 磁碟,以及每個工作者 1 個執行器。

    MaxCapacityNumberOfWorkersWorkerType 的互斥選項。

    • 如果設定 NumberOfWorkersWorkerType,則無法設定 MaxCapacity

    • 如果設定 MaxCapacity,則無法設定 NumberOfWorkersWorkerType

    • 如果設定 WorkerType,則 NumberOfWorkers 為必要 (反之亦然)。

    • MaxCapacityNumberOfWorkers 都必須至少為 1。

  • NumberOfWorkers – 數字 (整數)。

    轉換執行任務時所配置的已定義 workerType 工作者數量。

    如果設定 WorkerType,則 NumberOfWorkers 為必要 (反之亦然)。

  • Timeout – 數字 (整數),至少為 1。

    機器學習轉換的逾時,以分鐘計。

  • MaxRetries – 數字 (整數)。

    機器學習轉換 MLTaskRun 失敗後的重試次數上限。

  • TransformEncryptionTransformEncryption 物件。

    適用於存取使用者資料的轉換 encryption-at-rest 設定。機器學習轉換可以使用 KMS 存取 Amazon S3 中加密的使用者資料。

FindMatchesParameters 結構

設定 find matches 轉換的參數。

欄位
  • PrimaryKeyColumnName – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 1024 個位元組,需符合 Single-line string pattern

    唯一識別來源資料表中資料列的欄名。用於協助識別相符的記錄。

  • PrecisionRecallTradeoff – 數字 (double),不可大於 1.0。

    調校轉換以取得精確率與回收率平衡時所選取的值。值為 0.5 表示無偏好;值為 1.0 表示專門針對精確率的偏差;值為 0.0 表示針對回收率的偏差。因為這是一種權衡,選擇接近 1.0 的值表示非常低的回收率,選擇接近 0.0 的值則會得到非常低的精確率。

    精確率指標指出模型預測相符項目時的正確頻率。

    回收率指標表示針對實際比對,模型預測相符項目的頻率。

  • AccuracyCostTradeoff – 數字 (double),不可大於 1.0。

    調校轉換以取得準確性與成本平衡時所選取的值。值為 0.5 表示系統持平考量準確性與成本。值為 1.0 表示專門針對準確性的偏差,這通常會導致較高的成本,有時會非常高。值為 0.0 表示專門針對成本的偏差,這會導致低準確性的 FindMatches 轉換,有時是無法接受的準確性。

    Accuracy (準確性) 會測量轉換找到真肯定和真否定的效果有多好。提高正確性需要更多的機器資源和成本。但也會增加回收率。

    成本會測量執行轉換要消耗多少運算資源上,以此計算出金額。

  • EnforceProvidedLabels – 布林值。

    值,開啟或關閉以強制輸出符合使用者提供的標籤。如果此值為 True,則 find matches 轉換會強制輸出符合提供的標籤。結果會覆寫正常的合併結果。如果此值為 False,則 find matches 轉換不確保遵守所有提供的標籤,結果會倚賴訓練過的模型。

    請注意,將此值設定為 true 可能會增加合併執行的時間。

FindMatchesMetrics 結構

find matches 演算法的評估指標。測量機器學習轉換品質的方式,是讓您的轉換預測一些相符項目,並比較此結果與相同資料集的已知相符項目。品質指標是以您的部分資料為基礎,所以不精確。

欄位
  • AreaUnderPRCurve – 數字 (double),不可大於 1.0。

    在精確率/回收率曲線 (AUPRC) 下的區域是測量轉換整體品質的單一數字,與精確率與回收率的選擇無關。較高的值表示您有較具吸引力的精確率與回收率權衡。

    如需詳細資訊,請參閱 Wikipedia 中的 Precision and recall

  • Precision – 數字 (double),不可大於 1.0。

    精確率指標指出轉換預測相符項目的正確頻率。尤其,它會測量轉換從真陽性總可能性中找出真陽性的效果有多好。

    如需詳細資訊,請參閱 Wikipedia 中的 Precision and recall

  • Recall – 數字 (double),不可大於 1.0。

    回收率指標表示針對實際比對,轉換預測相符項目的頻率。尤其,它會測量轉換從來源資料總記錄中找出真陽性的效果有多好。

    如需詳細資訊,請參閱 Wikipedia 中的 Precision and recall

  • F1 – 數字 (double),不可大於 1.0。

    F1 指標上限指出轉換的準確性介於 0 和 1 之間,其中 1 為最佳準確性。

    如需詳細資訊,請參閱 Wikipedia 中的 F1 score

  • ConfusionMatrixConfusionMatrix 物件。

    混淆矩陣會顯示轉換準確預測的內容及其產生的錯誤類型。

    如需詳細資訊,請參閱 Wikipedia 的 Confusion matrix

  • ColumnImportances – 一個 ColumnImportance 物件陣列,不可超過 100 個結構。

    ColumnImportance 結構的清單,包含欄重要性指標,依重要性遞減順序排序。

ConfusionMatrix 結構

混淆矩陣會顯示轉換準確預測的內容及其產生的錯誤類型。

如需詳細資訊,請參閱 Wikipedia 的 Confusion matrix

欄位
  • NumTruePositives – 數字 (long)。

    在您轉換的混淆矩陣中,轉換在資料中正確找到的相符項目數量。

  • NumFalsePositives – 數字 (long)。

    在您轉換的混淆矩陣中,轉換在資料中誤分類為相符項目的非相符項目數量。

  • NumTrueNegatives – 數字 (long)。

    在您轉換的混淆矩陣中,轉換在資料中正確拒絕的非相符項目數量。

  • NumFalseNegatives – 數字 (long)。

    在您轉換的混淆矩陣中,轉換在資料中沒找到的相符項目數量。

GlueTable 結構

中用於輸入或輸出資料的資料庫和表格。 AWS Glue Data Catalog

欄位
  • DatabaseName必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern

    AWS Glue Data Catalog中的資料庫名稱。

  • TableName必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern

    AWS Glue Data Catalog中的資料表名稱。

  • CatalogId – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    AWS Glue Data Catalog的唯一識別符。

  • ConnectionName – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    連至 AWS Glue Data Catalog的連線名稱。

  • AdditionalOptions – 金鑰值對的映射陣列,不少於 1 對,也不可大於 10 對。

    每個金鑰都是 UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    每個值都是描述字串,長度不可超過 2048 個位元組,且需符合 URI address multi-line string pattern

    資料表的其他選項。目前支援兩個金鑰:

    • pushDownPredicate:篩選分割區,而無需列出和讀取資料集中的所有檔案。

    • catalogPartitionPredicate:使用 AWS Glue Data Catalog中的分割區索引以進行伺服器端分割區清理。

TaskRun 結構

與機器學習轉換相關聯的取樣參數。

欄位
  • TransformId – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    轉換的唯一識別符。

  • TaskRunId – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    此任務回合的唯一識別符。

  • Status – UTF-8 字串 (有效值:STARTING | RUNNING | STOPPING | STOPPED | SUCCEEDED | FAILED | TIMEOUT)。

    請求任務回合目前的狀態。

  • LogGroupName – UTF-8 字串。

    與此任務回合相關聯的安全記錄日誌群組名稱。

  • PropertiesTaskRun性質 物件。

    指定與此任務回合相關聯的組態屬性。

  • ErrorString – UTF-8 字串。

    與此任務回合相關聯的錯誤字串清單。

  • StartedOn – 時間戳記。

    此任務回合開始的日期和時間。

  • LastModifiedOn – 時間戳記。

    請求任務回合上次更新的時間點。

  • CompletedOn – 時間戳記。

    請求任務回合上次完成的時間點。

  • ExecutionTime – 數字 (整數)。

    任務執行消耗資源所需的時間 (以秒為單位)。

TransformFilterCriteria 結構

用來篩選機器學習轉換的條件。

欄位
  • Name – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    用來篩選機器學習轉換的唯一轉換名稱。

  • TransformType – UTF-8 字串 (有效值:FIND_MATCHES)。

    用來篩選機器學習轉換的機器學習轉換類型。

  • Status – UTF-8 字串 (有效值:NOT_READY | READY | DELETING)。

    依轉換的上次已知狀態篩選機器學習轉換清單 (以指出轉換是否可用)。"NOT_READY (未就緒)"、"READY (就緒)" 或 "DELETING (正在刪除)" 其中之一。

  • GlueVersion – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Custom string pattern #20

    此值決定 AWS Glue 此機器學習轉換與哪個版本相容。Glue 1.0 是建議大多數客戶使用的版本。如果未設定此值,Glue 相容性預設為 Glue 0.9。如需詳細資訊,請參閱開發人員指南中的 AWS Glue 版本

  • CreatedBefore – 時間戳記。

    轉換建立前的時間和日期。

  • CreatedAfter – 時間戳記。

    轉換建立後的時間和日期。

  • LastModifiedBefore – 時間戳記。

    篩選出上次修改在此日期前的轉換。

  • LastModifiedAfter – 時間戳記。

    篩選出上次修改在此日期後的轉換。

  • Schema – 一個 SchemaColumn 物件陣列,不可超過 100 個結構。

    篩選出具有特定結構描述的資料集。Map<Column, Type> 物件是一個鍵/值對陣列,代表此轉換接受的結構描述,其中 Column 是欄的名稱,Type 是資料類型,例如整數或字串。已有 100 個欄的上限。

TransformSortCriteria 結構

與機器學習轉換相關聯的排序條件。

欄位
  • Column必要:UTF-8 字串 (有效值:NAME | TRANSFORM_TYPE | STATUS | CREATED | LAST_MODIFIED)。

    要用在與機器學習轉換相關聯之排序條件中的欄。

  • SortDirection必要:UTF-8 字串 (有效值:DESCENDING | ASCENDING)。

    要用在與機器學習轉換相關聯之排序條件中的排序方向。

TaskRunFilterCriteria 結構

用來篩選機器學習轉換任務回合的條件。

欄位
  • TaskRunType – UTF-8 字串 (有效值:EVALUATION | LABELING_SET_GENERATION | IMPORT_LABELS | EXPORT_LABELS | FIND_MATCHES)。

    執行的任務類型。

  • Status – UTF-8 字串 (有效值:STARTING | RUNNING | STOPPING | STOPPED | SUCCEEDED | FAILED | TIMEOUT)。

    所執行任務目前的狀態。

  • StartedBefore – 時間戳記。

    篩選出在此日期前開始的任務回合。

  • StartedAfter – 時間戳記。

    篩選出在此日期後開始的任務回合。

TaskRunSortCriteria 結構

用來排序機器學習轉換任務回合清單的排序條件。

欄位
  • Column必要:UTF-8 字串 (有效值:TASK_RUN_TYPE | STATUS | STARTED)。

    用來排序機器學習轉換任務回合清單的欄。

  • SortDirection必要:UTF-8 字串 (有效值:DESCENDING | ASCENDING)。

    用來排序機器學習轉換任務回合清單的排序方向。

TaskRunProperties 結構

任務回合的組態屬性。

欄位
  • TaskType – UTF-8 字串 (有效值:EVALUATION | LABELING_SET_GENERATION | IMPORT_LABELS | EXPORT_LABELS | FIND_MATCHES)。

    執行的任務類型。

  • ImportLabelsTaskRunPropertiesImportLabelsTaskRun性質 物件。

    匯入標籤任務回合的組態屬性。

  • ExportLabelsTaskRunPropertiesExportLabelsTaskRun性質 物件。

    匯出標籤任務回合的組態屬性。

  • LabelingSetGenerationTaskRunPropertiesLabelingSetGenerationTaskRunProperties 物件。

    標籤集產生任務回合的組態屬性。

  • FindMatchesTaskRunPropertiesFindMatchesTaskRun性質 物件。

    Find Matches 任務回合的組態屬性。

FindMatchesTaskRunProperties 結構

指定 Find Matches 任務回合的組態屬性。

欄位
  • JobId – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    Find Matches 任務回合的任務 ID。

  • JobName – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    指派給 Find Matches 任務回合任務的名稱。

  • JobRunId – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    Find Matches 任務回合的任務回合 ID。

ImportLabelsTaskRunProperties 結構

指定匯入標籤任務回合的組態屬性。

欄位
  • InputS3Path – UTF-8 字串。

    Amazon Simple Storage Service (Amazon S3) 路徑,您會由此匯入標籤。

  • Replace – 布林值。

    指出是否覆寫現有的標籤。

ExportLabelsTaskRunProperties 結構

指定匯出標籤任務回合的組態屬性。

欄位
  • OutputS3Path – UTF-8 字串。

    Amazon Simple Storage Service (Amazon S3) 路徑,您會由此匯出標籤。

LabelingSetGenerationTaskRunProperties 結構

指定標籤集產生任務回合的組態屬性。

欄位
  • OutputS3Path – UTF-8 字串。

    Amazon Simple Storage Service (Amazon S3) 路徑,您會在此產生標籤集。

SchemaColumn 結構

鍵/值對,代表要執行此轉換的欄和資料類型。MLTransformSchema 參數最多可包含 100 個這些結構。

欄位
  • Name – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 1024 個位元組,需符合 Single-line string pattern

    欄位的名稱。

  • DataType – UTF-8 字串,長度不可超過 131072 個位元組,需符合Single-line string pattern

    欄中的資料類型。

TransformEncryption 結構

適用於存取使用者資料的轉換 encryption-at-rest 設定。機器學習轉換可以使用 KMS 存取 Amazon S3 中加密的使用者資料。

此外,匯入的標籤和經過訓練的轉換現在可以使用客戶提供的 KMS 金鑰加密。

欄位
  • MlUserDataEncryptionML UserData 加密 物件。

    包含加密模式和客戶提供的 KMS 金鑰 ID 的 MLUserDataEncryption 物件。

  • TaskRunSecurityConfigurationName – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    安全組態的名稱。

毫升UserDataEncryption 結構

適用於存取使用者資料的轉換 encryption-at-rest 設定。

欄位
  • MlUserDataEncryptionMode必要:UTF-8 字串 (有效值:DISABLED | SSE-KMS="SSEKMS")。

    套用至使用者資料的加密模式。有效的 值如下:

    • DISABLED:已停用加密

    • SSEKMS:針對存放在 Amazon S3 中的使用者資料,使用伺服器端加密搭配 AWS Key Management Service (SSE-KMS)。

  • KmsKeyId – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    客戶提供的 KMS 金鑰的 ID。

ColumnImportance 結構

包含欄名稱和欄重要性分數的結構。

欄重要性可協助您了解欄對模型的貢獻方式,藉由識別記錄中的哪些欄比其他欄更重要。

欄位
  • ColumnName – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    欄的名稱。

  • Importance – 數字 (double),不可大於 1.0。

    欄的欄重要性分數 (以十進位形式)。

作業

CreateMLTransform 動作 (Python: create_ml_transform)

建立 AWS Glue 機器學習轉換。此操作會建立轉換及培訓它的所有必要參數。

呼叫此操作,做為使用機器學習轉換程序的第一步 (例如 FindMatches 轉換),以刪除重複的資料。除了想要用於演算法的參數,您還可以提供選用的 Description

您還必須為代表您 AWS Glue 執行的工作指定特定參數,以便從資料中學習並建立高品質的機器學習轉換。這些參數包括 Role,以及選用的 AllocatedCapacityTimeoutMaxRetries。如需詳細資訊,請參閱任務

請求
  • Name必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern

    建立轉換時給予它的唯一名稱。

  • Description – 描述字串,長度不可超過 2048 個位元組,需符合URI address multi-line string pattern

    正在定義的機器學習轉換描述。預設為空字串。

  • InputRecordTables必要:一個 GlueTable 物件陣列,不可超過 10 個結構。

    轉換所使用的 AWS Glue 資料表定義清單。

  • Parameters必要:TransformParameters 物件。

    所用轉換類型的專屬演算法參數。條件性相依於轉換類型。

  • Role必要:UTF-8 字串。

    IAM 角色的名稱或 Amazon Resource Name (ARN) 與所需的許可。所需許可包括 AWS Glue 資源的 AWS Glue 服務角色許可,以及轉換所需的 Amazon S3 許可。

    • 此角色需要 AWS Glue 服務角色權限才能允許存取中的資源 AWS Glue。請參閱連接政策到存取 AWS Glue的 IAM 使用者

    • 此角色需要此轉換任務回合所用的 Amazon Simple Storage Service (Amazon S3) 來源、目標、暫時目錄、指令碼和任何程式庫的許可。

  • GlueVersion – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Custom string pattern #20

    此值決定 AWS Glue 此機器學習轉換與哪個版本相容。Glue 1.0 是建議大多數客戶使用的版本。如果未設定此值,Glue 相容性預設為 Glue 0.9。如需詳細資訊,請參閱開發人員指南中的 AWS Glue 版本

  • MaxCapacity – 數字 (雙位數)。

    為此轉換配置給工作執行的 AWS Glue 資料處理單元 (DPU) 數目。您可以分配從 2 到 100 個 DPU,預設值為 10。DPU 是相對的處理能力,包含 4 個 vCPU 的運算容量和 16 GB 的記憶體。如需詳細資訊,請參閱 AWS Glue 定價頁面

    MaxCapacityNumberOfWorkersWorkerType 的互斥選項。

    • 如果設定 NumberOfWorkersWorkerType,則無法設定 MaxCapacity

    • 如果設定 MaxCapacity,則無法設定 NumberOfWorkersWorkerType

    • 如果設定 WorkerType,則 NumberOfWorkers 為必要 (反之亦然)。

    • MaxCapacityNumberOfWorkers 都必須至少為 1。

    如果 WorkerType 欄位設成 Standard 以外的值,就會自動設定 MaxCapacity 欄位並且變成唯讀。

    如果 WorkerType 欄位設成 Standard 以外的值,就會自動設定 MaxCapacity 欄位並且變成唯讀。

  • WorkerType – UTF-8 字串 (有效值:Standard="" | G.1X="" | G.2X="" | G.025X="" | G.4X="" | G.8X="" | Z.2X="")。

    執行此任務時所配置的預先定義工作者類型。可接受值為標準、G.1X 或 G.2X

    • 用於 Standard 工作者類型時,每個工作者提供 4 個 vCPU、16 GB 的記憶體和 50 GB 磁碟,以及每個工作者 2 個執行器。

    • 用於 G.1X 工作者類型時,每個工作者提供 4 個 vCPU、16 GB 的記憶體和 64 GB 磁碟,以及每個工作者 1 個執行器。

    • 用於 G.2X 工作者類型時,每個工作者提供 8 個 vCPU、32 GB 的記憶體和 128 GB 磁碟,以及每個工作者 1 個執行器。

    MaxCapacityNumberOfWorkersWorkerType 的互斥選項。

    • 如果設定 NumberOfWorkersWorkerType,則無法設定 MaxCapacity

    • 如果設定 MaxCapacity,則無法設定 NumberOfWorkersWorkerType

    • 如果設定 WorkerType,則 NumberOfWorkers 為必要 (反之亦然)。

    • MaxCapacityNumberOfWorkers 都必須至少為 1。

  • NumberOfWorkers – 數字 (整數)。

    執行此任務時所配置的已定義 workerType 工作者數目。

    如果設定 WorkerType,則 NumberOfWorkers 為必要 (反之亦然)。

  • Timeout – 數字 (整數),至少為 1。

    此轉換任務回合的逾時,以分鐘計。這是此轉換任務回合在終止並進入 TIMEOUT 狀態前,可取用資源的最長時間。預設值為 2,880 分鐘 (48 小時)。

  • MaxRetries – 數字 (整數)。

    任務回合失敗後,此轉換任務可重試的次數上限。

  • Tags – 金鑰值對的對應陣列,不超過 50 對。

    每個金鑰均為 UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 128 個位元組。

    每個值都是 UTF-8 字串,長度不可超過 256 個位元組。

    與此機器學習轉換搭配使用的標籤。您可以使用標籤來限制對機器學習轉換的存取情況。如需中標籤的詳細資訊 AWS Glue,請參閱開發人員指南AWS Glue中的「AWS 標籤」。

  • TransformEncryptionTransformEncryption 物件。

    適用於存取使用者資料的轉換 encryption-at-rest 設定。機器學習轉換可以使用 KMS 存取 Amazon S3 中加密的使用者資料。

回應
  • TransformId – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    針對轉換產生的唯一識別符。

錯誤
  • AlreadyExistsException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

  • AccessDeniedException

  • ResourceNumberLimitExceededException

  • IdempotentParameterMismatchException

UpdateMLTransform 動作 (Python: update_ml_transform)

更新現有的機器學習轉換。呼叫此操作以調校演算法參數,取得更佳的結果。

呼叫此操作後,您就可以呼叫 StartMLEvaluationTaskRun 操作,評估新參數達到目標的效果有多好 (例如,改善機器學習轉換的品質,或讓它更為經濟實惠)。

請求
  • TransformId必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern

    建立轉換時所產生的唯一識別符。

  • Name – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    建立轉換時授予它的唯一名稱。

  • Description – 描述字串,長度不可超過 2048 個位元組,需符合URI address multi-line string pattern

    轉換的描述。預設為空字串。

  • ParametersTransformParameters 物件。

    所用轉換類型 (演算法) 的專屬組態參數。條件性相依於轉換類型。

  • Role – UTF-8 字串。

    IAM 角色的名稱或 Amazon Resource Name (ARN) 與所需的許可。

  • GlueVersion – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Custom string pattern #20

    此值決定 AWS Glue 此機器學習轉換與哪個版本相容。Glue 1.0 是建議大多數客戶使用的版本。如果未設定此值,Glue 相容性預設為 Glue 0.9。如需詳細資訊,請參閱開發人員指南中的 AWS Glue 版本

  • MaxCapacity – 數字 (雙位數)。

    為此轉換配置給工作執行的 AWS Glue 資料處理單元 (DPU) 數目。您可以分配從 2 到 100 個 DPU,預設值為 10。DPU 是相對的處理能力,包含 4 個 vCPU 的運算容量和 16 GB 的記憶體。如需詳細資訊,請參閱 AWS Glue 定價頁面

    如果 WorkerType 欄位設成 Standard 以外的值,就會自動設定 MaxCapacity 欄位並且變成唯讀。

  • WorkerType – UTF-8 字串 (有效值:Standard="" | G.1X="" | G.2X="" | G.025X="" | G.4X="" | G.8X="" | Z.2X="")。

    執行此任務時所配置的預先定義工作者類型。可接受值為標準、G.1X 或 G.2X

    • 用於 Standard 工作者類型時,每個工作者提供 4 個 vCPU、16 GB 的記憶體和 50 GB 磁碟,以及每個工作者 2 個執行器。

    • 用於 G.1X 工作者類型時,每個工作者提供 4 個 vCPU、16 GB 的記憶體和 64 GB 磁碟,以及每個工作者 1 個執行器。

    • 用於 G.2X 工作者類型時,每個工作者提供 8 個 vCPU、32 GB 的記憶體和 128 GB 磁碟,以及每個工作者 1 個執行器。

  • NumberOfWorkers – 數字 (整數)。

    執行此任務時所配置的已定義 workerType 工作者數目。

  • Timeout – 數字 (整數),至少為 1。

    此轉換任務回合的逾時,以分鐘計。這是此轉換任務回合在終止並進入 TIMEOUT 狀態前,可取用資源的最長時間。預設值為 2,880 分鐘 (48 小時)。

  • MaxRetries – 數字 (整數)。

    任務回合失敗後,此轉換任務可重試的次數上限。

回應
  • TransformId – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    已更新的轉換唯一識別符。

錯誤
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

  • AccessDeniedException

DeleteMLTransform 動作 (Python: delete_ml_transform)

刪除 AWS Glue 機器學習轉換。機器學習轉換是特殊的轉換類型,透過人類提供的範例學習,使用機器學習了解要執行的轉換詳細資訊。然後會儲存這些轉換。 AWS Glue如果不再需要某項轉換,您可以呼叫 DeleteMLTransforms 刪除它。不過,仍參照已刪除轉換的任何 AWS Glue 工作將不再成功。

請求
  • TransformId必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern

    要刪除轉換的唯一識別符。

回應
  • TransformId – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    已刪除轉換的唯一識別符。

錯誤
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetMLTransform 動作 (Python: get_ml_transform)

取得 AWS Glue 機器學習轉換成品及其所有對應的中繼資料。機器學習轉換是特殊的轉換類型,透過人類提供的範例學習,使用機器學習了解要執行的轉換詳細資訊。然後會儲存這些轉換。 AWS Glue您可以呼叫 GetMLTransform 以擷取其中繼資料。

請求
  • TransformId必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern

    轉換的唯一識別符,於建立轉換時產生。

回應
  • TransformId – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    轉換的唯一識別符,於建立轉換時產生。

  • Name – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    建立轉換時授予它的唯一名稱。

  • Description – 描述字串,長度不可超過 2048 個位元組,需符合URI address multi-line string pattern

    轉換的描述。

  • Status – UTF-8 字串 (有效值:NOT_READY | READY | DELETING)。

    轉換的上次已知狀態 (指出其是否可用)。"NOT_READY (未就緒)"、"READY (就緒)" 或 "DELETING (正在刪除)" 其中之一。

  • CreatedOn – 時間戳記。

    建立轉換的日期和時間。

  • LastModifiedOn – 時間戳記。

    轉換上次修改的日期和時間。

  • InputRecordTables – 一個 GlueTable 物件陣列,不可超過 10 個結構。

    轉換所使用的 AWS Glue 資料表定義清單。

  • ParametersTransformParameters 物件。

    所用演算法的專屬組態參數。

  • EvaluationMetricsEvaluationMetrics 物件。

    最新的評估指標。

  • LabelCount – 數字 (整數)。

    此轉換可用的標籤數量。

  • Schema – 一個 SchemaColumn 物件陣列,不可超過 100 個結構。

    Map<Column, Type> 物件,代表此轉換接受的結構描述。已有 100 個欄的上限。

  • Role – UTF-8 字串。

    IAM 角色的名稱或 Amazon Resource Name (ARN) 與所需的許可。

  • GlueVersion – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Custom string pattern #20

    此值決定 AWS Glue 此機器學習轉換與哪個版本相容。Glue 1.0 是建議大多數客戶使用的版本。如果未設定此值,Glue 相容性預設為 Glue 0.9。如需詳細資訊,請參閱開發人員指南中的 AWS Glue 版本

  • MaxCapacity – 數字 (雙位數)。

    為此轉換配置給工作執行的 AWS Glue 資料處理單元 (DPU) 數目。您可以分配從 2 到 100 個 DPU,預設值為 10。DPU 是相對的處理能力,包含 4 個 vCPU 的運算容量和 16 GB 的記憶體。如需詳細資訊,請參閱 AWS Glue 定價頁面

    如果 WorkerType 欄位設成 Standard 以外的值,就會自動設定 MaxCapacity 欄位並且變成唯讀。

  • WorkerType – UTF-8 字串 (有效值:Standard="" | G.1X="" | G.2X="" | G.025X="" | G.4X="" | G.8X="" | Z.2X="")。

    執行此任務時所配置的預先定義工作者類型。可接受值為標準、G.1X 或 G.2X

    • 用於 Standard 工作者類型時,每個工作者提供 4 個 vCPU、16 GB 的記憶體和 50 GB 磁碟,以及每個工作者 2 個執行器。

    • 用於 G.1X 工作者類型時,每個工作者提供 4 個 vCPU、16 GB 的記憶體和 64 GB 磁碟,以及每個工作者 1 個執行器。

    • 用於 G.2X 工作者類型時,每個工作者提供 8 個 vCPU、32 GB 的記憶體和 128 GB 磁碟,以及每個工作者 1 個執行器。

  • NumberOfWorkers – 數字 (整數)。

    執行此任務時所配置的已定義 workerType 工作者數目。

  • Timeout – 數字 (整數),至少為 1。

    此轉換任務回合的逾時,以分鐘計。這是此轉換任務回合在終止並進入 TIMEOUT 狀態前,可取用資源的最長時間。預設值為 2,880 分鐘 (48 小時)。

  • MaxRetries – 數字 (整數)。

    任務回合失敗後,此轉換任務可重試的次數上限。

  • TransformEncryptionTransformEncryption 物件。

    適用於存取使用者資料的轉換 encryption-at-rest 設定。機器學習轉換可以使用 KMS 存取 Amazon S3 中加密的使用者資料。

錯誤
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

GetMLTransforms 動作 (Python: get_ml_transforms)

取得現有 AWS Glue 機器學習轉換的可排序、可篩選清單。機器學習轉換是特殊的轉換類型,透過人類提供的範例學習,使用機器學習了解要執行的轉換詳細資訊。然後會儲存這些轉換 AWS Glue,您可以透過呼叫GetMLTransforms擷取其中繼資料。

請求
  • NextToken – UTF-8 字串。

    位移結果的分頁字符。

  • MaxResults – 數字 (整數),不可小於 1,也不可以大於 1000。

    回傳結果的數量上限。

  • FilterTransformFilter标准 物件。

    篩選轉換條件。

  • SortTransformSort标准 物件。

    排序條件。

回應
  • Transforms必要:一個 MLTransform 物件。

    機器學習轉換清單。

  • NextToken – UTF-8 字串。

    如有多個結果可用,即為分頁字符。

錯誤
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

ListMLTransforms 動作 (Python: list_ml_transforms)

擷取此 AWS 帳戶中現有 AWS Glue 機器學習轉換的可排序、可篩選清單,或具有指定標籤的資源。此操作會接收您可用做為回應篩選條件的選用 Tags 欄位,因此已標記的資源可分組進行擷取。如果您選擇使用標籤進行篩選,則此時只會擷取包含該標籤的資源。

請求
  • NextToken – UTF-8 字串。

    接續符記,如果這是接續要求。

  • MaxResults – 數字 (整數),不可小於 1,也不可以大於 1000。

    所要回傳清單的大小上限。

  • FilterTransformFilter标准 物件。

    TransformFilterCriteria 會用來篩選機器學習轉換。

  • SortTransformSort标准 物件。

    TransformSortCriteria 會用來排序機器學習轉換。

  • Tags – 金鑰值對的對應陣列,不超過 50 對。

    每個金鑰均為 UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 128 個位元組。

    每個值都是 UTF-8 字串,長度不可超過 256 個位元組。

    指定只傳回包含這些標籤的資源。

回應
  • TransformIds必要:UTF-8 字串陣列。

    帳戶中所有機器學習轉換的識別符,或包含指定標籤的機器學習轉換。

  • NextToken – UTF-8 字串。

    接續字元,如果傳回的清單未包含最後一個可用指標。

錯誤
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

啟EvaluationTaskRun 動 ML 操作(Python:開始計算任務運行)

啟動任務以評估轉換的品質。

當您提供標籤集做為事實的範例時, AWS Glue 機器學習會使用其中一些範例從中學習。其餘標籤做為測試預估品質使用。

傳回該回合的唯一識別符。您可以呼叫 GetMLTaskRun,以取得EvaluationTaskRun 統計資料的詳細資訊。

請求
  • TransformId必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern

    機器學習轉換的唯一識別符。

回應
  • TaskRunId – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    與此回合相關聯的唯一識別符。

錯誤
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

  • ConcurrentRunsExceededException

  • MLTransformNotReadyException

啟LabelingSetGenerationTaskRun 動 ML 動作 (Python: 啟動 _ 標籤化 _ 設定產生 _ 任務執行)

針對您的機器學習轉換開始作用中學習工作流程,透過產生標籤集及新增標籤來改善轉換的品質。

StartMLLabelingSetGenerationTaskRun 完成後, AWS Glue 即會產生需要人類回答的「標籤集」或問題集。

如果是 FindMatches 轉換,這些問題會是這樣的形式:「分組這些資料列的正確方式是什麼,全部由相符的記錄組成?」

完成標記程序後,您可以呼叫 StartImportLabelsTaskRun 上傳標籤。完成 StartImportLabelsTaskRun 之後,機器學習轉換未來的所有回合都會使用新的改善標籤,並執行更高品質的轉換。

請求
  • TransformId必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern

    機器學習轉換的唯一識別符。

  • OutputS3Path必要:UTF-8 字串。

    Amazon Simple Storage Service (Amazon S3) 路徑,您會在此產生標籤集。

回應
  • TaskRunId – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    與此任務回合相關聯的唯一回合識別符。

錯誤
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

  • ConcurrentRunsExceededException

獲取 ML TaskRun 操作(Python:運行)

取得機器學習轉換上特定任務回合的詳細資訊。機器學習工作執行是代表您 AWS Glue 執行的非同步工作,做為各種機器學習工作流程的一部分。您可以呼叫具有 GetMLTaskRunTaskRunID 及其父轉換的 TransformID,檢查任何任務回合的統計資料。

請求
  • TransformId必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern

    機器學習轉換的唯一識別符。

  • TaskRunId必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern

    任務回合的唯一識別符。

回應
  • TransformId – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    任務回合的唯一識別符。

  • TaskRunId – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    與此回合相關聯的唯一回合識別符。

  • Status – UTF-8 字串 (有效值:STARTING | RUNNING | STOPPING | STOPPED | SUCCEEDED | FAILED | TIMEOUT)。

    此任務回合的狀態。

  • LogGroupName – UTF-8 字串。

    與此任務回合相關聯的日誌群組名稱。

  • PropertiesTaskRun性質 物件。

    與任務回合相關聯的屬性清單。

  • ErrorString – UTF-8 字串。

    與任務回合相關聯的錯誤字串。

  • StartedOn – 時間戳記。

    此任務回合開始的日期和時間。

  • LastModifiedOn – 時間戳記。

    此任務回合上次修改的日期和時間。

  • CompletedOn – 時間戳記。

    此任務回合完成的日期和時間。

  • ExecutionTime – 數字 (整數)。

    任務執行消耗資源所需的時間 (以秒為單位)。

錯誤
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

獲取 ML TaskRuns 操作(Python:運行)

取得機器學習轉換的回合清單。機器學習工作執行是代表您 AWS Glue 執行的非同步工作,做為各種機器學習工作流程的一部分。您可以呼叫具有其父轉換 TransformIDGetMLTaskRuns 以及本節所述的其他選用參數,取得可排序、可篩選的機器學習任務回合清單。

此操作會傳回必須分頁的歷史記錄回合清單。

請求
  • TransformId必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern

    機器學習轉換的唯一識別符。

  • NextToken – UTF-8 字串。

    結果的分頁字符。預設值為空白。

  • MaxResults – 數字 (整數),不可小於 1,也不可以大於 1000。

    回傳結果的數量上限。

  • FilterTaskRunFilterCriteria 物件。

    任務回合的篩選條件,結構為 TaskRunFilterCriteria

  • SortTaskRunSortCriteria 物件。

    任務回合的排序條件,結構為 TaskRunSortCriteria

回應
  • TaskRuns – 一個 TaskRun 物件陣列。

    與轉換相關聯的任務回合清單。

  • NextToken – UTF-8 字串。

    如有多個結果可用,即為分頁字符。

錯誤
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

取消毫升TaskRun 操作(Python:取消任務運行)

取消 (停止) 任務回合。機器學習工作執行是代表您 AWS Glue 執行的非同步工作,做為各種機器學習工作流程的一部分。您可以呼叫具有任務回合父轉換 TransformIDCancelMLTaskRun 以及任務回合的 TaskRunId,隨時取消機器學習任務回合。

請求
  • TransformId必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern

    機器學習轉換的唯一識別符。

  • TaskRunId必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern

    所執行任務的唯一識別符。

回應
  • TransformId – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    機器學習轉換的唯一識別符。

  • TaskRunId – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    所執行任務的唯一識別符。

  • Status – UTF-8 字串 (有效值:STARTING | RUNNING | STOPPING | STOPPED | SUCCEEDED | FAILED | TIMEOUT)。

    此回合的狀態。

錯誤
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

StartExportLabelsTaskRun 操作(Python:開始 _ 導出 _ 標籤 _ 任務 _ 運行)

開始非同步任務以匯出特定轉換的所有標記資料。這個任務是唯一和標籤相關,但不屬於一般作用中學習工作流程的 API 呼叫。當您想要同時使用所有的現有標籤時,您通常會使用 StartExportLabelsTaskRun,例如當您想要移除或變更之前依現況提交的標籤時。此 API 操作接受您想要匯出標籤的 TransformId,以及標籤匯出目標的 Amazon Simple Storage Service (Amazon S3) 路徑。此操作會傳回 TaskRunId。您可以呼叫 GetMLTaskRun API 來檢查任務回合的狀態。

請求
  • TransformId必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern

    機器學習轉換的唯一識別符。

  • OutputS3Path必要:UTF-8 字串。

    標籤匯出的目標 Amazon S3 路徑。

回應
  • TaskRunId – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    所執行任務的唯一識別符。

錯誤
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • InternalServiceException

StartImportLabelsTaskRun 操作(Python:開始導入標籤任務運行)

可讓您提供額外的標籤 (真實範例),用於教授機器學習轉換和提升其品質。此 API 操作通常做為作用中學習工作流程的一部分,從 StartMLLabelingSetGenerationTaskRun 呼叫開始,最後提升機器學習轉換的品質。

完成 StartMLLabelingSetGenerationTaskRun 後, AWS Glue 機器學習即會產生一連串需要人類回答的問題。(在機器學習工作流程中,回答這些問題通常稱為「標記」)。如果是 FindMatches 轉換,這些問題會是這樣的形式:「分組這些資料列的正確方式是什麼,全部由相符的記錄組成?」 完成標記程序後,使用者會呼叫 StartImportLabelsTaskRun 以上傳他們的解答/標籤。完成 StartImportLabelsTaskRun 後,機器學習轉換未來的所有回合都會使用新的改善標籤,並執行更高品質的轉換。

依預設,除非您將 Replace 設為 true,否則 StartMLLabelingSetGenerationTaskRun 會持續學習及合併您上傳的所有標籤。如果您將 Replace 設為 true,StartImportLabelsTaskRun 會刪除並忘記之前上傳的所有標籤,只學習您上傳的確切集合。如果您發現之前上傳了不正確的標籤,而且您認為它們對轉換品質有負面影響,更換標籤很有幫助。

您可以呼叫 GetMLTaskRun 操作來檢查任務回合的狀態。

請求
  • TransformId必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern

    機器學習轉換的唯一識別符。

  • InputS3Path必要:UTF-8 字串。

    Amazon Simple Storage Service (Amazon S3) 路徑,您會由此匯入標籤。

  • ReplaceAllLabels – 布林值。

    指出是否覆寫現有的標籤。

回應
  • TaskRunId – UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern

    所執行任務的唯一識別符。

錯誤
  • EntityNotFoundException

  • InvalidInputException

  • OperationTimeoutException

  • ResourceNumberLimitExceededException

  • InternalServiceException