本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
機器學習 API
機器學習 API 說明機器學習資料類型,包含建立、刪除或更新轉換或啟動機器學習任務執行的 API。
資料類型
TransformParameters 結構
與機器學習轉換相關聯的演算法特定參數。
欄位
-
TransformType
– 必要:UTF-8 字串 (有效值:FIND_MATCHES
)。機器學習轉換的類型。
如需機器學習轉換類型的資訊,請參閱建立機器學習轉換。
-
FindMatchesParameters
– FindMatches參數 物件。find matches 演算法的參數。
EvaluationMetrics 結構
評估指標會提供機器學習轉換品質的預估值。
欄位
-
TransformType
– 必要:UTF-8 字串 (有效值:FIND_MATCHES
)。機器學習轉換的類型。
-
FindMatchesMetrics
– FindMatches度量 物件。find matches 演算法的評估指標。
MLTransform 結構
機器學習轉換的結構。
欄位
-
TransformId
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern。針對機器學習轉換產生的唯一轉換 ID。此 ID 保證是唯一的,且不會變更。
-
Name
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern。機器學習轉換的使用者定義名稱。名稱不保證唯一,且可隨時變更。
-
Description
– 描述字串,長度不可超過 2048 個位元組,需符合URI address multi-line string pattern。機器學習轉換的使用者定義描述長文。描述不保證唯一,且可隨時變更。
-
Status
– UTF-8 字串 (有效值:NOT_READY
|READY
|DELETING
)。機器學習轉換目前的狀態。
-
CreatedOn
– 時間戳記。時間戳記。此機器學習轉換建立的時間和日期。
-
LastModifiedOn
– 時間戳記。時間戳記。此機器學習轉換最後一次修改的時間點。
-
InputRecordTables
– 一個 GlueTable 物件陣列,不可超過 10 個結構。轉換所使用的 AWS Glue 資料表定義清單。
-
Parameters
– TransformParameters 物件。TransformParameters
物件。您可以透過指定學習資料和各種權衡的偏好設定 (如精確率與回收率,或準確性與成本),使用參數來調整 (自訂) 機器學習轉換的行為。 -
EvaluationMetrics
– EvaluationMetrics 物件。EvaluationMetrics
物件。評估指標會提供機器學習轉換品質的預估值。 -
LabelCount
– 數字 (整數)。針對此轉換產生的標籤檔案的 AWS Glue 計數識別碼。當您建立更佳的轉換時,您就可以反覆下載、標記和上傳標記檔案。
-
Schema
– 一個 SchemaColumn 物件陣列,不可超過 100 個結構。表示欄和資料類型的鍵/值對映射,可以執行此轉換。已有 100 個欄的上限。
-
Role
– UTF-8 字串。IAM 角色的名稱或 Amazon Resource Name (ARN) 與所需的許可。所需許可包括 AWS Glue 資源的 AWS Glue 服務角色許可,以及轉換所需的 Amazon S3 許可。
-
此角色需要 AWS Glue 服務角色權限才能允許存取中的資源 AWS Glue。請參閱連接政策到存取 AWS Glue的 IAM 使用者。
-
此角色需要此轉換任務回合所用的 Amazon Simple Storage Service (Amazon S3) 來源、目標、暫時目錄、指令碼和任何程式庫的許可。
-
-
GlueVersion
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Custom string pattern #20。此值決定 AWS Glue 此機器學習轉換與哪個版本相容。Glue 1.0 是建議大多數客戶使用的版本。如果未設定此值,Glue 相容性預設為 Glue 0.9。如需詳細資訊,請參閱開發人員指南中的 AWS Glue 版本。
-
MaxCapacity
– 數字 (雙位數)。為此轉換配置給工作執行的 AWS Glue 資料處理單元 (DPU) 數目。您可以分配從 2 到 100 個 DPU,預設值為 10。DPU 是相對的處理能力,包含 4 個 vCPU 的運算容量和 16 GB 的記憶體。如需詳細資訊,請參閱 AWS Glue 定價頁面
。 MaxCapacity
是NumberOfWorkers
和WorkerType
的互斥選項。-
如果設定
NumberOfWorkers
或WorkerType
,則無法設定MaxCapacity
。 -
如果設定
MaxCapacity
,則無法設定NumberOfWorkers
或WorkerType
。 -
如果設定
WorkerType
,則NumberOfWorkers
為必要 (反之亦然)。 -
MaxCapacity
和NumberOfWorkers
都必須至少為 1。
如果
WorkerType
欄位設成Standard
以外的值,就會自動設定MaxCapacity
欄位並且變成唯讀。 -
-
WorkerType
– UTF-8 字串 (有效值:Standard=""
|G.1X=""
|G.2X=""
|G.025X=""
|G.4X=""
|G.8X=""
|Z.2X=""
)。此轉換執行任務時所配置的預先定義工作者類型。可接受值為標準、G.1X 或 G.2X
-
用於
Standard
工作者類型時,每個工作者提供 4 個 vCPU、16 GB 的記憶體和 50 GB 磁碟,以及每個工作者 2 個執行器。 -
用於
G.1X
工作者類型時,每個工作者提供 4 個 vCPU、16 GB 的記憶體和 64 GB 磁碟,以及每個工作者 1 個執行器。 -
用於
G.2X
工作者類型時,每個工作者提供 8 個 vCPU、32 GB 的記憶體和 128 GB 磁碟,以及每個工作者 1 個執行器。
MaxCapacity
是NumberOfWorkers
和WorkerType
的互斥選項。-
如果設定
NumberOfWorkers
或WorkerType
,則無法設定MaxCapacity
。 -
如果設定
MaxCapacity
,則無法設定NumberOfWorkers
或WorkerType
。 -
如果設定
WorkerType
,則NumberOfWorkers
為必要 (反之亦然)。 -
MaxCapacity
和NumberOfWorkers
都必須至少為 1。
-
-
NumberOfWorkers
– 數字 (整數)。轉換執行任務時所配置的已定義
workerType
工作者數量。如果設定
WorkerType
,則NumberOfWorkers
為必要 (反之亦然)。 -
Timeout
– 數字 (整數),至少為 1。機器學習轉換的逾時,以分鐘計。
-
MaxRetries
– 數字 (整數)。機器學習轉換
MLTaskRun
失敗後的重試次數上限。 -
TransformEncryption
– TransformEncryption 物件。適用於存取使用者資料的轉換 encryption-at-rest 設定。機器學習轉換可以使用 KMS 存取 Amazon S3 中加密的使用者資料。
FindMatchesParameters 結構
設定 find matches 轉換的參數。
欄位
-
PrimaryKeyColumnName
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 1024 個位元組,需符合 Single-line string pattern。唯一識別來源資料表中資料列的欄名。用於協助識別相符的記錄。
-
PrecisionRecallTradeoff
– 數字 (double),不可大於 1.0。調校轉換以取得精確率與回收率平衡時所選取的值。值為 0.5 表示無偏好;值為 1.0 表示專門針對精確率的偏差;值為 0.0 表示針對回收率的偏差。因為這是一種權衡,選擇接近 1.0 的值表示非常低的回收率,選擇接近 0.0 的值則會得到非常低的精確率。
精確率指標指出模型預測相符項目時的正確頻率。
回收率指標表示針對實際比對,模型預測相符項目的頻率。
-
AccuracyCostTradeoff
– 數字 (double),不可大於 1.0。調校轉換以取得準確性與成本平衡時所選取的值。值為 0.5 表示系統持平考量準確性與成本。值為 1.0 表示專門針對準確性的偏差,這通常會導致較高的成本,有時會非常高。值為 0.0 表示專門針對成本的偏差,這會導致低準確性的
FindMatches
轉換,有時是無法接受的準確性。Accuracy (準確性) 會測量轉換找到真肯定和真否定的效果有多好。提高正確性需要更多的機器資源和成本。但也會增加回收率。
成本會測量執行轉換要消耗多少運算資源上,以此計算出金額。
-
EnforceProvidedLabels
– 布林值。值,開啟或關閉以強制輸出符合使用者提供的標籤。如果此值為
True
,則find matches
轉換會強制輸出符合提供的標籤。結果會覆寫正常的合併結果。如果此值為False
,則find matches
轉換不確保遵守所有提供的標籤,結果會倚賴訓練過的模型。請注意,將此值設定為 true 可能會增加合併執行的時間。
FindMatchesMetrics 結構
find matches 演算法的評估指標。測量機器學習轉換品質的方式,是讓您的轉換預測一些相符項目,並比較此結果與相同資料集的已知相符項目。品質指標是以您的部分資料為基礎,所以不精確。
欄位
-
AreaUnderPRCurve
– 數字 (double),不可大於 1.0。在精確率/回收率曲線 (AUPRC) 下的區域是測量轉換整體品質的單一數字,與精確率與回收率的選擇無關。較高的值表示您有較具吸引力的精確率與回收率權衡。
如需詳細資訊,請參閱 Wikipedia 中的 Precision and recall
。 -
Precision
– 數字 (double),不可大於 1.0。精確率指標指出轉換預測相符項目的正確頻率。尤其,它會測量轉換從真陽性總可能性中找出真陽性的效果有多好。
如需詳細資訊,請參閱 Wikipedia 中的 Precision and recall
。 -
Recall
– 數字 (double),不可大於 1.0。回收率指標表示針對實際比對,轉換預測相符項目的頻率。尤其,它會測量轉換從來源資料總記錄中找出真陽性的效果有多好。
如需詳細資訊,請參閱 Wikipedia 中的 Precision and recall
。 -
F1
– 數字 (double),不可大於 1.0。F1 指標上限指出轉換的準確性介於 0 和 1 之間,其中 1 為最佳準確性。
如需詳細資訊,請參閱 Wikipedia 中的 F1 score
。 -
ConfusionMatrix
– ConfusionMatrix 物件。混淆矩陣會顯示轉換準確預測的內容及其產生的錯誤類型。
如需詳細資訊,請參閱 Wikipedia 的 Confusion matrix
。 -
ColumnImportances
– 一個 ColumnImportance 物件陣列,不可超過 100 個結構。ColumnImportance
結構的清單,包含欄重要性指標,依重要性遞減順序排序。
ConfusionMatrix 結構
混淆矩陣會顯示轉換準確預測的內容及其產生的錯誤類型。
如需詳細資訊,請參閱 Wikipedia 的 Confusion matrix
欄位
-
NumTruePositives
– 數字 (long)。在您轉換的混淆矩陣中,轉換在資料中正確找到的相符項目數量。
-
NumFalsePositives
– 數字 (long)。在您轉換的混淆矩陣中,轉換在資料中誤分類為相符項目的非相符項目數量。
-
NumTrueNegatives
– 數字 (long)。在您轉換的混淆矩陣中,轉換在資料中正確拒絕的非相符項目數量。
-
NumFalseNegatives
– 數字 (long)。在您轉換的混淆矩陣中,轉換在資料中沒找到的相符項目數量。
GlueTable 結構
中用於輸入或輸出資料的資料庫和表格。 AWS Glue Data Catalog
欄位
-
DatabaseName
– 必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern。AWS Glue Data Catalog中的資料庫名稱。
-
TableName
– 必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern。AWS Glue Data Catalog中的資料表名稱。
-
CatalogId
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern。AWS Glue Data Catalog的唯一識別符。
-
ConnectionName
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern。連至 AWS Glue Data Catalog的連線名稱。
-
AdditionalOptions
– 金鑰值對的映射陣列,不少於 1 對,也不可大於 10 對。每個金鑰都是 UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern。
每個值都是描述字串,長度不可超過 2048 個位元組,且需符合 URI address multi-line string pattern。
資料表的其他選項。目前支援兩個金鑰:
-
pushDownPredicate
:篩選分割區,而無需列出和讀取資料集中的所有檔案。 -
catalogPartitionPredicate
:使用 AWS Glue Data Catalog中的分割區索引以進行伺服器端分割區清理。
-
TaskRun 結構
與機器學習轉換相關聯的取樣參數。
欄位
-
TransformId
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern。轉換的唯一識別符。
-
TaskRunId
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern。此任務回合的唯一識別符。
-
Status
– UTF-8 字串 (有效值:STARTING
|RUNNING
|STOPPING
|STOPPED
|SUCCEEDED
|FAILED
|TIMEOUT
)。請求任務回合目前的狀態。
-
LogGroupName
– UTF-8 字串。與此任務回合相關聯的安全記錄日誌群組名稱。
-
Properties
– TaskRun性質 物件。指定與此任務回合相關聯的組態屬性。
-
ErrorString
– UTF-8 字串。與此任務回合相關聯的錯誤字串清單。
-
StartedOn
– 時間戳記。此任務回合開始的日期和時間。
-
LastModifiedOn
– 時間戳記。請求任務回合上次更新的時間點。
-
CompletedOn
– 時間戳記。請求任務回合上次完成的時間點。
-
ExecutionTime
– 數字 (整數)。任務執行消耗資源所需的時間 (以秒為單位)。
TransformFilterCriteria 結構
用來篩選機器學習轉換的條件。
欄位
-
Name
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern。用來篩選機器學習轉換的唯一轉換名稱。
-
TransformType
– UTF-8 字串 (有效值:FIND_MATCHES
)。用來篩選機器學習轉換的機器學習轉換類型。
-
Status
– UTF-8 字串 (有效值:NOT_READY
|READY
|DELETING
)。依轉換的上次已知狀態篩選機器學習轉換清單 (以指出轉換是否可用)。"NOT_READY (未就緒)"、"READY (就緒)" 或 "DELETING (正在刪除)" 其中之一。
-
GlueVersion
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Custom string pattern #20。此值決定 AWS Glue 此機器學習轉換與哪個版本相容。Glue 1.0 是建議大多數客戶使用的版本。如果未設定此值,Glue 相容性預設為 Glue 0.9。如需詳細資訊,請參閱開發人員指南中的 AWS Glue 版本。
-
CreatedBefore
– 時間戳記。轉換建立前的時間和日期。
-
CreatedAfter
– 時間戳記。轉換建立後的時間和日期。
-
LastModifiedBefore
– 時間戳記。篩選出上次修改在此日期前的轉換。
-
LastModifiedAfter
– 時間戳記。篩選出上次修改在此日期後的轉換。
-
Schema
– 一個 SchemaColumn 物件陣列,不可超過 100 個結構。篩選出具有特定結構描述的資料集。
Map<Column, Type>
物件是一個鍵/值對陣列,代表此轉換接受的結構描述,其中Column
是欄的名稱,Type
是資料類型,例如整數或字串。已有 100 個欄的上限。
TransformSortCriteria 結構
與機器學習轉換相關聯的排序條件。
欄位
-
Column
– 必要:UTF-8 字串 (有效值:NAME
|TRANSFORM_TYPE
|STATUS
|CREATED
|LAST_MODIFIED
)。要用在與機器學習轉換相關聯之排序條件中的欄。
-
SortDirection
– 必要:UTF-8 字串 (有效值:DESCENDING
|ASCENDING
)。要用在與機器學習轉換相關聯之排序條件中的排序方向。
TaskRunFilterCriteria 結構
用來篩選機器學習轉換任務回合的條件。
欄位
-
TaskRunType
– UTF-8 字串 (有效值:EVALUATION
|LABELING_SET_GENERATION
|IMPORT_LABELS
|EXPORT_LABELS
|FIND_MATCHES
)。執行的任務類型。
-
Status
– UTF-8 字串 (有效值:STARTING
|RUNNING
|STOPPING
|STOPPED
|SUCCEEDED
|FAILED
|TIMEOUT
)。所執行任務目前的狀態。
-
StartedBefore
– 時間戳記。篩選出在此日期前開始的任務回合。
-
StartedAfter
– 時間戳記。篩選出在此日期後開始的任務回合。
TaskRunSortCriteria 結構
用來排序機器學習轉換任務回合清單的排序條件。
欄位
-
Column
– 必要:UTF-8 字串 (有效值:TASK_RUN_TYPE
|STATUS
|STARTED
)。用來排序機器學習轉換任務回合清單的欄。
-
SortDirection
– 必要:UTF-8 字串 (有效值:DESCENDING
|ASCENDING
)。用來排序機器學習轉換任務回合清單的排序方向。
TaskRunProperties 結構
任務回合的組態屬性。
欄位
-
TaskType
– UTF-8 字串 (有效值:EVALUATION
|LABELING_SET_GENERATION
|IMPORT_LABELS
|EXPORT_LABELS
|FIND_MATCHES
)。執行的任務類型。
-
ImportLabelsTaskRunProperties
– ImportLabelsTaskRun性質 物件。匯入標籤任務回合的組態屬性。
-
ExportLabelsTaskRunProperties
– ExportLabelsTaskRun性質 物件。匯出標籤任務回合的組態屬性。
-
LabelingSetGenerationTaskRunProperties
– LabelingSetGenerationTaskRunProperties 物件。標籤集產生任務回合的組態屬性。
-
FindMatchesTaskRunProperties
– FindMatchesTaskRun性質 物件。Find Matches 任務回合的組態屬性。
FindMatchesTaskRunProperties 結構
指定 Find Matches 任務回合的組態屬性。
欄位
-
JobId
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern。Find Matches 任務回合的任務 ID。
-
JobName
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern。指派給 Find Matches 任務回合任務的名稱。
-
JobRunId
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern。Find Matches 任務回合的任務回合 ID。
ImportLabelsTaskRunProperties 結構
指定匯入標籤任務回合的組態屬性。
欄位
-
InputS3Path
– UTF-8 字串。Amazon Simple Storage Service (Amazon S3) 路徑,您會由此匯入標籤。
-
Replace
– 布林值。指出是否覆寫現有的標籤。
ExportLabelsTaskRunProperties 結構
指定匯出標籤任務回合的組態屬性。
欄位
-
OutputS3Path
– UTF-8 字串。Amazon Simple Storage Service (Amazon S3) 路徑,您會由此匯出標籤。
LabelingSetGenerationTaskRunProperties 結構
指定標籤集產生任務回合的組態屬性。
欄位
-
OutputS3Path
– UTF-8 字串。Amazon Simple Storage Service (Amazon S3) 路徑,您會在此產生標籤集。
SchemaColumn 結構
鍵/值對,代表要執行此轉換的欄和資料類型。MLTransform
的 Schema
參數最多可包含 100 個這些結構。
欄位
-
Name
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 1024 個位元組,需符合 Single-line string pattern。欄位的名稱。
-
DataType
– UTF-8 字串,長度不可超過 131072 個位元組,需符合Single-line string pattern。欄中的資料類型。
TransformEncryption 結構
適用於存取使用者資料的轉換 encryption-at-rest 設定。機器學習轉換可以使用 KMS 存取 Amazon S3 中加密的使用者資料。
此外,匯入的標籤和經過訓練的轉換現在可以使用客戶提供的 KMS 金鑰加密。
欄位
-
MlUserDataEncryption
– ML UserData 加密 物件。包含加密模式和客戶提供的 KMS 金鑰 ID 的
MLUserDataEncryption
物件。 -
TaskRunSecurityConfigurationName
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern。安全組態的名稱。
毫升UserDataEncryption 結構
適用於存取使用者資料的轉換 encryption-at-rest 設定。
欄位
-
MlUserDataEncryptionMode
– 必要:UTF-8 字串 (有效值:DISABLED
|SSE-KMS="SSEKMS"
)。套用至使用者資料的加密模式。有效的 值如下:
-
DISABLED:已停用加密
-
SSEKMS:針對存放在 Amazon S3 中的使用者資料,使用伺服器端加密搭配 AWS Key Management Service (SSE-KMS)。
-
-
KmsKeyId
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern。客戶提供的 KMS 金鑰的 ID。
ColumnImportance 結構
包含欄名稱和欄重要性分數的結構。
欄重要性可協助您了解欄對模型的貢獻方式,藉由識別記錄中的哪些欄比其他欄更重要。
欄位
-
ColumnName
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern。欄的名稱。
-
Importance
– 數字 (double),不可大於 1.0。欄的欄重要性分數 (以十進位形式)。
作業
CreateMLTransform 動作 (Python: create_ml_transform)
建立 AWS Glue 機器學習轉換。此操作會建立轉換及培訓它的所有必要參數。
呼叫此操作,做為使用機器學習轉換程序的第一步 (例如 FindMatches
轉換),以刪除重複的資料。除了想要用於演算法的參數,您還可以提供選用的 Description
。
您還必須為代表您 AWS Glue 執行的工作指定特定參數,以便從資料中學習並建立高品質的機器學習轉換。這些參數包括 Role
,以及選用的 AllocatedCapacity
、Timeout
和 MaxRetries
。如需詳細資訊,請參閱任務。
請求
-
Name
– 必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern。建立轉換時給予它的唯一名稱。
-
Description
– 描述字串,長度不可超過 2048 個位元組,需符合URI address multi-line string pattern。正在定義的機器學習轉換描述。預設為空字串。
-
InputRecordTables
– 必要:一個 GlueTable 物件陣列,不可超過 10 個結構。轉換所使用的 AWS Glue 資料表定義清單。
-
Parameters
– 必要:TransformParameters 物件。所用轉換類型的專屬演算法參數。條件性相依於轉換類型。
-
Role
– 必要:UTF-8 字串。IAM 角色的名稱或 Amazon Resource Name (ARN) 與所需的許可。所需許可包括 AWS Glue 資源的 AWS Glue 服務角色許可,以及轉換所需的 Amazon S3 許可。
-
此角色需要 AWS Glue 服務角色權限才能允許存取中的資源 AWS Glue。請參閱連接政策到存取 AWS Glue的 IAM 使用者。
-
此角色需要此轉換任務回合所用的 Amazon Simple Storage Service (Amazon S3) 來源、目標、暫時目錄、指令碼和任何程式庫的許可。
-
-
GlueVersion
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Custom string pattern #20。此值決定 AWS Glue 此機器學習轉換與哪個版本相容。Glue 1.0 是建議大多數客戶使用的版本。如果未設定此值,Glue 相容性預設為 Glue 0.9。如需詳細資訊,請參閱開發人員指南中的 AWS Glue 版本。
-
MaxCapacity
– 數字 (雙位數)。為此轉換配置給工作執行的 AWS Glue 資料處理單元 (DPU) 數目。您可以分配從 2 到 100 個 DPU,預設值為 10。DPU 是相對的處理能力,包含 4 個 vCPU 的運算容量和 16 GB 的記憶體。如需詳細資訊,請參閱 AWS Glue 定價頁面
。 MaxCapacity
是NumberOfWorkers
和WorkerType
的互斥選項。-
如果設定
NumberOfWorkers
或WorkerType
,則無法設定MaxCapacity
。 -
如果設定
MaxCapacity
,則無法設定NumberOfWorkers
或WorkerType
。 -
如果設定
WorkerType
,則NumberOfWorkers
為必要 (反之亦然)。 -
MaxCapacity
和NumberOfWorkers
都必須至少為 1。
如果
WorkerType
欄位設成Standard
以外的值,就會自動設定MaxCapacity
欄位並且變成唯讀。如果
WorkerType
欄位設成Standard
以外的值,就會自動設定MaxCapacity
欄位並且變成唯讀。 -
-
WorkerType
– UTF-8 字串 (有效值:Standard=""
|G.1X=""
|G.2X=""
|G.025X=""
|G.4X=""
|G.8X=""
|Z.2X=""
)。執行此任務時所配置的預先定義工作者類型。可接受值為標準、G.1X 或 G.2X
-
用於
Standard
工作者類型時,每個工作者提供 4 個 vCPU、16 GB 的記憶體和 50 GB 磁碟,以及每個工作者 2 個執行器。 -
用於
G.1X
工作者類型時,每個工作者提供 4 個 vCPU、16 GB 的記憶體和 64 GB 磁碟,以及每個工作者 1 個執行器。 -
用於
G.2X
工作者類型時,每個工作者提供 8 個 vCPU、32 GB 的記憶體和 128 GB 磁碟,以及每個工作者 1 個執行器。
MaxCapacity
是NumberOfWorkers
和WorkerType
的互斥選項。-
如果設定
NumberOfWorkers
或WorkerType
,則無法設定MaxCapacity
。 -
如果設定
MaxCapacity
,則無法設定NumberOfWorkers
或WorkerType
。 -
如果設定
WorkerType
,則NumberOfWorkers
為必要 (反之亦然)。 -
MaxCapacity
和NumberOfWorkers
都必須至少為 1。
-
-
NumberOfWorkers
– 數字 (整數)。執行此任務時所配置的已定義
workerType
工作者數目。如果設定
WorkerType
,則NumberOfWorkers
為必要 (反之亦然)。 -
Timeout
– 數字 (整數),至少為 1。此轉換任務回合的逾時,以分鐘計。這是此轉換任務回合在終止並進入
TIMEOUT
狀態前,可取用資源的最長時間。預設值為 2,880 分鐘 (48 小時)。 -
MaxRetries
– 數字 (整數)。任務回合失敗後,此轉換任務可重試的次數上限。
-
Tags
– 金鑰值對的對應陣列,不超過 50 對。每個金鑰均為 UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 128 個位元組。
每個值都是 UTF-8 字串,長度不可超過 256 個位元組。
與此機器學習轉換搭配使用的標籤。您可以使用標籤來限制對機器學習轉換的存取情況。如需中標籤的詳細資訊 AWS Glue,請參閱開發人員指南AWS Glue中的「AWS 標籤」。
-
TransformEncryption
– TransformEncryption 物件。適用於存取使用者資料的轉換 encryption-at-rest 設定。機器學習轉換可以使用 KMS 存取 Amazon S3 中加密的使用者資料。
回應
-
TransformId
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern。針對轉換產生的唯一識別符。
錯誤
AlreadyExistsException
InvalidInputException
OperationTimeoutException
InternalServiceException
AccessDeniedException
ResourceNumberLimitExceededException
IdempotentParameterMismatchException
UpdateMLTransform 動作 (Python: update_ml_transform)
更新現有的機器學習轉換。呼叫此操作以調校演算法參數,取得更佳的結果。
呼叫此操作後,您就可以呼叫 StartMLEvaluationTaskRun
操作,評估新參數達到目標的效果有多好 (例如,改善機器學習轉換的品質,或讓它更為經濟實惠)。
請求
-
TransformId
– 必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern。建立轉換時所產生的唯一識別符。
-
Name
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern。建立轉換時授予它的唯一名稱。
-
Description
– 描述字串,長度不可超過 2048 個位元組,需符合URI address multi-line string pattern。轉換的描述。預設為空字串。
-
Parameters
– TransformParameters 物件。所用轉換類型 (演算法) 的專屬組態參數。條件性相依於轉換類型。
-
Role
– UTF-8 字串。IAM 角色的名稱或 Amazon Resource Name (ARN) 與所需的許可。
-
GlueVersion
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Custom string pattern #20。此值決定 AWS Glue 此機器學習轉換與哪個版本相容。Glue 1.0 是建議大多數客戶使用的版本。如果未設定此值,Glue 相容性預設為 Glue 0.9。如需詳細資訊,請參閱開發人員指南中的 AWS Glue 版本。
-
MaxCapacity
– 數字 (雙位數)。為此轉換配置給工作執行的 AWS Glue 資料處理單元 (DPU) 數目。您可以分配從 2 到 100 個 DPU,預設值為 10。DPU 是相對的處理能力,包含 4 個 vCPU 的運算容量和 16 GB 的記憶體。如需詳細資訊,請參閱 AWS Glue 定價頁面
。 如果
WorkerType
欄位設成Standard
以外的值,就會自動設定MaxCapacity
欄位並且變成唯讀。 -
WorkerType
– UTF-8 字串 (有效值:Standard=""
|G.1X=""
|G.2X=""
|G.025X=""
|G.4X=""
|G.8X=""
|Z.2X=""
)。執行此任務時所配置的預先定義工作者類型。可接受值為標準、G.1X 或 G.2X
-
用於
Standard
工作者類型時,每個工作者提供 4 個 vCPU、16 GB 的記憶體和 50 GB 磁碟,以及每個工作者 2 個執行器。 -
用於
G.1X
工作者類型時,每個工作者提供 4 個 vCPU、16 GB 的記憶體和 64 GB 磁碟,以及每個工作者 1 個執行器。 -
用於
G.2X
工作者類型時,每個工作者提供 8 個 vCPU、32 GB 的記憶體和 128 GB 磁碟,以及每個工作者 1 個執行器。
-
-
NumberOfWorkers
– 數字 (整數)。執行此任務時所配置的已定義
workerType
工作者數目。 -
Timeout
– 數字 (整數),至少為 1。此轉換任務回合的逾時,以分鐘計。這是此轉換任務回合在終止並進入
TIMEOUT
狀態前,可取用資源的最長時間。預設值為 2,880 分鐘 (48 小時)。 -
MaxRetries
– 數字 (整數)。任務回合失敗後,此轉換任務可重試的次數上限。
回應
-
TransformId
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern。已更新的轉換唯一識別符。
錯誤
EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException
AccessDeniedException
DeleteMLTransform 動作 (Python: delete_ml_transform)
刪除 AWS Glue 機器學習轉換。機器學習轉換是特殊的轉換類型,透過人類提供的範例學習,使用機器學習了解要執行的轉換詳細資訊。然後會儲存這些轉換。 AWS Glue如果不再需要某項轉換,您可以呼叫 DeleteMLTransforms
刪除它。不過,仍參照已刪除轉換的任何 AWS Glue 工作將不再成功。
請求
-
TransformId
– 必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern。要刪除轉換的唯一識別符。
回應
-
TransformId
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern。已刪除轉換的唯一識別符。
錯誤
EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException
GetMLTransform 動作 (Python: get_ml_transform)
取得 AWS Glue 機器學習轉換成品及其所有對應的中繼資料。機器學習轉換是特殊的轉換類型,透過人類提供的範例學習,使用機器學習了解要執行的轉換詳細資訊。然後會儲存這些轉換。 AWS Glue您可以呼叫 GetMLTransform
以擷取其中繼資料。
請求
-
TransformId
– 必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern。轉換的唯一識別符,於建立轉換時產生。
回應
-
TransformId
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern。轉換的唯一識別符,於建立轉換時產生。
-
Name
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern。建立轉換時授予它的唯一名稱。
-
Description
– 描述字串,長度不可超過 2048 個位元組,需符合URI address multi-line string pattern。轉換的描述。
-
Status
– UTF-8 字串 (有效值:NOT_READY
|READY
|DELETING
)。轉換的上次已知狀態 (指出其是否可用)。"NOT_READY (未就緒)"、"READY (就緒)" 或 "DELETING (正在刪除)" 其中之一。
-
CreatedOn
– 時間戳記。建立轉換的日期和時間。
-
LastModifiedOn
– 時間戳記。轉換上次修改的日期和時間。
-
InputRecordTables
– 一個 GlueTable 物件陣列,不可超過 10 個結構。轉換所使用的 AWS Glue 資料表定義清單。
-
Parameters
– TransformParameters 物件。所用演算法的專屬組態參數。
-
EvaluationMetrics
– EvaluationMetrics 物件。最新的評估指標。
-
LabelCount
– 數字 (整數)。此轉換可用的標籤數量。
-
Schema
– 一個 SchemaColumn 物件陣列,不可超過 100 個結構。Map<Column, Type>
物件,代表此轉換接受的結構描述。已有 100 個欄的上限。 -
Role
– UTF-8 字串。IAM 角色的名稱或 Amazon Resource Name (ARN) 與所需的許可。
-
GlueVersion
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Custom string pattern #20。此值決定 AWS Glue 此機器學習轉換與哪個版本相容。Glue 1.0 是建議大多數客戶使用的版本。如果未設定此值,Glue 相容性預設為 Glue 0.9。如需詳細資訊,請參閱開發人員指南中的 AWS Glue 版本。
-
MaxCapacity
– 數字 (雙位數)。為此轉換配置給工作執行的 AWS Glue 資料處理單元 (DPU) 數目。您可以分配從 2 到 100 個 DPU,預設值為 10。DPU 是相對的處理能力,包含 4 個 vCPU 的運算容量和 16 GB 的記憶體。如需詳細資訊,請參閱 AWS Glue 定價頁面
。 如果
WorkerType
欄位設成Standard
以外的值,就會自動設定MaxCapacity
欄位並且變成唯讀。 -
WorkerType
– UTF-8 字串 (有效值:Standard=""
|G.1X=""
|G.2X=""
|G.025X=""
|G.4X=""
|G.8X=""
|Z.2X=""
)。執行此任務時所配置的預先定義工作者類型。可接受值為標準、G.1X 或 G.2X
-
用於
Standard
工作者類型時,每個工作者提供 4 個 vCPU、16 GB 的記憶體和 50 GB 磁碟,以及每個工作者 2 個執行器。 -
用於
G.1X
工作者類型時,每個工作者提供 4 個 vCPU、16 GB 的記憶體和 64 GB 磁碟,以及每個工作者 1 個執行器。 -
用於
G.2X
工作者類型時,每個工作者提供 8 個 vCPU、32 GB 的記憶體和 128 GB 磁碟,以及每個工作者 1 個執行器。
-
-
NumberOfWorkers
– 數字 (整數)。執行此任務時所配置的已定義
workerType
工作者數目。 -
Timeout
– 數字 (整數),至少為 1。此轉換任務回合的逾時,以分鐘計。這是此轉換任務回合在終止並進入
TIMEOUT
狀態前,可取用資源的最長時間。預設值為 2,880 分鐘 (48 小時)。 -
MaxRetries
– 數字 (整數)。任務回合失敗後,此轉換任務可重試的次數上限。
-
TransformEncryption
– TransformEncryption 物件。適用於存取使用者資料的轉換 encryption-at-rest 設定。機器學習轉換可以使用 KMS 存取 Amazon S3 中加密的使用者資料。
錯誤
EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException
GetMLTransforms 動作 (Python: get_ml_transforms)
取得現有 AWS Glue 機器學習轉換的可排序、可篩選清單。機器學習轉換是特殊的轉換類型,透過人類提供的範例學習,使用機器學習了解要執行的轉換詳細資訊。然後會儲存這些轉換 AWS Glue,您可以透過呼叫GetMLTransforms
擷取其中繼資料。
請求
-
NextToken
– UTF-8 字串。位移結果的分頁字符。
-
MaxResults
– 數字 (整數),不可小於 1,也不可以大於 1000。回傳結果的數量上限。
-
Filter
– TransformFilter标准 物件。篩選轉換條件。
-
Sort
– TransformSort标准 物件。排序條件。
回應
-
Transforms
– 必要:一個 MLTransform 物件。機器學習轉換清單。
-
NextToken
– UTF-8 字串。如有多個結果可用,即為分頁字符。
錯誤
EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException
ListMLTransforms 動作 (Python: list_ml_transforms)
擷取此 AWS 帳戶中現有 AWS Glue
機器學習轉換的可排序、可篩選清單,或具有指定標籤的資源。此操作會接收您可用做為回應篩選條件的選用 Tags
欄位,因此已標記的資源可分組進行擷取。如果您選擇使用標籤進行篩選,則此時只會擷取包含該標籤的資源。
請求
-
NextToken
– UTF-8 字串。接續符記,如果這是接續要求。
-
MaxResults
– 數字 (整數),不可小於 1,也不可以大於 1000。所要回傳清單的大小上限。
-
Filter
– TransformFilter标准 物件。TransformFilterCriteria
會用來篩選機器學習轉換。 -
Sort
– TransformSort标准 物件。TransformSortCriteria
會用來排序機器學習轉換。 -
Tags
– 金鑰值對的對應陣列,不超過 50 對。每個金鑰均為 UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 128 個位元組。
每個值都是 UTF-8 字串,長度不可超過 256 個位元組。
指定只傳回包含這些標籤的資源。
回應
-
TransformIds
– 必要:UTF-8 字串陣列。帳戶中所有機器學習轉換的識別符,或包含指定標籤的機器學習轉換。
-
NextToken
– UTF-8 字串。接續字元,如果傳回的清單未包含最後一個可用指標。
錯誤
EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException
啟EvaluationTaskRun 動 ML 操作(Python:開始計算任務運行)
啟動任務以評估轉換的品質。
當您提供標籤集做為事實的範例時, AWS Glue 機器學習會使用其中一些範例從中學習。其餘標籤做為測試預估品質使用。
傳回該回合的唯一識別符。您可以呼叫 GetMLTaskRun
,以取得EvaluationTaskRun
統計資料的詳細資訊。
請求
-
TransformId
– 必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern。機器學習轉換的唯一識別符。
回應
-
TaskRunId
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern。與此回合相關聯的唯一識別符。
錯誤
EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException
ConcurrentRunsExceededException
MLTransformNotReadyException
啟LabelingSetGenerationTaskRun 動 ML 動作 (Python: 啟動 _ 標籤化 _ 設定產生 _ 任務執行)
針對您的機器學習轉換開始作用中學習工作流程,透過產生標籤集及新增標籤來改善轉換的品質。
當 StartMLLabelingSetGenerationTaskRun
完成後, AWS Glue 即會產生需要人類回答的「標籤集」或問題集。
如果是 FindMatches
轉換,這些問題會是這樣的形式:「分組這些資料列的正確方式是什麼,全部由相符的記錄組成?」
完成標記程序後,您可以呼叫 StartImportLabelsTaskRun
上傳標籤。完成 StartImportLabelsTaskRun
之後,機器學習轉換未來的所有回合都會使用新的改善標籤,並執行更高品質的轉換。
請求
-
TransformId
– 必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern。機器學習轉換的唯一識別符。
-
OutputS3Path
– 必要:UTF-8 字串。Amazon Simple Storage Service (Amazon S3) 路徑,您會在此產生標籤集。
回應
-
TaskRunId
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern。與此任務回合相關聯的唯一回合識別符。
錯誤
EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException
ConcurrentRunsExceededException
獲取 ML TaskRun 操作(Python:運行)
取得機器學習轉換上特定任務回合的詳細資訊。機器學習工作執行是代表您 AWS Glue 執行的非同步工作,做為各種機器學習工作流程的一部分。您可以呼叫具有 GetMLTaskRun
的 TaskRunID
及其父轉換的 TransformID
,檢查任何任務回合的統計資料。
請求
-
TransformId
– 必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern。機器學習轉換的唯一識別符。
-
TaskRunId
– 必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern。任務回合的唯一識別符。
回應
-
TransformId
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern。任務回合的唯一識別符。
-
TaskRunId
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern。與此回合相關聯的唯一回合識別符。
-
Status
– UTF-8 字串 (有效值:STARTING
|RUNNING
|STOPPING
|STOPPED
|SUCCEEDED
|FAILED
|TIMEOUT
)。此任務回合的狀態。
-
LogGroupName
– UTF-8 字串。與此任務回合相關聯的日誌群組名稱。
-
Properties
– TaskRun性質 物件。與任務回合相關聯的屬性清單。
-
ErrorString
– UTF-8 字串。與任務回合相關聯的錯誤字串。
-
StartedOn
– 時間戳記。此任務回合開始的日期和時間。
-
LastModifiedOn
– 時間戳記。此任務回合上次修改的日期和時間。
-
CompletedOn
– 時間戳記。此任務回合完成的日期和時間。
-
ExecutionTime
– 數字 (整數)。任務執行消耗資源所需的時間 (以秒為單位)。
錯誤
EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException
獲取 ML TaskRuns 操作(Python:運行)
取得機器學習轉換的回合清單。機器學習工作執行是代表您 AWS Glue 執行的非同步工作,做為各種機器學習工作流程的一部分。您可以呼叫具有其父轉換 TransformID
的 GetMLTaskRuns
以及本節所述的其他選用參數,取得可排序、可篩選的機器學習任務回合清單。
此操作會傳回必須分頁的歷史記錄回合清單。
請求
-
TransformId
– 必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern。機器學習轉換的唯一識別符。
-
NextToken
– UTF-8 字串。結果的分頁字符。預設值為空白。
-
MaxResults
– 數字 (整數),不可小於 1,也不可以大於 1000。回傳結果的數量上限。
-
Filter
– TaskRunFilterCriteria 物件。任務回合的篩選條件,結構為
TaskRunFilterCriteria
。 -
Sort
– TaskRunSortCriteria 物件。任務回合的排序條件,結構為
TaskRunSortCriteria
。
回應
-
TaskRuns
– 一個 TaskRun 物件陣列。與轉換相關聯的任務回合清單。
-
NextToken
– UTF-8 字串。如有多個結果可用,即為分頁字符。
錯誤
EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException
取消毫升TaskRun 操作(Python:取消任務運行)
取消 (停止) 任務回合。機器學習工作執行是代表您 AWS Glue 執行的非同步工作,做為各種機器學習工作流程的一部分。您可以呼叫具有任務回合父轉換 TransformID
的 CancelMLTaskRun
以及任務回合的 TaskRunId
,隨時取消機器學習任務回合。
請求
-
TransformId
– 必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern。機器學習轉換的唯一識別符。
-
TaskRunId
– 必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern。所執行任務的唯一識別符。
回應
-
TransformId
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern。機器學習轉換的唯一識別符。
-
TaskRunId
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern。所執行任務的唯一識別符。
-
Status
– UTF-8 字串 (有效值:STARTING
|RUNNING
|STOPPING
|STOPPED
|SUCCEEDED
|FAILED
|TIMEOUT
)。此回合的狀態。
錯誤
EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException
StartExportLabelsTaskRun 操作(Python:開始 _ 導出 _ 標籤 _ 任務 _ 運行)
開始非同步任務以匯出特定轉換的所有標記資料。這個任務是唯一和標籤相關,但不屬於一般作用中學習工作流程的 API 呼叫。當您想要同時使用所有的現有標籤時,您通常會使用 StartExportLabelsTaskRun
,例如當您想要移除或變更之前依現況提交的標籤時。此 API 操作接受您想要匯出標籤的 TransformId
,以及標籤匯出目標的 Amazon Simple Storage Service (Amazon S3) 路徑。此操作會傳回 TaskRunId
。您可以呼叫 GetMLTaskRun
API 來檢查任務回合的狀態。
請求
-
TransformId
– 必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern。機器學習轉換的唯一識別符。
-
OutputS3Path
– 必要:UTF-8 字串。標籤匯出的目標 Amazon S3 路徑。
回應
-
TaskRunId
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern。所執行任務的唯一識別符。
錯誤
EntityNotFoundException
InvalidInputException
OperationTimeoutException
InternalServiceException
StartImportLabelsTaskRun 操作(Python:開始導入標籤任務運行)
可讓您提供額外的標籤 (真實範例),用於教授機器學習轉換和提升其品質。此 API 操作通常做為作用中學習工作流程的一部分,從 StartMLLabelingSetGenerationTaskRun
呼叫開始,最後提升機器學習轉換的品質。
完成 StartMLLabelingSetGenerationTaskRun
後, AWS Glue 機器學習即會產生一連串需要人類回答的問題。(在機器學習工作流程中,回答這些問題通常稱為「標記」)。如果是 FindMatches
轉換,這些問題會是這樣的形式:「分組這些資料列的正確方式是什麼,全部由相符的記錄組成?」 完成標記程序後,使用者會呼叫 StartImportLabelsTaskRun
以上傳他們的解答/標籤。完成 StartImportLabelsTaskRun
後,機器學習轉換未來的所有回合都會使用新的改善標籤,並執行更高品質的轉換。
依預設,除非您將 Replace
設為 true,否則 StartMLLabelingSetGenerationTaskRun
會持續學習及合併您上傳的所有標籤。如果您將 Replace
設為 true,StartImportLabelsTaskRun
會刪除並忘記之前上傳的所有標籤,只學習您上傳的確切集合。如果您發現之前上傳了不正確的標籤,而且您認為它們對轉換品質有負面影響,更換標籤很有幫助。
您可以呼叫 GetMLTaskRun
操作來檢查任務回合的狀態。
請求
-
TransformId
– 必要:UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,且需符合Single-line string pattern。機器學習轉換的唯一識別符。
-
InputS3Path
– 必要:UTF-8 字串。Amazon Simple Storage Service (Amazon S3) 路徑,您會由此匯入標籤。
-
ReplaceAllLabels
– 布林值。指出是否覆寫現有的標籤。
回應
-
TaskRunId
– UTF-8 字串,長度不可小於 1 個位元組,也不可以超過 255 個位元組,需符合Single-line string pattern。所執行任務的唯一識別符。
錯誤
EntityNotFoundException
InvalidInputException
OperationTimeoutException
ResourceNumberLimitExceededException
InternalServiceException