Erstellen Sie Regressions- oder Klassifizierungsjobs für Tabellendaten mit AutoML API - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Erstellen Sie Regressions- oder Klassifizierungsjobs für Tabellendaten mit AutoML API

Sie können einen Autopilot-Regressions- oder Klassifizierungsjob für Tabellendaten programmgesteuert erstellen, indem Sie die CreateAutoMLJobV2APIAktion in einer beliebigen Sprache aufrufen, die von Autopilot oder dem unterstützt wird. AWS CLI Im Folgenden finden Sie eine Sammlung von obligatorischen und optionalen Eingabeanforderungsparametern für die Aktion. CreateAutoMLJobV2 API Sie finden die alternativen Informationen für die Vorgängerversion dieser Aktion, CreateAutoMLJob. Wir empfehlen jedoch, CreateAutoMLJobV2 zu verwenden.

Informationen darüber, wie diese API Aktion in eine Funktion in der Sprache Ihrer Wahl übersetzt wird, finden Sie im Abschnitt „Siehe auch“ von CreateAutoMLJobV2 und wählen Sie eine SDK aus. Als Beispiel für Python-Benutzer finden Sie die vollständige Anforderungssyntax von create_auto_ml_job_v2 in AWS SDK for Python (Boto3).

Anmerkung

CreateAutoMLJobV2und DescribeAutoMLJobV2sind neue Versionen von CreateAutoMLJobund DescribeAutoMLJob, die Abwärtskompatibilität bieten.

Wir empfehlen die Verwendung des CreateAutoMLJobV2. CreateAutoMLJobV2 kann tabellarische Aufgabentypen bearbeiten, die mit denen der Vorgängerversion CreateAutoMLJob identisch sind, sowie nicht-tabellarische Aufgabentypen wie Bild- oder Textklassifizierung oder Zeitreihenprognosen.

Alle Experimente mit tabellarischen Daten erfordern mindestens die Angabe des Versuchsnamens, die Angabe von Speicherorten für die Eingabe- und Ausgabedaten und die Angabe, welche Zieldaten vorhergesagt werden sollen. Optional können Sie auch die Art des Problems angeben, das Sie lösen möchten (Regression, Klassifikation, Mehrklassenklassifikation), Ihre Modellierungsstrategie (gestapelte Ensembles oder Hyperparameter-Optimierung) wählen, die Liste der Algorithmen auswählen, die vom Autopilot-Job zum Trainieren der Daten verwendet werden, und vieles mehr.

Nach der Durchführung des Experiments können Sie Versuche vergleichen und sich mit den Einzelheiten der Vorverarbeitungsschritte, Algorithmen und Hyperparameterbereiche der einzelnen Modelle befassen. Sie haben auch die Möglichkeit, die Erklärbarkeits- und Leistungsberichte dazu herunterzuladen. Verwenden Sie die mitgelieferten Notebooks, um sich die Ergebnisse der automatisierten Datenexploration oder die Definitionen der Kandidatenmodelle anzusehen.

Hier finden Sie Richtlinien zur Migration eines CreateAutoMLJob nach CreateAutoMLJobV2 in Migrieren Sie ein CreateAuto MLJob zu CreateAuto MLJobV2.

Erforderliche Parameter

CreateAutoMLJobV2

Wenn Sie CreateAutoMLJobV2 aufrufen, um ein Autopilot-Experiment für tabellarische Daten zu erstellen, müssen Sie die folgenden Werte angeben:

  • Eine AutoMLJobName, um den Namen Ihres Jobs anzugeben.

  • Mindestens eine AutoMLJobChannel in AutoMLJobInputDataConfig zur Angabe Ihrer Datenquelle.

  • Sowohl eine AutoMLJobObjective-Metrik als auch der von Ihnen gewählte Aufgabentyp für überwachtes Lernen (binäre Klassifikation, Mehrklassen-Klassifizierung, Regression) in AutoMLProblemTypeConfig, oder gar keiner. Für tabellarische Daten müssen Sie TabularJobConfig als Typ für AutoMLProblemTypeConfig wählen. Sie legen die Aufgabe für überwachtes Lernen im ProblemType Attribut von TabularJobConfig fest.

  • Eine OutputDataConfig zur Angabe des Ausgabepfades in Amazon S3 zum Speichern der Artefakte Ihres AutoML-Jobs.

  • A RoleArn zur Angabe ARN der Rolle, die für den Zugriff auf Ihre Daten verwendet wird.

CreateAutoMLJob

Wenn Sie CreateAutoMLJob aufrufen, um ein AutoML-Experiment zu erstellen, müssen Sie die folgenden vier Werte angeben:

  • Eine AutoMLJobName, um den Namen Ihres Jobs anzugeben.

  • Mindestens eine AutoMLChannel in InputDataConfig zur Angabe Ihrer Datenquelle.

  • Einen OutputDataConfig zur Angabe des Ausgabepfades in Amazon S3 zum Speichern der Artefakte Ihres AutoML-Jobs.

  • A RoleArn zur Angabe ARN der Rolle, die für den Zugriff auf Ihre Daten verwendet wird.

Alle anderen Parameter sind optional.

Optionale Parameter

In den folgenden Abschnitten finden Sie Einzelheiten zu einigen optionalen Parametern, die Sie an Ihre CreateAutoMLJobV2 API Aktion übergeben können, wenn Sie Tabellendaten verwenden. Sie finden die alternativen Informationen für die Vorgängerversion dieser Aktion, CreateAutoMLJob. Wir empfehlen jedoch, CreateAutoMLJobV2 zu verwenden.

Bei tabellarischen Daten hängt es von Ihrer Modellierungsstrategie (ENSEMBLING oder HYPERPARAMETER_TUNING) ab, welche Algorithmen anhand Ihrer Daten ausgeführt werden, um Ihre Modellkandidaten zu trainieren. Im Folgenden wird beschrieben, wie diese Trainingsweise eingestellt wird.

Wenn Sie das Feld leer lassen (odernull), wird das Mode aus der Größe Ihres Datensatzes abgeleitet.

Informationen zu den Trainingsmethoden für gestapelte Ensembles und Hyperparameter-Optimierung von Autopilot finden Sie unter Trainingsweisen und Unterstützung von Algorithmen

CreateAutoMLJobV2

Für tabellarische Daten müssen Sie TabularJobConfig als Typ für AutoMLProblemTypeConfig wählen.

Sie können die Trainingsmethode eines AutoML-Jobs V2 mit dem TabularJobConfig.Mode-Parameter festlegen.

CreateAutoMLJob

Sie können die Trainingsmethode eines AutoML-Jobs mit dem AutoMLJobConfig.Mode-Parameter festlegen.

Auswahl der Features

Autopilot bietet automatische Schritte zur Datenvorverarbeitung, einschließlich der Auswahl und Extraktion der Features. Sie können die Features, die im Training verwendet werden sollen, mit dem Attribut FeatureSpecificatioS3Uri aber auch manuell angeben.

Ausgewählte Funktionen sollten in einer JSON Datei im folgenden Format enthalten sein:

{ "FeatureAttributeNames":["col1", "col2", ...] }

Bei den Werten in ["col1", "col2", ...] wird die Groß-/Kleinschreibung berücksichtigt. Es sollte sich dabei um eine Liste von Zeichenfolgen handeln, die eindeutige Werte enthalten, bei denen es sich um Teilmengen der Spaltennamen in den Eingabedaten handelt.

Anmerkung

Die Liste der als Features bereitgestellten Spalten darf die Zielspalte nicht enthalten.

CreateAutoMLJobV2

Für tabellarische Daten müssen Sie TabularJobConfig als Typ für AutoMLProblemTypeConfig wählen.

Sie können das mit URL dem TabularJobConfig.FeatureSpecificatioS3Uri Parameter auf Ihre ausgewählten Features einstellen.

CreateAutoMLJob

Sie können das FeatureSpecificatioS3Uri Attribut von A utoMLCandidate GenerationConfig innerhalb des CreateAutoMLJobAPImit dem folgenden Format festlegen:

{ "AutoMLJobConfig": { "CandidateGenerationConfig": { "FeatureSpecificationS3Uri":"string" }, } }

Auswahl der Algorithmen

Ihr Autopilot-Job führt standardmäßig eine vordefinierte Liste von Algorithmen an Ihrem Datensatz aus, um Modellkandidaten zu trainieren. Die Liste der Algorithmen hängt von der Trainingsweise (ENSEMBLING oder HYPERPARAMETER_TUNING) ab, die vom Job verwendet wird.

Sie können eine Teilmenge der Standardauswahl an Algorithmen angeben.

CreateAutoMLJobV2

Für tabellarische Daten müssen Sie TabularJobConfig als Typ für AutoMLProblemTypeConfig wählen.

Sie können ein Array von ausgewählten AutoMLAlgorithms im AlgorithmsConfig Attribut von angeben CandidateGenerationConfig.

Das Folgende ist ein Beispiel für ein AlgorithmsConfig-Attribut, das genau drei Algorithmen („xgboost“, „fastai“, „catboost“) in seinem AutoMLAlgorithms-Feld für die Trainingsweise „Ensembling“ auflistet.

{ "AutoMLProblemTypeConfig": { "TabularJobConfig": { "Mode": "ENSEMBLING", "CandidateGenerationConfig": { "AlgorithmsConfig":[ {"AutoMLAlgorithms":["xgboost", "fastai", "catboost"]} ] }, }, }, }
CreateAutoMLJob

Sie können ein Array von selected AutoMLAlgorithms im AlgorithmsConfig Attribut von A angeben utoMLCandidateGenerationConfig.

Das Folgende ist ein Beispiel für ein AlgorithmsConfig-Attribut, das genau drei Algorithmen („xgboost“, „fastai“, „catboost“) in seinem AutoMLAlgorithms-Feld für die Trainingsweise „Ensembling“ auflistet.

{ "AutoMLJobConfig": { "CandidateGenerationConfig": { "AlgorithmsConfig":[ {"AutoMLAlgorithms":["xgboost", "fastai", "catboost"]} ] }, "Mode": "ENSEMBLING" }

Eine Liste der verfügbaren Algorithmen je Training Mode finden Sie unter AutoMLAlgorithms. Einzelheiten zu den einzelnen Algorithmen finden Sie unter Trainingsweisen und Unterstützung von Algorithmen.

Sie können Ihren eigenen Validierungsdatensatz und ein benutzerdefiniertes Datenteilungsverhältnis angeben oder den Datensatz automatisch von Autopilot teilen lassen.

CreateAutoMLJobV2

Jedes AutoMLJobChannelObjekt (siehe den erforderlichen Parameter A utoMLJob InputDataConfig) hat einenChannelType, der entweder auf validation Werte training oder gesetzt werden kann, die angeben, wie die Daten bei der Erstellung eines Modells für maschinelles Lernen verwendet werden sollen. Es muss mindestens eine Datenquelle bereitgestellt werden, und es sind maximal zwei Datenquellen zulässig: eine für Trainingsdaten und eine für Validierungsdaten.

Wie Sie die Daten in Trainings- und Validierungsdatensätze aufteilen, hängt davon ab, ob Sie über eine oder zwei Datenquellen verfügen.

  • Wenn Sie nur über eine Datenquelle verfügen, wird die ChannelType standardmäßig auf training eingestellt und muss diesen Wert haben.

    • Wenn der Wert ValidationFraction in AutoMLDataSplitConfig nicht festgelegt ist, werden standardmäßig 0,2 (20%) der Daten aus dieser Quelle für die Validierung verwendet.

    • Wenn für ValidationFraction ein Wert zwischen 0 und 1 festgelegt wird, wird der Datensatz anhand des angegebenen Wertes aufgeteilt. Dabei gibt der Wert den Anteil des Datensatzes an, der für die Validierung verwendet wird.

  • Wenn Sie über zwei Datenquellen verfügen, muss der ChannelType für eines der AutoMLJobChannel Objekte auf training gesetzt werden, den Standardwert. Der ChannelType der anderen Datenquelle muss auf validation gesetzt werden. Die beiden Datenquellen müssen dasselbe Format (entweder CSV oder Parquet) und dasselbe Schema haben. In diesem Fall dürfen Sie den Wert für ValidationFraction nicht festlegen, da alle Daten aus jeder Quelle entweder für das Training oder für die Validierung verwendet werden. Das Einstellen dieses Werts verursacht einen Fehler.

CreateAutoMLJob

Jedes AutoMLChannelObjekt (siehe erforderlicher Parameter InputDataConfig) hat einenChannelType, der entweder auf training oder validation Werte gesetzt werden kann, die angeben, wie die Daten bei der Erstellung eines Modells für maschinelles Lernen verwendet werden sollen. Es muss mindestens eine Datenquelle bereitgestellt werden, und es sind maximal zwei Datenquellen zulässig: eine für Trainingsdaten und eine für Validierungsdaten.

Wie Sie die Daten in Trainings- und Validierungsdatensätze aufteilen, hängt davon ab, ob Sie über eine oder zwei Datenquellen verfügen.

  • Wenn Sie nur über eine Datenquelle verfügen, wird die ChannelType standardmäßig auf training eingestellt und muss diesen Wert haben.

    • Wenn der Wert ValidationFraction in AutoMLDataSplitConfig nicht festgelegt ist, werden standardmäßig 0,2 (20%) der Daten aus dieser Quelle für die Validierung verwendet.

    • Wenn für ValidationFraction ein Wert zwischen 0 und 1 festgelegt wird, wird der Datensatz anhand des angegebenen Wertes aufgeteilt. Dabei gibt der Wert den Anteil des Datensatzes an, der für die Validierung verwendet wird.

  • Wenn Sie über zwei Datenquellen verfügen, muss der ChannelType für eines der AutoMLChannel Objekte auf training gesetzt werden, den Standardwert. Der ChannelType der anderen Datenquelle muss auf validation gesetzt werden. Die beiden Datenquellen müssen dasselbe Format (entweder CSV oder Parquet) und dasselbe Schema haben. In diesem Fall dürfen Sie den Wert für ValidationFraction nicht festlegen, da alle Daten aus jeder Quelle entweder für das Training oder für die Validierung verwendet werden. Wenn dieser Wert festgelegt wird, verursacht dies einen Fehler.

Informationen zur Aufteilung und Quervalidierung in Autopilot finden Sie unter Kreuzvalidierung im Autopilot.

CreateAutoMLJobV2

Für tabellarische Daten müssen Sie TabularJobConfig als Typ für AutoMLProblemTypeConfig wählen.

Mit dem Parameter TabularJobConfig.ProblemType können Sie den Aufgabentyp für überwachtes Lernen (binäre Klassifikation, Mehrklassen-Klassifizierung, Regression) näher bezeichnen, das für die Modellkandidaten Ihres AutoML-Jobs V2 zur Verfügung steht.

CreateAutoMLJob

Sie können den Aufgabentyp eines AutoML-Jobs mit dem Parameter CreateAutoPilot.ProblemType festlegen. Dies begrenzt die Art der Vorverarbeitung und der verwendeten Algorithmen, die Autopilot ausprobiert. Wenn Sie bei Abschluss des Auftrags den CreateAutoPilot.ProblemType festgelegt hatten, dann stimmt der ResolvedAttribute.ProblemType mit dem von Ihnen eingestellten ProblemType überein. Wenn Sie das Feld leer lassen (odernull), wird der ProblemType für Sie abgeleitet.

Anmerkung

In manchen Fällen kann Autopilot ProblemType nicht mit ausreichender Sicherheit ableiten. In diesem Fall müssen Sie den Wert angeben, damit der Auftrag erfolgreich ist.

Sie können zu Ihrem tabellarischen Datensatz eine Spalte mit Stichprobengewichtungen hinzufügen und sie dann an Ihren AutoML-Job übergeben, um anzufordern, dass Datensatzzeilen während des Trainings und der Auswertung gewichtet werden.

Der Support für Stichprobengewichtungen steht nur im Ensembling-Modus zur Verfügung. Ihre Gewichtungen sollten numerisch und dürfen nicht negativ sein. Datenpunkte mit ungültigem oder keinem Gewichtungswert sind ausgeschlossen. Weitere Informationen zu den verfügbaren Kennzahlen finden Sie unter Gewichtete Metriken mit Autopilot.

CreateAutoMLJobV2

Für tabellarische Daten müssen Sie TabularJobConfig als Typ für AutoMLProblemTypeConfig wählen.

Um die Stichprobengewichte bei der Erstellung eines Experiments festzulegen (siehe CreateAutoMLJobV2), können Sie den Namen Ihrer Spalte mit den Stichprobengewichten im SampleWeightAttributeName Attribut des TabularJobConfig Objekts angeben. Damit ist sichergestellt, dass Ihre objektive Kennzahl die Gewichtungen für das Training, die Bewertung und die Auswahl von Modellkandidaten verwendet.

CreateAutoMLJob

Um bei der Erstellung eines Experiments die Stichprobengewichte festzulegen (siehe CreateAutoMLJob), können Sie den Namen Ihrer Spalte mit den Stichprobengewichten im SampleWeightAttributeName Attribut des utoMLChannelA-Objekts angeben. Damit ist sichergestellt, dass Ihre objektive Kennzahl die Gewichtungen für das Training, die Bewertung und die Auswahl von Modellkandidaten verwendet.

Sie können Ihren AutoML-Job V2 so konfigurieren, dass er automatisch einen Remote-Job auf Amazon EMR Serverless initiiert, wenn zusätzliche Rechenressourcen für die Verarbeitung großer Datensätze benötigt werden. Durch die nahtlose Umstellung auf EMR Serverless bei Bedarf kann der AutoML-Job Datensätze verarbeiten, die andernfalls die ursprünglich bereitgestellten Ressourcen überschreiten würden, ohne dass Sie manuell eingreifen müssen. EMRServerless ist für die Problemtypen tabellarisch und zeitreihenförmig verfügbar. Wir empfehlen, diese Option für tabellarische Datensätze einzurichten, die größer als 5 GB sind.

Damit Ihr AutoML-Job V2 für große Datenmengen automatisch auf EMR Serverless umgestellt werden kann, müssen Sie ein EmrServerlessComputeConfig Objekt, das ein ExecutionRoleARN Feld enthält, für die AutoMLComputeConfig AutoML-Job V2-Eingabeanforderung bereitstellen.

Dies ExecutionRoleARN ist die ARN IAM Rolle, die dem AutoML-Job V2 die erforderlichen Berechtigungen zum Ausführen EMR serverloser Jobs gewährt.

Diese Rolle sollte die folgende Vertrauensstellung haben:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "Service": "emr-serverless.amazonaws.com" }, "Action": "sts:AssumeRole" } ] }

Und gewähren Sie die Berechtigungen für:

  • EMRServerlose Anwendungen erstellen, auflisten und aktualisieren.

  • Auftragsausführungen in einer EMR serverlosen Anwendung starten, auflisten, abrufen oder abbrechen

  • Taggen Sie EMR serverlose Ressourcen.

  • Übergeben Sie eine IAM Rolle zur Ausführung an den EMR Serverless-Dienst.

    Durch Erteilung der iam:PassRole Berechtigung kann der AutoML-Job V2 vorübergehend die EMRServerlessRuntimeRole-* Rolle übernehmen und sie an den EMR Serverless-Dienst übergeben. Dies sind die IAM Rollen, die von den EMR serverlosen Jobausführungsumgebungen für den Zugriff auf andere AWS Dienste und Ressourcen verwendet werden, die während der Laufzeit benötigt werden, z. B. Amazon S3 für den Datenzugriff, CloudWatch für die Protokollierung, den Zugriff auf den AWS Glue Datenkatalog oder andere Dienste, die Ihren Workload-Anforderungen entsprechen.

    Einzelheiten zu diesen Rollenberechtigungen finden Sie unter Job Runtime Roles for Amazon EMR Serverless.

Die im bereitgestellten JSON Dokument definierte IAM Richtlinie gewährt diese Berechtigungen:

{ "Version": "2012-10-17", "Statement": [{ + "Sid": "EMRServerlessCreateApplicationOperation", + "Effect": "Allow", + "Action": "emr-serverless:CreateApplication", + "Resource": "arn:aws:emr-serverless:*:*:/*", + "Condition": { + "StringEquals": { + "aws:RequestTag/sagemaker:is-canvas-resource": "True", + "aws:ResourceAccount": "${aws:PrincipalAccount}" + } + } + }, + { + "Sid": "EMRServerlessListApplicationOperation", + "Effect": "Allow", + "Action": "emr-serverless:ListApplications", + "Resource": "arn:aws:emr-serverless:*:*:/*", + "Condition": { + "StringEquals": { + "aws:ResourceAccount": "${aws:PrincipalAccount}" + } + } + }, + { + "Sid": "EMRServerlessApplicationOperations", + "Effect": "Allow", + "Action": [ + "emr-serverless:UpdateApplication", + "emr-serverless:GetApplication" + ], + "Resource": "arn:aws:emr-serverless:*:*:/applications/*", + "Condition": { + "StringEquals": { + "aws:ResourceTag/sagemaker:is-canvas-resource": "True", + "aws:ResourceAccount": "${aws:PrincipalAccount}" + } + } + }, + { + "Sid": "EMRServerlessStartJobRunOperation", + "Effect": "Allow", + "Action": "emr-serverless:StartJobRun", + "Resource": "arn:aws:emr-serverless:*:*:/applications/*", + "Condition": { + "StringEquals": { + "aws:RequestTag/sagemaker:is-canvas-resource": "True", + "aws:ResourceAccount": "${aws:PrincipalAccount}" + } + } + }, + { + "Sid": "EMRServerlessListJobRunOperation", + "Effect": "Allow", + "Action": "emr-serverless:ListJobRuns", + "Resource": "arn:aws:emr-serverless:*:*:/applications/*", + "Condition": { + "StringEquals": { + "aws:ResourceTag/sagemaker:is-canvas-resource": "True", + "aws:ResourceAccount": "${aws:PrincipalAccount}" + } + } + }, + { + "Sid": "EMRServerlessJobRunOperations", + "Effect": "Allow", + "Action": [ + "emr-serverless:GetJobRun", + "emr-serverless:CancelJobRun" + ], + "Resource": "arn:aws:emr-serverless:*:*:/applications/*/jobruns/*", + "Condition": { + "StringEquals": { + "aws:ResourceTag/sagemaker:is-canvas-resource": "True", + "aws:ResourceAccount": "${aws:PrincipalAccount}" + } + } + }, + { + "Sid": "EMRServerlessTagResourceOperation", + "Effect": "Allow", + "Action": "emr-serverless:TagResource", + "Resource": "arn:aws:emr-serverless:*:*:/*", + "Condition": { + "StringEquals": { + "aws:RequestTag/sagemaker:is-canvas-resource": "True", + "aws:ResourceAccount": "${aws:PrincipalAccount}" + } + } + }, + { + "Sid": "IAMPassOperationForEMRServerless", + "Effect": "Allow", + "Action": "iam:PassRole", + "Resource": "arn:aws:iam::*:role/EMRServerlessRuntimeRole-*", + "Condition": { + "StringEquals": { + "iam:PassedToService": "emr-serverless.amazonaws.com", + "aws:ResourceAccount": "${aws:PrincipalAccount}" + } + } } ] }

Migrieren Sie ein CreateAuto MLJob zu CreateAuto MLJobV2

Wir empfehlen Benutzern von CreateAutoMLJob nach CreateAutoMLJobV2 zu migrieren.

In diesem Abschnitt werden die Unterschiede in den Eingabeparametern zwischen CreateAutoMLJobund CreateAutoMLJobV2durch Hervorheben der Änderungen an der Position, dem Namen oder der Struktur der Objekte und Attribute der Eingabeanforderung zwischen den beiden Versionen erläutert.

  • Fordern Sie Attribute an, die sich von einer Version zur nächsten nicht geändert haben.

    { "AutoMLJobName": "string", "AutoMLJobObjective": { "MetricName": "string" }, "ModelDeployConfig": { "AutoGenerateEndpointName": boolean, "EndpointName": "string" }, "OutputDataConfig": { "KmsKeyId": "string", "S3OutputPath": "string" }, "RoleArn": "string", "Tags": [ { "Key": "string", "Value": "string" } ] }
  • Fordern Sie Attribute an, die von einer Version zur nächsten Position und Struktur geändert haben.

    Die folgenden Attribute haben ihre Position geändert: DataSplitConfig, Security Config, CompletionCriteria, Mode, FeatureSpecificationS3Uri, SampleWeightAttributeName, TargetAttributeName.

    CreateAutoMLJob
    { "AutoMLJobConfig": { "Mode": "string", "CompletionCriteria": { "MaxAutoMLJobRuntimeInSeconds": number, "MaxCandidates": number, "MaxRuntimePerTrainingJobInSeconds": number }, "DataSplitConfig": { "ValidationFraction": number }, "SecurityConfig": { "EnableInterContainerTrafficEncryption": boolean, "VolumeKmsKeyId": "string", "VpcConfig": { "SecurityGroupIds": [ "string" ], "Subnets": [ "string" ] } }, "CandidateGenerationConfig": { "FeatureSpecificationS3Uri": "string" } }, "GenerateCandidateDefinitionsOnly": boolean, "ProblemType": "string" }
    CreateAutoMLJobV2
    { "AutoMLProblemTypeConfig": { "TabularJobConfig": { "Mode": "string", "ProblemType": "string", "GenerateCandidateDefinitionsOnly": boolean, "CompletionCriteria": { "MaxAutoMLJobRuntimeInSeconds": number, "MaxCandidates": number, "MaxRuntimePerTrainingJobInSeconds": number }, "FeatureSpecificationS3Uri": "string", "SampleWeightAttributeName": "string", "TargetAttributeName": "string" } }, "DataSplitConfig": { "ValidationFraction": number }, "SecurityConfig": { "EnableInterContainerTrafficEncryption": boolean, "VolumeKmsKeyId": "string", "VpcConfig": { "SecurityGroupIds": [ "string" ], "Subnets": [ "string" ] } } }
  • Die folgenden Attribute haben von einer Versionen zur nächsten Position und Struktur geändert.

    Im Folgenden JSON wird veranschaulicht, wie A utoMLJob Config funktioniert. CandidateGenerationConfigvom Typ A utoMLCandidate GenerationConfig wurde zu A verschoben utoMLProblemTypeConfig. TabularJobConfig. CandidateGenerationConfigvom Typ CandidateGenerationConfigV2.

    CreateAutoMLJob
    { "AutoMLJobConfig": { "CandidateGenerationConfig": { "AlgorithmsConfig": [ { "AutoMLAlgorithms": [ "string" ] } ], "FeatureSpecificationS3Uri": "string" } }
    CreateAutoMLJobV2
    { "AutoMLProblemTypeConfig": { "TabularJobConfig": { "CandidateGenerationConfig": { "AlgorithmsConfig": [ { "AutoMLAlgorithms": [ "string" ] } ], }, } }, }
  • Fordern Sie Attribute an, die ihre Namen und ihre Struktur geändert haben.

    Im Folgenden JSON wird veranschaulicht, wie InputDataConfig(Ein Array von A utoMLChannel) in V2 zu A utoMLJob InputDataConfig (Ein Array von utoMLJobA-Kanal) geändert wurde. Beachten Sie, dass die Attribute SampleWeightAttributeName und TargetAttributeName aus InputDataConfig nach AutoMLProblemTypeConfig umziehen.

    CreateAutoMLJob
    { "InputDataConfig": [ { "ChannelType": "string", "CompressionType": "string", "ContentType": "string", "DataSource": { "S3DataSource": { "S3DataType": "string", "S3Uri": "string" } }, "SampleWeightAttributeName": "string", "TargetAttributeName": "string" } ] }
    CreateAutoMLJobV2
    { "AutoMLJobInputDataConfig": [ { "ChannelType": "string", "CompressionType": "string", "ContentType": "string", "DataSource": { "S3DataSource": { "S3DataType": "string", "S3Uri": "string" } } } ] }