CreateDatasetImportJob - Amazon Forecast

Amazon Forecast ist für Neukunden nicht mehr verfügbar. Bestehende Kunden von Amazon Forecast können den Service weiterhin wie gewohnt nutzen. Erfahren Sie mehr“

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

CreateDatasetImportJob

Importiert Ihre Trainingsdaten in einen Amazon Forecast-Datensatz. Sie geben den Speicherort Ihrer Trainingsdaten in einem Amazon Simple Storage Service (Amazon S3) -Bucket und den Amazon-Ressourcennamen (ARN) des Datensatzes an, in den Sie die Daten importieren möchten.

Wichtig

Amazon Forecast ist für Neukunden nicht mehr verfügbar. Bestehende Kunden von Amazon Forecast können den Service weiterhin wie gewohnt nutzen. Erfahren Sie mehr“

Sie müssen ein DataSourceObjekt angeben, das eine AWS Identity and Access Management (IAM) Rolle enthält, die Amazon Forecast für den Zugriff auf die Daten übernehmen kann, da Amazon Forecast eine Kopie Ihrer Daten erstellt und diese in einem internen AWS System verarbeitet. Weitere Informationen finden Sie unter Berechtigungen einrichten.

Die Trainingsdaten müssen im Parquet-Format CSV oder im Parquet-Format vorliegen. Das Trennzeichen muss ein Komma (,) sein.

Sie können den Pfad zu einer bestimmten Datei, dem S3-Bucket oder zu einem Ordner im S3-Bucket angeben. In den beiden letztgenannten Fällen importiert Amazon Forecast alle Dateien bis zum Limit von 10.000 Dateien.

Da Datensatzimporte nicht aggregiert werden, ist Ihr letzter Datensatzimport derjenige, der beim Trainieren eines Prädiktors oder beim Generieren einer Prognose verwendet wird. Stellen Sie sicher, dass Ihr letzter Datensatz-Import alle Daten enthält, anhand derer Sie modellieren möchten, und nicht nur die neuen Daten, die seit dem letzten Import erfasst wurden.

Verwenden Sie den ListDatasetImportJobsVorgang, um eine nach bestimmten Kriterien gefilterte Liste aller Ihrer Datenimportaufträge abzurufen.

Anforderungssyntax

{ "DatasetArn": "string", "DatasetImportJobName": "string", "DataSource": { "S3Config": { "KMSKeyArn": "string", "Path": "string", "RoleArn": "string" } }, "Format": "string", "GeolocationFormat": "string", "ImportMode": "string", "Tags": [ { "Key": "string", "Value": "string" } ], "TimestampFormat": "string", "TimeZone": "string", "UseGeolocationForTimeZone": boolean }

Anforderungsparameter

Die Anfrage akzeptiert die folgenden Daten im JSON Format.

DatasetArn

Der Amazon-Ressourcenname (ARN) des Amazon Forecast-Datensatzes, in den Sie Daten importieren möchten.

Typ: Zeichenfolge

Längenbeschränkungen: Maximale Länge beträgt 256 Zeichen.

Pattern: arn:([a-z\d-]+):forecast:.*:.*:.+

Erforderlich: Ja

DatasetImportJobName

Der Name für den Datensatz-Importjob. Wir empfehlen, den aktuellen Zeitstempel in den Namen aufzunehmen, zum Beispiel. 20190721DatasetImport Dies kann Ihnen helfen, eine ResourceAlreadyExistsException Ausnahme zu vermeiden.

Typ: Zeichenfolge

Längenbeschränkungen: Minimale Länge beträgt 1 Zeichen. Maximale Länge beträgt 63 Zeichen.

Pattern: ^[a-zA-Z][a-zA-Z0-9_]*

Erforderlich: Ja

DataSource

Der Speicherort der zu importierenden Trainingsdaten und eine AWS Identity and Access Management (IAM) Rolle, die Amazon Forecast für den Zugriff auf die Daten übernehmen kann. Die Trainingsdaten müssen in einem Amazon S3 S3-Bucket gespeichert werden.

Wenn Verschlüsselung verwendet wird, DataSource muss sie einen AWS Key Management Service (KMS) -Schlüssel enthalten und die IAM Rolle muss Amazon Forecast die Erlaubnis gewähren, auf den Schlüssel zuzugreifen. Der KMS Schlüssel und die IAM Rolle müssen mit denen übereinstimmen, die im EncryptionConfig Parameter des CreateDatasetVorgangs angegeben sind.

Typ: DataSource Objekt

Erforderlich: Ja

Format

Das Format der importierten Daten CSV oderPARQUET. Der Standardwert istCSV.

Typ: Zeichenfolge

Längenbeschränkungen: Maximale Länge von 7.

Pattern: ^CSV|PARQUET$

Erforderlich: Nein

GeolocationFormat

Das Format des Geolocation-Attributs. Das Geolocation-Attribut kann auf zwei Arten formatiert werden:

  • LAT_LONG- Breitengrad und Längengrad im Dezimalformat (Beispiel: 47.61_-122.33).

  • CC_POSTALCODE(Nur USA) — der Ländercode (USA), gefolgt vom 5-stelligen ZIP Code (Beispiel: US_98121).

Typ: Zeichenfolge

Längenbeschränkungen: Maximale Länge beträgt 256 Zeichen.

Pattern: ^[a-zA-Z0-9_]+$

Erforderlich: Nein

ImportMode

Gibt an, ob es sich bei dem Dataset-Importjob um einen Import oder um einen Import handelt. FULL INCREMENTAL Ein FULL Datensatzimport ersetzt alle vorhandenen Daten durch die neu importierten Daten. Bei einem INCREMENTAL Import werden die importierten Daten an die vorhandenen Daten angehängt.

Typ: Zeichenfolge

Zulässige Werte: FULL | INCREMENTAL

Erforderlich: Nein

Tags

Die optionalen Metadaten, die Sie auf den Dataset-Importjob anwenden, helfen Ihnen dabei, sie zu kategorisieren und zu organisieren. Jeder Tag (Markierung) besteht aus einem Schlüssel und einem optionalen Wert, beides können Sie bestimmen.

Die folgenden grundlegenden Einschränkungen gelten für Tags (Markierungen):

  • Maximale Anzahl von Tags pro Ressource: 50.

  • Jeder Tag (Markierung) muss für jede Ressource eindeutig sein. Jeder Tag (Markierung) kann nur einen Wert haben.

  • Maximale Schlüssellänge - 128 Unicode-Zeichen in UTF -8.

  • Maximale Wertlänge - 256 Unicode-Zeichen in UTF -8.

  • Wenn Ihr Markierungsschema für mehrere -Services und -Ressourcen verwendet wird, denken Sie daran, dass andere Services möglicherweise Einschränkungen für zulässige Zeichen haben. Allgemein zulässige Zeichen sind: Buchstaben, Zahlen und Leerzeichen, die durch UTF -8 dargestellt werden können, sowie die folgenden Zeichen: + - =. _:/@.

  • Bei Tag-Schlüsseln und -Werten muss die Groß- und Kleinschreibung beachtet werden.

  • Verwenden Sie nichtaws:,AWS:, oder eine Kombination von Groß- oder Kleinbuchstaben, z. B. ein Präfix für Schlüssel, da es für die Verwendung reserviert ist. AWS Sie können Tag-Schlüssel mit diesem Präfix nicht bearbeiten oder löschen. Werte können dieses Präfix haben. Wenn ein Tag-Wert ein Präfix hataws, der Schlüssel jedoch nicht, betrachtet Forecast ihn als Benutzertag und wird auf das Limit von 50 Tags angerechnet. Tags, die nur das key prefix von enthalten, werden aws nicht auf Ihre Stichwörter pro Ressourcenlimit angerechnet.

Typ: Array von Tag-Objekten

Array-Mitglieder: Die Mindestanzahl beträgt 0 Elemente. Die maximale Anzahl beträgt 200 Elemente.

Erforderlich: Nein

TimestampFormat

Das Format der Zeitstempel im Datensatz. Das Format, das Sie angeben, hängt von dem Format ab, das bei der Erstellung des Datensatzes DataFrequency angegeben wurde. Die folgenden Formate werden unterstützt

  • „yyyy-MM-DD“

    Für die folgenden Datenfrequenzen: Y, M, W und D

  • "jjjj-MM-tt HH:mm:ss"

    Für die folgenden Datenfrequenzen: H, 30 Minuten, 15 Minuten und 1 Minute; und optional für: Y, M, W und D

Wenn das Format nicht angegeben ist, erwartet Amazon Forecast, dass das Format „yyyy-MM-DD hh:mm:ss“ lautet.

Typ: Zeichenfolge

Längenbeschränkungen: Maximale Länge beträgt 256 Zeichen.

Pattern: ^[a-zA-Z0-9\-\:\.\,\'\s]+$

Erforderlich: Nein

TimeZone

Eine einzige Zeitzone für jeden Artikel in Ihrem Datensatz. Diese Option ist ideal für Datensätze mit allen Zeitstempeln innerhalb einer einzigen Zeitzone oder wenn alle Zeitstempel auf eine einzige Zeitzone normalisiert sind.

Eine vollständige Liste der gültigen Zeitzonennamen finden Sie in der API Joda-Time.

Typ: Zeichenfolge

Längenbeschränkungen: Maximale Länge beträgt 256 Zeichen.

Pattern: ^[a-zA-Z0-9\/\+\-\_]+$

Erforderlich: Nein

UseGeolocationForTimeZone

Leiten Sie automatisch Zeitzoneninformationen aus dem Geolocation-Attribut ab. Diese Option ist ideal für Datensätze, die Zeitstempel in mehreren Zeitzonen enthalten und diese Zeitstempel in Ortszeit ausgedrückt werden.

Typ: Boolesch

Erforderlich: Nein

Antwortsyntax

{ "DatasetImportJobArn": "string" }

Antwortelemente

Wenn die Aktion erfolgreich ist, sendet der Dienst eine HTTP 200-Antwort zurück.

Die folgenden Daten werden vom Dienst im JSON Format zurückgegeben.

DatasetImportJobArn

Der Amazon-Ressourcenname (ARN) des Datensatz-Importjobs.

Typ: Zeichenfolge

Längenbeschränkungen: Maximale Länge beträgt 256 Zeichen.

Pattern: arn:([a-z\d-]+):forecast:.*:.*:.+

Fehler

InvalidInputException

Wir können die Anfrage nicht bearbeiten, da sie einen ungültigen Wert oder einen Wert enthält, der den gültigen Bereich überschreitet.

HTTPStatuscode: 400

LimitExceededException

Das Limit für die Anzahl der Ressourcen pro Konto wurde überschritten.

HTTPStatuscode: 400

ResourceAlreadyExistsException

Es gibt bereits eine Ressource mit diesem Namen. Versuchen Sie es erneut mit einem anderen Namen.

HTTPStatuscode: 400

ResourceInUseException

Die angegebene Ressource wird verwendet.

HTTPStatuscode: 400

ResourceNotFoundException

Wir können keine Ressource mit diesem Amazon-Ressourcennamen (ARN) finden. Überprüfen Sie das ARN und versuchen Sie es erneut.

HTTPStatuscode: 400

Weitere Informationen finden Sie unter:

Weitere Informationen zur Verwendung API in einer der sprachspezifischen Sprachen AWS SDKs finden Sie im Folgenden: