CreateDatasetImportJob - Amazon Forecast

Amazon Forecast n'est plus disponible pour les nouveaux clients. Les clients existants d'Amazon Forecast peuvent continuer à utiliser le service normalement. En savoir plus »

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

CreateDatasetImportJob

Importe vos données d'entraînement dans un ensemble de données Amazon Forecast. Vous indiquez l'emplacement de vos données d'entraînement dans un bucket Amazon Simple Storage Service (Amazon S3) et le nom de ressource Amazon ARN () de l'ensemble de données dans lequel vous souhaitez importer les données.

Important

Amazon Forecast n'est plus disponible pour les nouveaux clients. Les clients existants d'Amazon Forecast peuvent continuer à utiliser le service normalement. En savoir plus »

Vous devez spécifier un DataSourceobjet qui inclut un rôle AWS Identity and Access Management (IAM) qu'Amazon Forecast peut assumer pour accéder aux données, car Amazon Forecast fait une copie de vos données et les traite dans un AWS système interne. Pour plus d'informations, consultez la section Configurer les autorisations.

Les données d'entraînement doivent être au CSV format Parquet. Le délimiteur doit être une virgule (,).

Vous pouvez spécifier le chemin d'accès à un fichier spécifique, au compartiment S3 ou à un dossier du compartiment S3. Dans les deux derniers cas, Amazon Forecast importe tous les fichiers dans la limite de 10 000 fichiers.

Comme les importations de jeux de données ne sont pas agrégées, votre importation de jeu de données la plus récente est celle qui est utilisée lors de l'entraînement d'un prédicteur ou de la génération d'une prévision. Assurez-vous que votre dernier jeu de données importé contient toutes les données à partir desquelles vous souhaitez modéliser, et pas uniquement les nouvelles données collectées depuis l'importation précédente.

Pour obtenir une liste de toutes vos tâches d'importation de jeux de données, filtrées selon des critères spécifiques, utilisez l'ListDatasetImportJobsopération.

Syntaxe de la requête

{ "DatasetArn": "string", "DatasetImportJobName": "string", "DataSource": { "S3Config": { "KMSKeyArn": "string", "Path": "string", "RoleArn": "string" } }, "Format": "string", "GeolocationFormat": "string", "ImportMode": "string", "Tags": [ { "Key": "string", "Value": "string" } ], "TimestampFormat": "string", "TimeZone": "string", "UseGeolocationForTimeZone": boolean }

Paramètres de demande

La demande accepte les données suivantes au JSON format suivant.

DatasetArn

Le nom de ressource Amazon (ARN) du jeu de données Amazon Forecast dans lequel vous souhaitez importer des données.

Type : String

Contraintes de longueur : longueur maximale de 256.

Modèle : arn:([a-z\d-]+):forecast:.*:.*:.+

Obligatoire : oui

DatasetImportJobName

Nom de la tâche d'importation de l'ensemble de données. Nous recommandons d'inclure l'horodatage actuel dans le nom, par exemple,. 20190721DatasetImport Cela peut vous aider à éviter une ResourceAlreadyExistsException exception.

Type : String

Contraintes de longueur : longueur minimum de 1. Longueur maximum de 63.

Modèle : ^[a-zA-Z][a-zA-Z0-9_]*

Obligatoire : oui

DataSource

L'emplacement des données d'entraînement à importer et le rôle AWS Identity and Access Management (IAM) qu'Amazon Forecast peut assumer pour accéder aux données. Les données d'entraînement doivent être stockées dans un compartiment Amazon S3.

Si le chiffrement est utilisé, DataSource il doit inclure une clé AWS Key Management Service (KMS) et le IAM rôle doit autoriser Amazon Forecast à accéder à la clé. La KMS clé et le IAM rôle doivent correspondre à ceux spécifiés dans le EncryptionConfig paramètre de l'CreateDatasetopération.

Type : objet DataSource

Obligatoire : oui

Format

Le format des données importées, CSV ouPARQUET. La valeur par défaut estCSV.

Type : String

Contraintes de longueur : longueur maximale de 7.

Modèle : ^CSV|PARQUET$

Obligatoire : non

GeolocationFormat

Format de l'attribut de géolocalisation. L'attribut de géolocalisation peut être formaté de deux manières différentes :

  • LAT_LONG- la latitude et la longitude au format décimal (exemple : 47.61_-122.33).

  • CC_POSTALCODE(États-Unis uniquement) : le code du pays (États-Unis), suivi du ZIP code à 5 chiffres (exemple : US_98121).

Type : String

Contraintes de longueur : longueur maximale de 256.

Modèle : ^[a-zA-Z0-9_]+$

Obligatoire : non

ImportMode

Spécifie si la tâche d'importation de l'ensemble de données est une tâche FULL ou une INCREMENTAL importation. L'importation d'un FULL jeu de données remplace toutes les données existantes par les données nouvellement importées. Une INCREMENTAL importation ajoute les données importées aux données existantes.

Type : String

Valeurs valides : FULL | INCREMENTAL

Obligatoire : non

Tags

Les métadonnées facultatives que vous appliquez à la tâche d'importation du jeu de données pour vous aider à les classer et à les organiser. Chaque balise est constituée d’une clé et d’une valeur facultative que vous définissez.

Les restrictions de base suivantes s’appliquent aux balises :

  • Nombre maximum de balises par ressource : 50.

  • Pour chaque ressource, chaque clé d'identification doit être unique, et chaque clé d'identification peut avoir une seule valeur.

  • Longueur de clé maximale : 128 caractères Unicode en UTF -8.

  • Longueur maximale de la valeur : 256 caractères Unicode en UTF -8.

  • Si votre schéma de balisage est utilisé pour plusieurs services et ressources , n’oubliez pas que d’autres services peuvent avoir des restrictions concernant les caractères autorisés. Les caractères généralement autorisés sont : les lettres, les chiffres et les espaces représentables en UTF -8, ainsi que les caractères suivants : + - =. _ :/@.

  • Les clés et valeurs de balise sont sensibles à la casse.

  • N'utilisez pas aws:AWS:, ni aucune combinaison majuscules ou minuscules, comme un préfixe pour les clés, car il est réservé à l'usage. AWS Vous ne pouvez pas modifier ou supprimer les clés de balise avec ce préfixe. Les valeurs peuvent avoir ce préfixe. Si une valeur de balise a aws pour préfixe, mais pas la clé, Forecast considère qu'il s'agit d'une balise utilisateur et compte dans la limite de 50 balises. Les balises dont le seul préfixe est « ne sont pas prises en compte dans aws le calcul de vos balises par limite de ressources ».

Type : tableau d’objets Tag

Membres du tableau : nombre minimum de 0 élément. Nombre maximum de 200 éléments.

Obligatoire : non

TimestampFormat

Format des horodatages dans le jeu de données. Le format que vous spécifiez dépend du moment où le DataFrequency jeu de données a été créé. Les formats suivants sont pris en charge

  • « YYYY-MM-DD »

    Pour les fréquences de données suivantes : Y, M, W et D

  • "aaaa-MM-jj HH:mm:ss"

    Pour les fréquences de données suivantes : H, 30 min, 15 min et 1 min ; et éventuellement, pour : Y, M, W et D

Si le format n'est pas spécifié, Amazon Forecast s'attend à ce que le format soit « yyyy-MM-DD HH:MM:ss ».

Type : String

Contraintes de longueur : longueur maximale de 256.

Modèle : ^[a-zA-Z0-9\-\:\.\,\'\s]+$

Obligatoire : non

TimeZone

Un seul fuseau horaire pour chaque élément de votre jeu de données. Cette option est idéale pour les ensembles de données dont tous les horodatages se situent dans un même fuseau horaire, ou si tous les horodatages sont normalisés sur un seul fuseau horaire.

Reportez-vous au Joda-Time API pour obtenir la liste complète des noms de fuseaux horaires valides.

Type : String

Contraintes de longueur : longueur maximale de 256.

Modèle : ^[a-zA-Z0-9\/\+\-\_]+$

Obligatoire : non

UseGeolocationForTimeZone

Dérivez automatiquement les informations de fuseau horaire à partir de l'attribut de géolocalisation. Cette option est idéale pour les ensembles de données contenant des horodatages dans plusieurs fuseaux horaires et ces horodatages sont exprimés en heure locale.

Type : booléen

Obligatoire : non

Syntaxe de la réponse

{ "DatasetImportJobArn": "string" }

Eléments de réponse

Si l'action aboutit, le service renvoie une réponse HTTP 200.

Les données suivantes sont renvoyées sous JSON forme formatée par le service.

DatasetImportJobArn

Le nom de ressource Amazon (ARN) de la tâche d'importation de l'ensemble de données.

Type : String

Contraintes de longueur : longueur maximale de 256.

Modèle : arn:([a-z\d-]+):forecast:.*:.*:.+

Erreurs

InvalidInputException

Nous ne pouvons pas traiter la demande car elle contient une valeur non valide ou une valeur qui dépasse la plage valide.

HTTPCode de statut : 400

LimitExceededException

La limite du nombre de ressources par compte a été dépassée.

HTTPCode de statut : 400

ResourceAlreadyExistsException

Il existe déjà une ressource portant ce nom. Réessayez avec un autre nom.

HTTPCode de statut : 400

ResourceInUseException

La ressource spécifiée est en cours d'utilisation.

HTTPCode de statut : 400

ResourceNotFoundException

Nous ne trouvons aucune ressource portant ce nom de ressource Amazon (ARN). Vérifiez le ARN et réessayez.

HTTPCode de statut : 400

consultez aussi

Pour plus d'informations sur son utilisation API dans l'une des langues spécifiques AWS SDKs, consultez ce qui suit :