CreateDatasetImportJob - Amazon Forecast

Amazon Forecast ya no está disponible para nuevos clientes. Los clientes actuales de Amazon Forecast pueden seguir utilizando el servicio con normalidad. Más información

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

CreateDatasetImportJob

Importa sus datos de entrenamiento a un conjunto de datos de Amazon Forecast. Usted proporciona la ubicación de sus datos de entrenamiento en un bucket de Amazon Simple Storage Service (Amazon S3) y el nombre de recurso de Amazon ARN () del conjunto de datos al que desea importar los datos.

importante

Amazon Forecast ya no está disponible para nuevos clientes. Los clientes actuales de Amazon Forecast pueden seguir utilizando el servicio con normalidad. Más información

Debe especificar un DataSourceobjeto que incluya una función AWS Identity and Access Management (IAM) que Amazon Forecast pueda asumir para acceder a los datos, ya que Amazon Forecast hace una copia de sus datos y los procesa en un AWS sistema interno. Para obtener más información, consulte Configuración de permisos.

Los datos de entrenamiento deben estar en CSV formato Parquet. El delimitador debe ser una coma (,).

Puede especificar la ruta a un archivo específico, el bucket de S3, o a una carpeta en el bucket de S3. En los dos últimos casos, Amazon Forecast importa todos los archivos hasta un límite de 10 000 archivos.

Como las importaciones de conjuntos de datos no se agregan, la importación de conjuntos de datos más reciente es la que se utiliza para entrenar al predictor o generar una previsión. Asegúrese de que la importación más reciente contenga todos los datos que desee utilizar para el modelado y no solo los datos nuevos que se recopilaron desde la importación anterior.

Para obtener una lista de todos sus trabajos de importación de conjuntos de datos, filtrados según criterios específicos, utilice la ListDatasetImportJobsoperación.

Sintaxis de la solicitud

{ "DatasetArn": "string", "DatasetImportJobName": "string", "DataSource": { "S3Config": { "KMSKeyArn": "string", "Path": "string", "RoleArn": "string" } }, "Format": "string", "GeolocationFormat": "string", "ImportMode": "string", "Tags": [ { "Key": "string", "Value": "string" } ], "TimestampFormat": "string", "TimeZone": "string", "UseGeolocationForTimeZone": boolean }

Parámetros de la solicitud

La solicitud acepta los siguientes datos en JSON formato.

DatasetArn

El nombre del recurso de Amazon (ARN) del conjunto de datos de Amazon Forecast al que desea importar los datos.

Tipo: cadena

Limitaciones de longitud: longitud máxima de 256.

Patrón: arn:([a-z\d-]+):forecast:.*:.*:.+

Obligatorio: sí

DatasetImportJobName

El nombre para el trabajo de importación del conjunto de datos. Recomendamos incluir la marca temporal actual en el nombre, por ejemplo, 20190721DatasetImport. Esto puede ayudarle a evitar que se produzca una excepción de ResourceAlreadyExistsException.

Tipo: cadena

Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 63.

Patrón: ^[a-zA-Z][a-zA-Z0-9_]*

Obligatorio: sí

DataSource

La ubicación de los datos de entrenamiento que se van a importar y una función AWS Identity and Access Management (IAM) que Amazon Forecast puede asumir para acceder a los datos. Los datos de entrenamiento tienen que estar almacenados en un bucket de Amazon S3.

Si se utiliza el cifrado, DataSource debe incluir una clave AWS Key Management Service (KMS) y el IAM rol debe permitir a Amazon Forecast acceder a la clave. La KMS clave y el IAM rol deben coincidir con los especificados en el EncryptionConfig parámetro de la CreateDatasetoperación.

Tipo: objeto DataSource

Obligatorio: sí

Format

El formato de los datos importados, CSV oPARQUET. El valor predeterminado esCSV.

Tipo: cadena

Limitaciones de longitud: longitud máxima de 7.

Patrón: ^CSV|PARQUET$

Obligatorio: no

GeolocationFormat

El formato del atributo de geolocalización. Al atributo de geolocalización se le puede dar formato de dos maneras:

  • LAT_LONG: la latitud y la longitud en formato decimal (ejemplo: 47,61_-122,33).

  • CC_POSTALCODE(Solo EE. UU.): el código de país (EE. UU.) seguido del ZIP código de 5 dígitos (ejemplo: US_98121).

Tipo: cadena

Limitaciones de longitud: longitud máxima de 256.

Patrón: ^[a-zA-Z0-9_]+$

Obligatorio: no

ImportMode

Especifica si el trabajo de importación del conjunto de datos es una importación FULL o INCREMENTAL. Una importación de conjunto de datos de FULL reemplaza todos los datos existentes por los datos recién importados. Una importación de INCREMENTAL añade los datos importados a los datos existentes.

Tipo: cadena

Valores válidos: FULL | INCREMENTAL

Obligatorio: no

Tags

Los metadatos opcionales que se aplican al trabajo de importación del conjunto de datos para ayudarle a categorizarlos y organizarlos. Cada etiqueta está formada por una clave y un valor opcional, ambos definidos por el usuario.

Se aplican las siguientes restricciones básicas a las etiquetas:

  • Número máximo de etiquetas por recurso: 50.

  • Para cada recurso, cada clave de etiqueta debe ser única y solo puede tener un valor.

  • Longitud máxima de clave: 128 caracteres Unicode en -8. UTF

  • Longitud máxima del valor: 256 caracteres Unicode en UTF -8.

  • Si se utiliza su esquema de etiquetado en múltiples servicios y recursos, recuerde que otros servicios pueden tener otras restricciones sobre caracteres permitidos. Los caracteres generalmente permitidos son: letras, números y espacios representables en UTF -8, y los siguientes caracteres: + - =. _:/@.

  • Las claves y los valores de las etiquetas distinguen entre mayúsculas y minúsculas.

  • No utilice aws:AWS:, ni ninguna combinación de mayúsculas o minúsculas como prefijo para las teclas, ya que está reservado para su uso. AWS Las claves de etiquetas que tienen este prefijo no se pueden editar ni eliminar. Los valores pueden tener este prefijo. Si el valor de una etiqueta tiene aws como prefijo pero la clave no, Forecast la considera una etiqueta de usuario y se contabilizará en el límite de 50 etiquetas. Las etiquetas que tengan solo el prefijo de clave de aws no cuentan para el límite de etiquetas por recurso.

Tipo: matriz de objetos Tag

Miembros de la matriz: número mínimo de 0 artículos. La cantidad máxima es de 200 artículos.

Obligatorio: no

TimestampFormat

El formato de las marcas temporales del conjunto de datos. El formato que especifique depende de la DataFrequency especificada cuando se creó el conjunto de datos. Se admiten los siguientes formatos:

  • “aaaa-MM-dd”

    Para las siguientes frecuencias de datos: Y (anual), M (mensual), W (semanal) y D (diaria)

  • "aaaa-MM-dd HH:mm:ss"

    Para las siguientes frecuencias de datos: H, 30 minutos, 15 minutos y 1 minuto; y opcionalmente, para: Y, M, W y D

Si no se especifica el formato, Amazon Forecast espera que sea “aaaa-MM-dd HH:mm:ss”.

Tipo: cadena

Limitaciones de longitud: longitud máxima de 256.

Patrón: ^[a-zA-Z0-9\-\:\.\,\'\s]+$

Obligatorio: no

TimeZone

Una zona horaria única para cada artículo del conjunto de datos. Esta opción es ideal para conjuntos de datos con todas las marcas temporales dentro de una sola zona horaria, o si todas las marcas temporales están normalizadas en una sola zona horaria.

Consulte Joda-Time para obtener una lista completa de API los nombres de zonas horarias válidos.

Tipo: cadena

Limitaciones de longitud: longitud máxima de 256.

Patrón: ^[a-zA-Z0-9\/\+\-\_]+$

Obligatorio: no

UseGeolocationForTimeZone

Obtenga automáticamente la información de la zona horaria a partir del atributo de geolocalización. Esta opción es ideal para conjuntos de datos que contienen marcas temporales en varias zonas horarias y si esas marcas temporales se expresan en hora local.

Tipo: Booleano

Obligatorio: no

Sintaxis de la respuesta

{ "DatasetImportJobArn": "string" }

Elementos de respuesta

Si la acción se realiza correctamente, el servicio envía una respuesta de HTTP 200.

El servicio devuelve los siguientes datos en JSON formato.

DatasetImportJobArn

El nombre del recurso de Amazon (ARN) del trabajo de importación del conjunto de datos.

Tipo: cadena

Limitaciones de longitud: longitud máxima de 256.

Patrón: arn:([a-z\d-]+):forecast:.*:.*:.+

Errores

InvalidInputException

No podemos procesar la solicitud porque incluye un valor no válido o un valor que supera el rango válido.

HTTPCódigo de estado: 400

LimitExceededException

Se ha superado el límite en el número de recursos por cuenta.

HTTPCódigo de estado: 400

ResourceAlreadyExistsException

Ya existe un recurso con este nombre. Inténtelo de nuevo con un nombre diferente.

HTTPCódigo de estado: 400

ResourceInUseException

El recurso especificado está en uso.

HTTPCódigo de estado: 400

ResourceNotFoundException

No podemos encontrar un recurso con ese nombre de recurso de Amazon (ARN). Compruebe la casilla ARN e inténtelo de nuevo.

HTTPCódigo de estado: 400

Véase también

Para obtener más información sobre cómo usarlo API en uno de los idiomas específicos AWS SDKs, consulte lo siguiente: