

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# CreateDatasetImportJob
<a name="API_CreateDatasetImportJob"></a>

Crea un trabajo que importa datos de entrenamiento de un origen de datos (bucket de Amazon S3) a un conjunto de datos de Amazon Personalize. Para permitir que Amazon Personalize importe los datos de entrenamiento, debe especificar un rol de servicio de IAM que tenga permiso para leer el origen de datos, ya que Amazon Personalize hace una copia de sus datos y los procesa internamente. Para obtener información sobre cómo conceder acceso a su bucket de Amazon S3, consulte [Concesión de acceso a los recursos de Amazon S3 para Amazon Personalize](https://docs.aws.amazon.com/personalize/latest/dg/granting-personalize-s3-access.html). 

Si ya ha creado un recomendador o ha implementado una versión de solución personalizada con una campaña, la forma en que los nuevos registros masivos influyen en las recomendaciones depende del caso de uso del dominio o de la receta que utilice. Para obtener más información, consulta [Influencia de los nuevos datos en las recomendaciones en tiempo real](https://docs.aws.amazon.com/personalize/latest/dg/how-new-data-influences-recommendations.html).

**importante**  
De forma predeterminada, un trabajo de importación de conjuntos de datos reemplaza cualquier dato existente en el conjunto de datos que haya importado de manera masiva. Para agregar nuevos registros sin reemplazar los datos existentes, especifique INCREMENTAL para el modo de importación de la CreateDatasetImportJob operación.

 **Estado** 

Un trabajo de importación del conjunto de datos puede aparecer en uno de los siguientes estados:
+ CREATE PENDING (CREACIÓN PENDIENTE) > CREATE IN\$1PROGRESS (CREACIÓN EN CURSO) > ACTIVE (ACTIVO) o CREATE FAILED (ERROR AL CREAR)

Para obtener el estado del trabajo de importación [DescribeDatasetImportJob](https://docs.aws.amazon.com/personalize/latest/dg/API_DescribeDatasetImportJob.html), llama e indica el nombre de recurso de Amazon (ARN) del trabajo de importación del conjunto de datos. La importación del conjunto de datos finaliza cuando el estado es ACTIVO. Si el estado muestra CREATE FAILED, la respuesta incluye una clave `failureReason` que describe el motivo del error en el trabajo.

**nota**  
La importación lleva tiempo. Deberá esperar hasta que el estado pase a ACTIVE antes de entrenar un modelo con el conjunto de datos.

**Relacionado APIs**
+  [ListDatasetImportJobs](https://docs.aws.amazon.com/personalize/latest/dg/API_ListDatasetImportJobs.html) 
+  [DescribeDatasetImportJob](https://docs.aws.amazon.com/personalize/latest/dg/API_DescribeDatasetImportJob.html) 

## Sintaxis de la solicitud
<a name="API_CreateDatasetImportJob_RequestSyntax"></a>

```
{
   "datasetArn": "string",
   "dataSource": { 
      "dataLocation": "string"
   },
   "importMode": "string",
   "jobName": "string",
   "publishAttributionMetricsToS3": boolean,
   "roleArn": "string",
   "tags": [ 
      { 
         "tagKey": "string",
         "tagValue": "string"
      }
   ]
}
```

## Parámetros de la solicitud
<a name="API_CreateDatasetImportJob_RequestParameters"></a>

La solicitud acepta los siguientes datos en formato JSON.

 ** [datasetArn](#API_CreateDatasetImportJob_RequestSyntax) **   <a name="personalize-CreateDatasetImportJob-request-datasetArn"></a>
El ARN del conjunto de datos que recibe los datos importados.  
Tipo: cadena  
Limitaciones de longitud: longitud máxima de 256.  
Patrón: `arn:([a-z\d-]+):personalize:.*:.*:.+`   
Obligatorio: sí

 ** [dataSource](#API_CreateDatasetImportJob_RequestSyntax) **   <a name="personalize-CreateDatasetImportJob-request-dataSource"></a>
El bucket de Amazon S3 que contiene los datos de entrenamiento que se importarán.  
Tipo: objeto [DataSource](API_DataSource.md)  
Obligatorio: sí

 ** [importMode](#API_CreateDatasetImportJob_RequestSyntax) **   <a name="personalize-CreateDatasetImportJob-request-importMode"></a>
Especifique cómo agregar los nuevos registros a un conjunto de datos existente. El modo de importación predeterminado es `FULL`. Si no ha importado registros masivos al conjunto de datos anteriormente, solo puede especificar `FULL`.  
+ Especifique `FULL` para que se sobrescriban todos los datos masivos existentes en el conjunto de datos. Los datos que ha importado individualmente no se reemplazan.
+ Especifique `INCREMENTAL` si desea anexar los nuevos registros a los datos existentes en su conjunto de datos. Amazon Personalize reemplaza cualquier registro con el mismo identificador por el nuevo.
Tipo: cadena  
Valores válidos: `FULL | INCREMENTAL`   
Obligatorio: no

 ** [jobName](#API_CreateDatasetImportJob_RequestSyntax) **   <a name="personalize-CreateDatasetImportJob-request-jobName"></a>
Nombre para el trabajo de importación del conjunto de datos.  
Tipo: cadena  
Limitaciones de longitud: longitud mínima de 1. La longitud máxima es de 63.  
Patrón: `^[a-zA-Z0-9][a-zA-Z0-9\-_]*`   
Obligatorio: sí

 ** [publishAttributionMetricsToS3](#API_CreateDatasetImportJob_RequestSyntax) **   <a name="personalize-CreateDatasetImportJob-request-publishAttributionMetricsToS3"></a>
Si ha creado una atribución de métricas, especifique si desea publicar las métricas de este trabajo de importación en Amazon S3  
Tipo: Booleano  
Obligatorio: no

 ** [roleArn](#API_CreateDatasetImportJob_RequestSyntax) **   <a name="personalize-CreateDatasetImportJob-request-roleArn"></a>
El ARN del rol de IAM que tiene permisos de lectura del origen de datos de Amazon S3.  
Tipo: cadena  
Limitaciones de longitud: longitud máxima de 256.  
Patrón: `arn:([a-z\d-]+):iam::\d{12}:role/?[a-zA-Z_0-9+=,.@\-_/]+`   
Obligatorio: no

 ** [tags](#API_CreateDatasetImportJob_RequestSyntax) **   <a name="personalize-CreateDatasetImportJob-request-tags"></a>
Lista de [etiquetas](https://docs.aws.amazon.com/personalize/latest/dg/tagging-resources.html) que se aplican al trabajo de importación del conjunto de datos.  
Tipo: matriz de objetos [Tag](API_Tag.md)  
Miembros de la matriz: número mínimo de 0 artículos. La cantidad máxima es de 200 artículos.  
Obligatorio: no

## Sintaxis de la respuesta
<a name="API_CreateDatasetImportJob_ResponseSyntax"></a>

```
{
   "datasetImportJobArn": "string"
}
```

## Elementos de respuesta
<a name="API_CreateDatasetImportJob_ResponseElements"></a>

Si la acción se realiza correctamente, el servicio devuelve una respuesta HTTP 200.

El servicio devuelve los datos siguientes en formato JSON.

 ** [datasetImportJobArn](#API_CreateDatasetImportJob_ResponseSyntax) **   <a name="personalize-CreateDatasetImportJob-response-datasetImportJobArn"></a>
El ARN del trabajo de importación del conjunto de datos.  
Tipo: cadena  
Limitaciones de longitud: longitud máxima de 256.  
Patrón: `arn:([a-z\d-]+):personalize:.*:.*:.+` 

## Errores
<a name="API_CreateDatasetImportJob_Errors"></a>

 ** InvalidInputException **   
Proporcione un valor válido para el campo o el parámetro.  
Código de estado HTTP: 400

 ** LimitExceededException **   
Se ha excedido el límite en el número de solicitudes por segundo.  
Código de estado HTTP: 400

 ** ResourceAlreadyExistsException **   
El recurso especificado ya existe.  
Código de estado HTTP: 400

 ** ResourceInUseException **   
El recurso especificado está en uso.  
Código de estado HTTP: 400

 ** ResourceNotFoundException **   
No se ha encontrado el recurso especificado.  
Código de estado HTTP: 400

 ** TooManyTagsException **   
Ha superado el número máximo de etiquetas que puede aplicar a este recurso.   
Código de estado HTTP: 400

## Véase también
<a name="API_CreateDatasetImportJob_SeeAlso"></a>

Para obtener más información sobre el uso de esta API en uno de los idiomas específicos AWS SDKs, consulta lo siguiente:
+  [AWS Interfaz de línea de comandos V2](https://docs.aws.amazon.com/goto/cli2/personalize-2018-05-22/CreateDatasetImportJob) 
+  [AWS SDK para .NET V4](https://docs.aws.amazon.com/goto/DotNetSDKV4/personalize-2018-05-22/CreateDatasetImportJob) 
+  [AWS SDK para C\$1\$1](https://docs.aws.amazon.com/goto/SdkForCpp/personalize-2018-05-22/CreateDatasetImportJob) 
+  [AWS SDK para Go v2](https://docs.aws.amazon.com/goto/SdkForGoV2/personalize-2018-05-22/CreateDatasetImportJob) 
+  [AWS SDK para Java V2](https://docs.aws.amazon.com/goto/SdkForJavaV2/personalize-2018-05-22/CreateDatasetImportJob) 
+  [AWS SDK para JavaScript V3](https://docs.aws.amazon.com/goto/SdkForJavaScriptV3/personalize-2018-05-22/CreateDatasetImportJob) 
+  [AWS SDK para Kotlin](https://docs.aws.amazon.com/goto/SdkForKotlin/personalize-2018-05-22/CreateDatasetImportJob) 
+  [AWS SDK para PHP V3](https://docs.aws.amazon.com/goto/SdkForPHPV3/personalize-2018-05-22/CreateDatasetImportJob) 
+  [AWS SDK para Python](https://docs.aws.amazon.com/goto/boto3/personalize-2018-05-22/CreateDatasetImportJob) 
+  [AWS SDK para Ruby V3](https://docs.aws.amazon.com/goto/SdkForRubyV3/personalize-2018-05-22/CreateDatasetImportJob) 