

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Paso 1: añadir documentos a Amazon S3
<a name="tutorial-reviews-add-docs"></a>

Antes de iniciar los trabajos de análisis de Amazon Comprehend, debe almacenar un conjunto de datos de muestra de reseñas de clientes en Amazon Simple Storage Service (Amazon S3). Amazon S3 aloja sus datos en contenedores denominados buckets. Amazon Comprehend puede analizar los documentos almacenados en un bucket y envía los resultados del análisis a un bucket. En este paso, cree un bucket de S3, cree carpetas de entrada y salida en el bucket y cargue un conjunto de datos de muestra en el bucket.

**Topics**
+ [Requisitos previos](#tutorial-reviews-add-docs-prereqs)
+ [Descarga de los datos de muestra](#tutorial-reviews-add-docs-download)
+ [Crear un bucket de Amazon S3](#tutorial-reviews-add-docs-bucket)
+ [(Solo para la consola) crea carpetas](#tutorial-reviews-add-docs-folders)
+ [Carga de los datos de entrada](#tutorial-reviews-add-docs-upload)

## Requisitos previos
<a name="tutorial-reviews-add-docs-prereqs"></a>

Antes de comenzar, revise [Tutorial: Análisis de la información obtenida de las opiniones de los clientes con Amazon Comprehend](tutorial-reviews.md) y complete los requisitos previos.

## Descarga de los datos de muestra
<a name="tutorial-reviews-add-docs-download"></a>

El siguiente conjunto de datos de muestra contiene reseñas de Amazon tomadas del conjunto de datos más amplio “Amazon reviews - Full”, que se publicó junto con el artículo “Character-level Convolutional Networks for Text Classification” (Xiang Zhang et al., 2015). Descargue el conjunto de datos en su equipo.

**Cómo obtener los datos de muestra**

1. Descarga el [tutorial-reviews-dataarchivo.zip](samples/tutorial-reviews-data.zip) en tu ordenador.

1. Extraiga el archivo zip en su equipo. Verá dos archivos. El archivo `THIRD_PARTY_LICENSES.txt` es la licencia de código abierto del conjunto de datos publicado por Xiang Zhang et al. El archivo `amazon-reviews.csv` es el conjunto de datos que analiza en el tutorial.

## Crear un bucket de Amazon S3
<a name="tutorial-reviews-add-docs-bucket"></a>

Tras descargar el conjunto de datos de muestra, cree un bucket de Amazon S3 para almacenar los datos de entrada y salida. Puede crear un bucket de S3 usando la consola de Amazon S3 o AWS Command Line Interface (AWS CLI). 

### Cómo crear un bucket de Amazon S3 (consola)
<a name="tutorial-reviews-add-docs-bucket-console"></a>

En la consola de Amazon S3, cree un bucket con un nombre que sea único en todas las AWS.

**Cómo crear un bucket de S3 (consola)**

1. Inicie sesión en la consola de Amazon S3 Consola de administración de AWS y ábrala en [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/).

1. En **Buckets**, seleccione **Crear bucket**.

1. En **Nombre del bucket**, ingrese un nombre único que describa el propósito del bucket.

1. En **Región**, elija la AWS región en la que desee crear el bucket. La región que elija debe ser compatible con Amazon Comprehend. Para reducir la latencia, elija la AWS región más cercana a su ubicación geográfica que sea compatible con Amazon Comprehend. Para obtener una lista de las regiones compatibles con Amazon Comprehend, consulte la [tabla de regiones](https://aws.amazon.com/about-aws/global-infrastructure/regional-product-services/) de la *Guía de infraestructura global*.

1. Deje la configuración predeterminada para **Propiedad del objeto,** **Ajustes del bucket para bloqueo de acceso público**, **Control de versiones del bucket** y **Etiquetas.**

1. Para **Cifrado predeterminado**, seleccione **Desactivar**. 
**sugerencia**  
Si bien en este tutorial no se utiliza el cifrado, es posible que desee utilizarlo al analizar datos importantes. Para el end-to-end cifrado, puede cifrar los datos almacenados en el depósito y también cuando ejecute trabajos de análisis. Para obtener más información sobre el cifrado con AWS, consulte [¿Qué es? AWS Key Management Service](https://docs.aws.amazon.com/kms/latest/developerguide/overview.html) en la *Guía para AWS Key Management Service desarrolladores*.

1. Revise las configuraciones de su bucket y, a continuación, seleccione **Crear bucket**.

### Cómo crear un bucket de Amazon S3 (AWS CLI)
<a name="tutorial-reviews-add-docs-bucket-cli"></a>

Tras abrir el AWS CLI, ejecute el `create-bucket` comando para crear un depósito que almacenará los datos de entrada y salida.

**Cómo crear un bucket de Amazon S3 (AWS CLI)**

1. Ejecute el siguiente comando en AWS CLI para crear su bucket. Sustituya amzn-s3-demo-bucket por un nombre para el bucket que sea único en todos. AWS

   ```
   aws s3api create-bucket --bucket amzn-s3-demo-bucket
   ```

   De forma predeterminada, el `create-bucket` comando crea un bucket en la región. `us-east-1` AWS Para crear un bucket en un Región de AWS que no sea `us-east-1`, añada el parámetro `LocationConstraint` para especificar su región. Por ejemplo, el siguiente comando crea un bucket en la región `us-west-2`.

   ```
   aws s3api create-bucket --bucket amzn-s3-demo-bucket
   --region us-west-2 --create-bucket-configuration LocationConstraint=us-west-2
   ```

   Tenga en cuenta que solo algunas regiones admiten Amazon Comprehend. Para obtener una lista de las regiones compatibles con Amazon Comprehend, consulte la [tabla de regiones](https://aws.amazon.com/about-aws/global-infrastructure/regional-product-services/) de la *Guía de infraestructura global*.

1. Para garantizar que el bucket se ha creado correctamente, ejecute el siguiente comando. El comando enumera todos los buckets de S3 asociados a la cuenta.

   ```
   aws s3 ls
   ```

## (Solo para la consola) crea carpetas
<a name="tutorial-reviews-add-docs-folders"></a>

A continuación, cree dos carpetas en su bucket de S3. La primera carpeta es para los datos de entrada. La segunda carpeta es donde Amazon Comprehend envía los resultados del análisis. Si usa la consola de Amazon S3, debe crear las carpetas manualmente. Si usa el AWS CLI, puede crear carpetas al cargar el conjunto de datos de muestra o al ejecutar un trabajo de análisis. Por ese motivo, proporcionamos un procedimiento para crear carpetas solo para los usuarios de la consola. Si utiliza la CLI de AWS , creará carpetas en [Carga de los datos de entrada](#tutorial-reviews-add-docs-upload) y en [Paso 3: ejecutar trabajos de análisis en documentos en Amazon S3](tutorial-reviews-analysis.md).

**Para crear carpetas en su bucket de S3 (consola)**

1. Abra la consola de Amazon S3 en [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/).

1. En **Buckets**, seleccione su bucket en la lista de buckets.

1. En la pestaña **Información general**, seleccione **Crear carpeta**.

1. Escriba `input` para el nuevo nombre de la carpeta.

1. Para la configuración de cifrado, seleccione **Ninguna (usar la configuración del bucket)**.

1. Seleccione **Save**.

1. Repita los pasos 3 a 6 para crear otra carpeta para la salida de los trabajos de análisis, pero en el paso 4, introduzca el nombre de la nueva carpeta`output`.

## Carga de los datos de entrada
<a name="tutorial-reviews-add-docs-upload"></a>

Ahora que tiene un bucket, cargue el conjunto de datos de muestra `amazon-reviews.csv`. Puede cargar datos a buckets de S3 con la consola de Amazon S3 o con AWS CLI. 

### Carga de documentos de muestra en un bucket (consola)
<a name="tutorial-reviews-add-docs-upload-console"></a>

En la consola de Amazon S3, cargue el conjunto de datos de muestra en la carpeta de entrada.

**Cómo cargar los documentos de muestra (consola)**

1. Abra la consola de Amazon S3 en [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/).

1. En **Buckets**, seleccione su bucket en la lista de buckets.

1. Elija la carpeta `input` y elija **Cargar**.

1. Seleccione **Añadir archivos** y, a continuación, seleccione el archivo `amazon-reviews.csv` en su equipo.

1. No cambie los demás valores predeterminados.

1. Seleccione **Cargar**.

### Cómo cargar documentos de muestra en un bucket (AWS CLI)
<a name="tutorial-reviews-add-docs-upload-cli"></a>

Cree una carpeta de entrada en su bucket de S3 y cargue el archivo del conjunto de datos en la nueva carpeta con el comando `cp`.

**Cómo cargar los documentos de muestra (AWS CLI)**

1. Para cargar el `amazon-reviews.csv` archivo en una nueva carpeta de su bucket, ejecute el siguiente AWS CLI comando. Reemplace amzn-s3-demo-bucket por el nombre del bucket de . Al añadir la ruta `/input/` al final, Amazon S3 crea automáticamente una nueva carpeta llamada `input` en su bucket y carga el archivo del conjunto de datos en esa carpeta.

   ```
   aws s3 cp amazon-reviews.csv s3://amzn-s3-demo-bucket/input/
   ```

1. Para garantizar que el archivo se ha creado correctamente, ejecute el siguiente comando. El comando muestra el contenido de la carpeta `input` de su bucket.

   ```
   aws s3 ls s3://amzn-s3-demo-bucket/input/
   ```

Ahora, tiene un bucket de S3 con el archivo `amazon-reviews.csv` en una carpeta llamada `input`. Si ha utilizado la consola, también tendrá una carpeta `output` en el bucket. Si utilizó el AWS CLI, creará la carpeta de salida cuando ejecute los trabajos de análisis de Amazon Comprehend.