

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Creación de un conjunto de datos utilizando archivos de Amazon S3
<a name="create-a-data-set-s3"></a>

Para crear un conjunto de datos con uno o más archivos de texto (.csv, .tsv, .clf o .elf) de Amazon S3, cree un manifiesto para Quick Sight. Quick Sight usa este manifiesto para identificar los archivos que desea usar y los ajustes de carga necesarios para importarlos. Cuando cree un conjunto de datos utilizando Amazon S3, los datos del archivo se importarán automáticamente en [SPICE](spice.md).

Debe conceder acceso a Quick Sight a todos los buckets de Amazon S3 desde los que desee leer archivos. Para obtener información sobre cómo conceder a Quick Sight acceso a AWS los recursos, consulte[Configuración del acceso de Amazon Quick Sight a las fuentes AWS de datos](access-to-aws-resources.md).

**Topics**
+ [Formatos compatibles con los archivos de manifiesto de Amazon S3](supported-manifest-file-format.md)
+ [Creación de conjuntos de datos de Amazon S3](create-a-data-set-s3-procedure.md)
+ [Conjuntos de datos que utilizan archivos S3 en otra cuenta AWS](using-s3-files-in-another-aws-account.md)

# Formatos compatibles con los archivos de manifiesto de Amazon S3
<a name="supported-manifest-file-format"></a>

Los archivos de manifiesto JSON se utilizan para especificar los archivos de Amazon S3 que se van a importar a Quick Sight. Estos archivos de manifiesto JSON pueden utilizar el formato Quick Sight que se describe a continuación o el formato Amazon Redshift que se describe en [Uso de un manifiesto para especificar archivos de datos de la Guía para](https://docs.aws.amazon.com/redshift/latest/dg/loading-data-files-using-manifest.html) desarrolladores de bases de datos de *Amazon Redshift*. No es necesario utilizar Amazon Redshift para utilizar el formato de archivo de manifiesto de Amazon Redshift. 

Si utiliza un archivo de manifiesto de Quick Sight, debe tener la extensión.json, por ejemplo. `my_manifest.json` Si utiliza un archivo de manifiesto de Amazon Redshift, puede tener cualquier extensión. 

Si utiliza un archivo de manifiesto de Amazon Redshift, Quick Sight procesa la `mandatory` opción opcional como lo hace Amazon Redshift. Si no encuentra el archivo asociado, Quick Sight finaliza el proceso de importación y devuelve un error. 

Los archivos que seleccione para la importación deben ser de formato de texto delimitado (por ejemplo, .csv o .tsv), de registro (.clf) o de registro ampliado (.elf), o JSON (.json). Todos los archivos identificados en un archivo de manifiesto deben utilizar el mismo formato de archivo. Además, deben tener el mismo número y tipo de columnas. Quick Sight admite la codificación de archivos en UTF-8, pero no en UTF-8 con marca de orden de bytes (BOM). Si va a importar archivos JSON, para `globalUploadSettings` especifique `format`, pero no `delimiter`, `textqualifier` ni `containsHeader`.

Asegúrese de que todos los archivos que especifique estén en los buckets de Amazon S3 a los que ha concedido acceso a Quick Sight. Para obtener información sobre cómo conceder a Quick Sight acceso a AWS los recursos, consulte[Configuración del acceso de Amazon Quick Sight a las fuentes AWS de datos](access-to-aws-resources.md).

## Formato de archivo de manifiesto para Quick Sight
<a name="quicksight-manifest-file-format"></a>

Los archivos de manifiesto de Quick Sight utilizan el siguiente formato JSON.

```
{
    "fileLocations": [
        {
            "URIs": [
                "uri1",
                "uri2",
                "uri3"
            ]
        },
        {
            "URIPrefixes": [
                "prefix1",
                "prefix2",
                "prefix3"
            ]
        }
    ],
    "globalUploadSettings": {
        "format": "JSON",
        "delimiter": ",",
        "textqualifier": "'",
        "containsHeader": "true"
    }
}
```

Utilice los campos del elemento `fileLocations` para especificar los archivos que desea importar y los campos del elemento `globalUploadSettings` para especificar la configuración de importación de dichos archivos, como delimitadores de campo. 

A continuación se describen los elementos del archivo de manifiesto.
+ **fileLocations**: utilice este elemento para especificar los archivos que desea importar. Puede utilizar una de las matrices `URIs` y `URIPrefixes` o las dos para hacerlo. Debe especificar al menos un valor en una o la otra.
  + **URIs**— Utilice esta matriz URIs para enumerar los archivos específicos que se van a importar.

    Quick Sight puede acceder a los archivos de Amazon S3 que se encuentren en cualquier archivo Región de AWS. Sin embargo, debe usar un formato de URI que identifique la AWS región del bucket de Amazon S3 si es diferente del que usa su cuenta Quick.

    URIs se admiten los siguientes formatos.  
****    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/quick/latest/userguide/supported-manifest-file-format.html)
  + **URIPrefixes**— Utilice esta matriz para enumerar los prefijos de URI para los buckets y carpetas de S3. Se importan todos los archivos de un bucket o carpeta especificados. Quick Sight recupera de forma recursiva los archivos de las carpetas secundarias.

    Quick Sight puede acceder a los buckets o carpetas de Amazon S3 que se encuentren en cualquiera Región de AWS de ellos. Asegúrese de usar un formato de prefijo URI que identifique el bucket de S3 Región de AWS si es diferente del que usa su cuenta de Quick.

    Se admiten los prefijos URI que tengan los siguientes formatos.  
****    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/es_es/quick/latest/userguide/supported-manifest-file-format.html)
+ **globalUploadSettings**— (Opcional) Utilice este elemento para especificar la configuración de importación de los archivos de Amazon S3, como los delimitadores de campo. Si no se especifica este elemento, Quick Sight utiliza los valores predeterminados para los campos de esta sección.
**importante**  
Para archivos de registro (.clf) y registro ampliado (.elf), solo se aplica el campo **format** de esta sección, por lo que puede omitir el resto de los campos. Si decide incluirlos, sus valores se omiten. 
  + **format**: (opcional) especifique el formato de los archivos que se van a importar. Los formatos válidos son **CSV**, **TSV**, **CLF**, **ELF** y **JSON**. El valor predeterminado es **CSV**.
  + **delimiter**: (opcional) especifique el delimitador de campo del archivo. Este debe asignarse al tipo de archivo especificado en el campo `format`. Los formatos válidos son comas (**,**) para los archivos .csv y tabuladores (**\$1t**) para los archivos .tsv. El valor predeterminado es coma (**,**).
  + **textqualifier**: (opcional) especifique el calificador de texto del archivo. Los formatos válidos son comillas simples (**'**) y comillas dobles (**\$1"**). La barra diagonal inversa inicial es un carácter de escape obligatorio para las comillas dobles en JSON. El valor predeterminado es las comillas dobles (**\$1"**). Si el texto no necesita un calificador de texto, no incluya esta propiedad.
  + **containsHeader**: (opcional) especifique si el archivo tiene una fila de encabezado. Los formatos válidos son **true** o **false**. El valor predeterminado es **true**.

### Ejemplos de archivos de manifiesto para Quick Sight
<a name="quicksight-manifest-file-examples"></a>

A continuación se muestran algunos ejemplos de archivos de manifiesto de Quick Sight completados.

El siguiente ejemplo muestra un archivo de manifiesto que identifica dos archivos .csv específicos para su importación. Estos archivos utilizan comillas dobles como calificadores de texto. Los campos `format`, `delimiter`y `containsHeader` se omiten porque los valores predeterminados son aceptables.

```
{
    "fileLocations": [
        {
            "URIs": [
                "https://yourBucket.s3.amazonaws.com/data-file.csv",
                "https://yourBucket.s3.amazonaws.com/data-file-2.csv"
            ]
        }
    ],
    "globalUploadSettings": {
        "textqualifier": "\""
    }
}
```

El siguiente ejemplo muestra un archivo de manifiesto que identifica un archivo .tsv específico para su importación. Este archivo también incluye un bucket en otra región de AWS que contiene archivos .tsv adicionales para la importación. Los campos `textqualifier` y `containsHeader` se omiten porque los valores predeterminados son aceptables.

```
{
    "fileLocations": [
        {
            "URIs": [
                "https://s3.amazonaws.com/amzn-s3-demo-bucket/data.tsv"
            ]
        },
        {
            "URIPrefixes": [
                "https://s3-us-east-1.amazonaws.com/amzn-s3-demo-bucket/"
            ]
        }
    ],
    "globalUploadSettings": {
        "format": "TSV",
        "delimiter": "\t"
    }
}
```

El siguiente ejemplo identifica dos buckets que contienen archivos .clf para su importación. Uno está en la Región de AWS misma cuenta de Quick y el otro en una diferente Región de AWS. Los campos `delimiter`, `textqualifier` y `containsHeader` se omiten porque no son aplicables a los archivos de registro.

```
{
    "fileLocations": [
        {
            "URIPrefixes": [
                "https://amzn-s3-demo-bucket1.your-s3-url.com",
                "s3://amzn-s3-demo-bucket2/"
            ]
        }
    ],
    "globalUploadSettings": {
        "format": "CLF"
    }
}
```

En el siguiente ejemplo, se utiliza el formato de Amazon Redshift para identificar un archivo .csv que importar.

```
{
    "entries": [
        {
            "url": "https://amzn-s3-demo-bucket.your-s3-url.com/myalias-test/file-to-import.csv",
            "mandatory": true
        }
    ]
}
```

En el siguiente ejemplo, se utiliza el formato de Amazon Redshift para identificar dos archivos JSON que importar.

```
{
    "fileLocations": [
        {
            "URIs": [
                "https://yourBucket.s3.amazonaws.com/data-file.json",
                "https://yourBucket.s3.amazonaws.com/data-file-2.json"
            ]
        }
    ],
    "globalUploadSettings": {
        "format": "JSON"
    }
}
```

# Creación de conjuntos de datos de Amazon S3
<a name="create-a-data-set-s3-procedure"></a>

**Creación de un conjunto de datos de Amazon S3**

1. Consulte [Cuotas de origen de datos](data-source-limits.md) para asegurarse de que su conjunto de archivos de destino no supere las cuotas de origen de datos.

1. Cree un archivo de manifiesto para identificar los archivos de texto que desea importar, utilizando uno de los formatos especificados en [Formatos compatibles con los archivos de manifiesto de Amazon S3](supported-manifest-file-format.md).

1. Guarde el archivo de manifiesto en un directorio local o bien cárguelo en Amazon S3.

1. En la página de inicio rápido, elija **Datos**.

1. En la página de **datos**, elija **Crear** y, a continuación, **Nuevo conjunto de datos**.

1. Selecciona el icono de Amazon S3 y, a continuación, selecciona **Siguiente**.

1. En **Nombre de origen de datos**, escriba una descripción del origen de datos. Este nombre debe ayudarle a distinguir este origen de datos de otros.

1. Para completar el proceso **Cargar un archivo de manifiesto**, realice una de las siguientes acciones:
   + Para utilizar un archivo de manifiesto local, elija **Cargar** y, a continuación, elija **Cargar un archivo de manifiesto JSON**. En **Abrir**, elija un archivo y, a continuación, seleccione **Abrir**.
   + Para utilizar un archivo de manifiesto de Amazon S3, elija **URL** e introduzca la dirección URL del archivo de manifiesto. Para encontrar la dirección URL de un archivo de manifiesto preexistente en la consola de Amazon S3, desplácese hasta el archivo adecuado y elíjalo. Aparece un panel de propiedades, que incluye la URL del enlace. Puede copiar la URL y pegarla en Quick Sight.

1. Elija **Conectar**.

1. Para asegurarse de haber completado la conexión, seleccione **Editar/obtener vista previa de los datos**. De lo contrario, seleccione **Visualize** para crear un análisis utilizando los datos tal y como están. 

   Si selecciona **Editar/obtener vista previa de los datos**, puede especificar un nombre de conjunto de datos como parte de la preparación de los datos. De lo contrario, el nombre del conjunto de datos coincide con el nombre del archivo de manifiesto. 

   Para obtener más información sobre la preparación de datos, consulte [Preparación de datos en Amazon Quick Sight](preparing-data.md).

## Creación de conjuntos de datos basados en varios archivos de Amazon S3
<a name="data-sets-based-on-multiple-s3-files"></a>

Puede utilizar uno de los siguientes métodos para fusionar o combinar archivos de buckets de Amazon S3 dentro de Quick Sight:
+ **Combinar archivos utilizando un manifiesto**: en este caso, los archivos deben tener el mismo número de campos (columnas). Los tipos de datos deben coincidir entre campos en la misma posición en el archivo. Por ejemplo, el primer campo debe tener el mismo tipo de datos en cada archivo. Lo mismo sucede con el segundo campo, el tercer campo y así sucesivamente. Quick Sight toma los nombres de los campos del primer archivo.

  Los archivos deben incluirse en el manifiesto de forma explícita. No obstante, no tienen que estar dentro del mismo bucket de Amazon S3.

  Además, los archivos deben seguir las reglas que se describen en [Formatos compatibles con los archivos de manifiesto de Amazon S3](supported-manifest-file-format.md).

  Para obtener más información sobre cómo combinar archivos utilizando un manifiesto, consulte [Creación de un conjunto de datos utilizando archivos de Amazon S3](create-a-data-set-s3.md).
+ **Combinar archivos sin usar un manifiesto**: para combinar varios archivos en uno sin tener que incluirlos individualmente en el manifiesto, puede utilizar Athena. Con este método puede simplemente consultar sus archivos de texto, como si estuvieran en una tabla de una base de datos. Para obtener más información, consulte la publicación [Analyzing data in Amazon S3 using Athena](https://aws.amazon.com/blogs/big-data/analyzing-data-in-s3-using-amazon-athena/) en el blog de Big Data. 
+ **Utilizar un script para adjuntar archivos antes de importar**: puede utilizar un script diseñado para combinar los archivos antes de cargarlos. 

# Conjuntos de datos que utilizan archivos S3 en otra cuenta AWS
<a name="using-s3-files-in-another-aws-account"></a>

Utilice esta sección para obtener información sobre cómo configurar la seguridad para poder usar Quick Sight para acceder a los archivos de Amazon S3 de otra AWS cuenta. 

Para obtener acceso a los archivos de otra cuenta, el propietario de la otra cuenta primero debe configurar Amazon S3 para concederle los permisos necesarios para leer el archivo. Luego, en Quick Sight, debe configurar el acceso a los depósitos que se compartieron con usted. Una vez finalizados estos dos pasos, puede utilizar un manifiesto para crear un conjunto de datos.

**nota**  
 Para obtener acceso a los archivos de acceso público, no es necesario configurar ninguna seguridad especial. Sin embargo, sí que necesita un archivo de manifiesto.

**Topics**
+ [Configuración de Amazon S3 para permitir el acceso desde una cuenta Quick diferente](#setup-S3-to-allow-access-from-a-different-quicksight-account)
+ [Configuración de Quick Sight para acceder a los archivos de Amazon S3 de otra AWS cuenta](#setup-quicksight-to-access-S3-in-a-different-account)

## Configuración de Amazon S3 para permitir el acceso desde una cuenta Quick diferente
<a name="setup-S3-to-allow-access-from-a-different-quicksight-account"></a>

Utilice esta sección para obtener información sobre cómo configurar los permisos en los archivos de Amazon S3 para que Quick Sight pueda acceder a ellos desde otra AWS cuenta. 

Para obtener información sobre cómo acceder a los archivos de Amazon S3 de otra cuenta desde su cuenta de Quick Sight, consulte[Configuración de Quick Sight para acceder a los archivos de Amazon S3 de otra AWS cuenta](#setup-quicksight-to-access-S3-in-a-different-account). Para obtener más información sobre los permisos de S3, consulte [Administración de permisos de acceso para los recursos de Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/dev/s3-access-control.html) y [¿Cómo puedo configurar permisos en un objeto?](https://docs.aws.amazon.com/AmazonS3/latest/user-guide/set-object-permissions.html)

Puede utilizar el siguiente procedimiento para configurar este acceso desde la consola de S3. O bien, puede conceder permisos mediante AWS CLI o escribiendo un script. Si tiene que compartir una gran cantidad de archivos, puede crear una política de bucket de S3 en la acción `s3:GetObject`. Para utilizar una política de bucket, añádasela a los permisos del bucket, no a los permisos de archivo. Para obtener más información sobre las políticas de bucket, consulte [Ejemplos de política de bucket](https://docs.aws.amazon.com/AmazonS3/latest/dev/example-bucket-policies.html) en la *Guía para desarrolladores de Amazon S3*.

**Para configurar el acceso desde una cuenta Quick diferente desde la consola S3**

1. Obtén la dirección de correo electrónico de la AWS cuenta con la que quieres compartir. También puede obtener y utilizar el ID de usuario canónico. *Para obtener más información sobre el usuario canónico IDs, consulta los [identificadores de AWS cuenta](https://docs.aws.amazon.com/general/latest/gr/acct-identifiers.html) en la AWS Referencia general.*

1. Inicie sesión en la consola de Amazon S3 Consola de administración de AWS y ábrala en [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/).

1. Busque el bucket de Amazon S3 que desee compartir con Quick Sight. Elija **Permisos**.

1. Selecciona **Añadir cuenta** y, a continuación, introduce una dirección de correo electrónico o pega un seudónimo canónico para la AWS cuenta con la que quieres compartir. Esta dirección de correo electrónico debe ser la dirección principal para la cuenta de AWS . 

1. Elija **Sí** para **Leer los permisos del bucket** y **Enumerar objetos**.

   Elija **Save** para confirmar.

1. Busque el archivo que desea compartir y abra la configuración de permisos del archivo. 

1. Introduce una dirección de correo electrónico o el seudónimo canónico de la AWS cuenta con la que quieres compartir. Esta dirección de correo electrónico debe ser la principal de la AWS cuenta. 

1. Habilite los permisos de **lectura de objetos** para cada archivo al que Quick Sight necesite acceder. 

1. Notifique al usuario de Quick que los archivos ya están disponibles para su uso.

## Configuración de Quick Sight para acceder a los archivos de Amazon S3 de otra AWS cuenta
<a name="setup-quicksight-to-access-S3-in-a-different-account"></a>

Utilice esta sección para obtener información sobre cómo configurar Quick Sight para poder acceder a los archivos de Amazon S3 de otra AWS cuenta. Para obtener información sobre cómo permitir que otra persona acceda a sus archivos de Amazon S3 desde su cuenta Quick, consulte[Configuración de Amazon S3 para permitir el acceso desde una cuenta Quick diferente](#setup-S3-to-allow-access-from-a-different-quicksight-account).

Utilice el siguiente procedimiento para acceder a los archivos de Amazon S3 de otra cuenta desde Quick Sight. Para poder utilizar este procedimiento, los usuarios de la otra cuenta de AWS deben compartir los archivos de su bucket de Amazon S3 con usted.

**Para acceder a los archivos de Amazon S3 de otra cuenta desde Quick Sight**

1. Compruebe que el usuario o los usuarios de la otra AWS cuenta hayan otorgado a su cuenta permiso de lectura y escritura para el bucket de S3 en cuestión. 

1. Elija el icono de su perfil y, a continuación, seleccione **Administrar Quick Sight**.

1. Elija **Seguridad y permisos**.

1. En **Acceso rápido a los AWS servicios**, selecciona **Administrar**.

1. Elija **Seleccionar buckets de S3**.

1. En la pantalla **Seleccionar buckets de Amazon S3**, elija la pestaña **Buckets de S3 a los que puede acceder en AWS**.

   La pestaña predeterminada se llama **S3 buckets y está vinculada a la cuenta de Quick Sight**. Muestra todos los cubos a los que tiene acceso tu cuenta de Quick. 

1. Realice una de las siguientes acciones:
   + Para añadir todos los buckets que tiene permiso para utilizar, elija **Elegir buckets a los que se puede acceder desde otras cuentas de AWS **. 
   + Si tiene uno o más buckets de Amazon S3 que desee añadir, introduzca sus nombres. Cada uno debe coincidir exactamente con el nombre único del bucket de Amazon S3.

     Si no dispone de los permisos adecuados, verá el mensaje de error “We can't connect to this S3 bucket. Asegúrese de que todos los depósitos de S3 que especifique estén asociados a la AWS cuenta utilizada para crear esta cuenta Quick». Este mensaje de error aparece si no tienes permisos de cuenta ni permisos de Quick Sight.
**nota**  
Para usar Amazon Athena, Quick Sight debe acceder a los buckets de Amazon S3 que utiliza Athena.   
Puede añadirlos aquí uno por uno o utilizar la **opción Elegir depósitos accesibles desde** otras cuentas. AWS 

1. Elija **Select buckets** para confirmar la opción elegida. 

1. Cree un conjunto de datos nuevo basado en Amazon S3 y cargue el archivo de manifiesto. Para obtener más información sobre los conjuntos de datos de Amazon S3, consulte [Creación de un conjunto de datos utilizando archivos de Amazon S3](create-a-data-set-s3.md).