

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Como criar um conjunto de dados usando arquivos do Amazon S3
<a name="create-a-data-set-s3"></a>

Para criar um conjunto de dados usando um ou mais arquivos de texto (.csv, .tsv, .clf ou .elf) do Amazon S3, crie um manifesto para o Quick Sight. O Quick Sight usa esse manifesto para identificar os arquivos que você deseja usar e as configurações de upload necessárias para importá-los. Ao criar um conjunto de dados usando o Amazon S3, os dados do arquivo são automaticamente importados para o [SPICE](spice.md).

Você deve conceder acesso ao Quick Sight a todos os buckets do Amazon S3 dos quais você deseja ler arquivos. Para obter informações sobre como conceder acesso aos AWS recursos do Quick Sight, consulte[Configurando o acesso do Amazon Quick Sight às fontes de AWS dados](access-to-aws-resources.md).

**Topics**
+ [Formatos compatíveis para arquivos manifesto do Amazon S3](supported-manifest-file-format.md)
+ [Criação de conjuntos de dados do Amazon S3](create-a-data-set-s3-procedure.md)
+ [Conjuntos de dados usando arquivos S3 em outra conta AWS](using-s3-files-in-another-aws-account.md)

# Formatos compatíveis para arquivos manifesto do Amazon S3
<a name="supported-manifest-file-format"></a>

Você usa arquivos de manifesto JSON para especificar arquivos no Amazon S3 a serem importados para o Quick Sight. Esses arquivos de manifesto JSON podem usar o formato Quick Sight descrito a seguir ou o formato do Amazon Redshift descrito [em Uso de um manifesto para especificar arquivos de dados no Guia do desenvolvedor do banco de dados](https://docs.aws.amazon.com/redshift/latest/dg/loading-data-files-using-manifest.html) do *Amazon Redshift*. Você não precisa usar o Amazon Redshift para utilizar o formato de arquivo manifesto do Amazon Redshift. 

Se você usar um arquivo de manifesto do Quick Sight, ele deverá ter uma extensão.json, por exemplo. `my_manifest.json` Se você usar um arquivo manifesto do Amazon Redshift, ele poderá ter qualquer extensão. 

Se você usa um arquivo de manifesto do Amazon Redshift, o Quick Sight processa a `mandatory` opção opcional da mesma forma que o Amazon Redshift. Se o arquivo associado não for encontrado, o Quick Sight encerrará o processo de importação e retornará um erro. 

Os arquivos selecionados para importação devem estar no formato de texto delimitado (por exemplo, .csv ou .tsv), log (.clf) ou log estendido (.elf), bem como JSON (.json). Todos os arquivos identificados em um arquivo manifesto devem ter o mesmo formato. Além disso, eles devem ter o mesmo número e tipo de colunas. O Quick Sight suporta codificação de arquivo UTF-8, mas não UTF-8 com marca de ordem de bytes (BOM). Se você estiver importando arquivos JSON, em `globalUploadSettings`, é necessário especificar `format`, mas não `delimiter`, `textqualifier` nem `containsHeader`.

Certifique-se de que todos os arquivos que você especificar estejam nos buckets do Amazon S3 aos quais você concedeu acesso ao Quick Sight. Para obter informações sobre como conceder acesso aos AWS recursos do Quick Sight, consulte[Configurando o acesso do Amazon Quick Sight às fontes de AWS dados](access-to-aws-resources.md).

## Formato de arquivo de manifesto para o Quick Sight
<a name="quicksight-manifest-file-format"></a>

Os arquivos de manifesto do Quick Sight usam o seguinte formato JSON.

```
{
    "fileLocations": [
        {
            "URIs": [
                "uri1",
                "uri2",
                "uri3"
            ]
        },
        {
            "URIPrefixes": [
                "prefix1",
                "prefix2",
                "prefix3"
            ]
        }
    ],
    "globalUploadSettings": {
        "format": "JSON",
        "delimiter": ",",
        "textqualifier": "'",
        "containsHeader": "true"
    }
}
```

Use os campos no elemento `fileLocations` para especificar os arquivos a serem importados e os campos no elemento `globalUploadSettings` para especificar as configurações de importação para esses arquivos, como delimitadores de campo. 

Os elementos do arquivo manifesto estão descritos a seguir:
+ **fileLocations**: use este elemento para especificar os arquivos a serem importados. Você pode usar um ou dois arrays `URIs` e `URIPrefixes` para fazer isso. Você deve especificar pelo menos um valor em um ou outro.
  + **URIs**— Use essa matriz URIs para listar os arquivos específicos a serem importados.

    O Quick Sight pode acessar arquivos do Amazon S3 que estão em qualquer arquivo. Região da AWS No entanto, você deve usar um formato de URI que identifique a AWS região do bucket do Amazon S3 se ela for diferente daquela usada pela sua conta Quick.

    URIs nos formatos a seguir são suportados.  
****    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/pt_br/quick/latest/userguide/supported-manifest-file-format.html)
  + **URIPrefixes**— Use essa matriz para listar prefixos de URI para buckets e pastas do S3. Todos os arquivos em um bucket ou pasta especificados são importados. O Quick Sight recupera recursivamente arquivos de pastas secundárias.

    O Quick Sight pode acessar buckets ou pastas do Amazon S3 que estejam em qualquer um deles. Região da AWS Certifique-se de usar um formato de prefixo de URI que identifique o bucket do S3 Região da AWS se ele for diferente daquele usado pela sua conta Quick.

    São compatíveis os prefixos de URI nos seguintes formatos:  
****    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/pt_br/quick/latest/userguide/supported-manifest-file-format.html)
+ **globalUploadSettings**— (Opcional) Use esse elemento para especificar as configurações de importação para os arquivos do Amazon S3, como delimitadores de campo. Se esse elemento não for especificado, o Quick Sight usará os valores padrão para os campos desta seção.
**Importante**  
Para arquivos log (.clf) e log estendido (.elf), apenas o campo **format** dessa seção será aplicável, portanto você pode ignorar os outros campos. Se você optar por incluí-los, os valores serão ignorados. 
  + **formato**: (opcional) especifique o formato dos arquivos a serem importados. Os formatos válidos são **CSV**, **TSV**, **CLF**, **ELF** e **JSON**. O valor padrão é **CSV**.
  + **delimitador**: (opcional) especifique o delimitador de campo do arquivo. Isso deve ser mapeado para o tipo de arquivo especificado no campo `format`. Os formatos válidos são vírgulas (**,**) para arquivos .csv e tabulações (**\$1t**) para arquivos .tsv. O valor padrão é vírgula (**,**).
  + **textqualifier**: (opcional) especifique o qualificador de texto do arquivo. Os formatos válidos são compostos por aspas simples (**'**) e aspas duplas (**\$1"**). A barra invertida inicial é um caractere de escape necessário para aspas duplas em JSON. O valor padrão é aspas duplas (**\$1"**).​ Se o texto não precisar de um qualificador de texto, não inclua essa propriedade.
  + **containsHeader**: (opcional) especifique se o arquivo tem uma linha de cabeçalho. Os formatos válidos são **true** ou **false**. O valor padrão é **true**.

### Exemplos de arquivos de manifesto para o Quick Sight
<a name="quicksight-manifest-file-examples"></a>

A seguir estão alguns exemplos de arquivos de manifesto do Quick Sight concluídos.

O exemplo a seguir mostra um arquivo manifesto que identifica dois arquivos .csv específicos para importação. Esses arquivos usam aspas duplas para qualificadores de texto. Os campos `format`, `delimiter` e `containsHeader` são ignorados, pois os valores padrão são aceitáveis.

```
{
    "fileLocations": [
        {
            "URIs": [
                "https://yourBucket.s3.amazonaws.com/data-file.csv",
                "https://yourBucket.s3.amazonaws.com/data-file-2.csv"
            ]
        }
    ],
    "globalUploadSettings": {
        "textqualifier": "\""
    }
}
```

O exemplo a seguir mostra um arquivo manifesto que identifica um arquivo .tsv específico para importação. Esse arquivo também inclui um bucket em outra região da AWS que contém arquivos .tsv adicionais para importação. Os campos `textqualifier` e `containsHeader` são ignorados, pois os valores padrão são aceitáveis.

```
{
    "fileLocations": [
        {
            "URIs": [
                "https://s3.amazonaws.com/amzn-s3-demo-bucket/data.tsv"
            ]
        },
        {
            "URIPrefixes": [
                "https://s3-us-east-1.amazonaws.com/amzn-s3-demo-bucket/"
            ]
        }
    ],
    "globalUploadSettings": {
        "format": "TSV",
        "delimiter": "\t"
    }
}
```

O exemplo a seguir identifica dois buckets que contêm arquivos .clf para importação. Uma está na Região da AWS mesma conta Rápida e a outra em outra Região da AWS. Os campos `delimiter`, `textqualifier` e `containsHeader` são ignorados, pois não são aplicáveis para arquivos de log.

```
{
    "fileLocations": [
        {
            "URIPrefixes": [
                "https://amzn-s3-demo-bucket1.your-s3-url.com",
                "s3://amzn-s3-demo-bucket2/"
            ]
        }
    ],
    "globalUploadSettings": {
        "format": "CLF"
    }
}
```

O exemplo a seguir usa o formato do Amazon Redshift para identificar um arquivo .csv para importação.

```
{
    "entries": [
        {
            "url": "https://amzn-s3-demo-bucket.your-s3-url.com/myalias-test/file-to-import.csv",
            "mandatory": true
        }
    ]
}
```

O exemplo a seguir usa o formato do Amazon Redshift para identificar dois arquivos JSON para importação.

```
{
    "fileLocations": [
        {
            "URIs": [
                "https://yourBucket.s3.amazonaws.com/data-file.json",
                "https://yourBucket.s3.amazonaws.com/data-file-2.json"
            ]
        }
    ],
    "globalUploadSettings": {
        "format": "JSON"
    }
}
```

# Criação de conjuntos de dados do Amazon S3
<a name="create-a-data-set-s3-procedure"></a>

**Para criar um conjunto de dados do Amazon S3**

1. Marque [Cotas de fonte de dados](data-source-limits.md) para garantir que seu arquivo de destino não exceda as cotas da fonte de dados.

1. Crie um arquivo manifesto para identificar os arquivos de texto que você deseja importar, usando um dos formatos especificados em [Formatos compatíveis para arquivos manifesto do Amazon S3](supported-manifest-file-format.md).

1. Salve o arquivo manifesto em um diretório local ou carregue-o no Amazon S3.

1. Na página de início rápido, escolha **Dados**.

1. Na página **Dados**, escolha **Criar** e depois **Novo conjunto de dados.**

1. **Escolha o ícone Amazon S3 e, em seguida, escolha Avançar.**

1. Em **Data source name (Nome da fonte de dados)**, digite uma descrição da fonte de dados. Esse nome deve ser algo que ajude a diferenciar essa fonte de dados de outras.

1. Em **Upload a manifest file**, execute uma das seguintes opções:
   + Para usar um arquivo manifesto local, escolha **Upload** e, em seguida, **Upload a JSON manifest file**. Em **Open**, escolha um arquivo e, em seguida, **Open**.
   + Para usar um arquivo manifesto do Amazon S3, selecione **URL** e insira o URL do arquivo manifesto. Para encontrar o URL de um arquivo manifesto preexistente no console do Amazon S3, navegue até o arquivo apropriado e selecione-o. Um painel de propriedades é exibido, incluindo o link do URL. Você pode copiar o URL e colá-lo no Quick Sight.

1. Selecione **Conectar**.

1. Para ter certeza de que a conexão está concluída, escolha **Edit/Preview data**. Do contrário, escolha **Visualize** para criar uma análise usando os dados da forma como se encontram. 

   Se escolher **Editar ou visualizar dados**, poderá especificar um nome de conjunto de dados como parte da preparação dos dados. Do contrário, o nome do conjunto de dados coincidirá com o nome do arquivo manifesto. 

   Para saber mais sobre a preparação de dados, consulte [Preparação de dados no Amazon Quick Sight](preparing-data.md).

## Criação de conjuntos de dados baseados em vários arquivos do Amazon S3
<a name="data-sets-based-on-multiple-s3-files"></a>

Você pode usar um dos vários métodos para mesclar ou combinar arquivos dos buckets do Amazon S3 dentro do Quick Sight:
+ **Combinar arquivos usando um manifesto**: nesse caso, os arquivos devem ter o mesmo número de campos (colunas). Os tipos de dados entre os campos devem ter a mesma posição que no arquivo. Por exemplo, o primeiro campo deve ter o mesmo tipo de dados que em cada arquivo. O mesmo vale para o segundo campo, o terceiro e assim por diante. O Quick Sight usa os nomes dos campos do primeiro arquivo.

  Os arquivos devem ser listados explicitamente no manifesto. No entanto, não é preciso que estejam dentro do mesmo bucket do Amazon S3.

  Além disso, os arquivos devem seguir as regras descritas em [Formatos compatíveis para arquivos manifesto do Amazon S3](supported-manifest-file-format.md).

  Para obter mais detalhes sobre combinação de arquivos usando um manifesto, consulte [Como criar um conjunto de dados usando arquivos do Amazon S3](create-a-data-set-s3.md).
+ **Mesclar arquivos sem usar um manifesto**: para mesclar vários arquivos em um único sem a necessidade de listá-los individualmente no manifesto, use o Athena. Com esse método, você pode simplesmente consultar seus arquivos de texto, tal como eles estão em uma tabela em um banco de dados. Para obter mais informações, consulte a publicação [Analyzing data in Amazon S3 using Athena](https://aws.amazon.com/blogs/big-data/analyzing-data-in-s3-using-amazon-athena/) no blog de big data. 
+ **Usar um script para anexar arquivos antes de importar**: você pode usar um script criado para combinar os arquivos antes de carregá-los. 

# Conjuntos de dados usando arquivos S3 em outra conta AWS
<a name="using-s3-files-in-another-aws-account"></a>

Use esta seção para aprender como configurar a segurança para que você possa usar o Quick Sight para acessar arquivos do Amazon S3 em outra AWS conta. 

Antes de acessar arquivos em outra conta, o proprietário da outra conta precisa configurar o Amazon S3 para conceder permissões de leitura para o arquivo. Em seguida, no Quick Sight, você deve configurar o acesso aos buckets que foram compartilhados com você. Depois que as duas etapas forem concluídas, você poderá usar um manifesto para criar um conjunto de dados.

**nota**  
 Para acessar arquivos que são compartilhados com o público, não é necessário configurar nenhuma segurança especial. No entanto, você ainda precisa de um arquivo manifesto.

**Topics**
+ [Configurando o Amazon S3 para permitir o acesso de uma conta Quick diferente](#setup-S3-to-allow-access-from-a-different-quicksight-account)
+ [Configurando o Quick Sight para acessar arquivos do Amazon S3 em outra conta AWS](#setup-quicksight-to-access-S3-in-a-different-account)

## Configurando o Amazon S3 para permitir o acesso de uma conta Quick diferente
<a name="setup-S3-to-allow-access-from-a-different-quicksight-account"></a>

Use esta seção para aprender como definir permissões nos arquivos do Amazon S3 para que eles possam ser acessados pelo Quick Sight em outra AWS conta. 

Para obter informações sobre como acessar os arquivos Amazon S3 de outra conta a partir da sua conta do Quick Sight, consulte. [Configurando o Quick Sight para acessar arquivos do Amazon S3 em outra conta AWS](#setup-quicksight-to-access-S3-in-a-different-account) Para obter mais informações sobre as permissões do S3, consulte [Managing access permissions to your Amazon S3 resources](https://docs.aws.amazon.com/AmazonS3/latest/dev/s3-access-control.html) e [How do I set permissions on an object?](https://docs.aws.amazon.com/AmazonS3/latest/user-guide/set-object-permissions.html)

Você pode usar o procedimento a seguir para definir o acesso pelo console do S3. Ou você pode conceder permissões usando o AWS CLI ou escrevendo um script. Se você tem muitos arquivos para compartilhar, tem a alternativa de criar uma política de buckets do S3 sobre a ação `s3:GetObject`. Para usar uma política de buckets, adicione-a às permissões de buckets, não às permissões de arquivos. Para obter informações sobre políticas de buckets, consulte [Exemplos de políticas de bucket](https://docs.aws.amazon.com/AmazonS3/latest/dev/example-bucket-policies.html) no *Guia do desenvolvedor do Amazon S3*.

**Para definir o acesso de uma conta rápida diferente do console S3**

1. Obtenha o endereço de e-mail da AWS conta com a qual você deseja compartilhar. Ou você pode obter e usar o ID de usuário canônico. *Para obter mais informações sobre usuários canônicos IDs, consulte [identificadores de AWS conta na AWS Referência](https://docs.aws.amazon.com/general/latest/gr/acct-identifiers.html) geral.*

1. Faça login no Console de gerenciamento da AWS e abra o console do Amazon S3 em. [https://console.aws.amazon.com/s3/](https://console.aws.amazon.com/s3/)

1. Encontre o bucket do Amazon S3 que você deseja compartilhar com o Quick Sight. Escolha **Permissões**.

1. Escolha **Adicionar conta** e, em seguida, insira um endereço de e-mail ou cole uma ID de usuário canônica para a AWS conta com a qual você deseja compartilhar. Esse endereço de e-mail deve ser o principal da conta da AWS . 

1. Selecione **Yes (Sim)** para **Read bucket permissions (Ler permissões do bucket)** e **List objects (Listar objetos)**.

   Selecione **Salvar** para confirmar.

1. Encontre o arquivo que você deseja compartilhar e abra as configurações de permissões dele. 

1. Insira um endereço de e-mail ou o ID de usuário canônico da AWS conta com a qual você deseja compartilhar. Esse endereço de e-mail deve ser o principal da AWS conta. 

1. Ative as permissões de **leitura de objetos** para cada arquivo ao qual o Quick Sight precisa acessar. 

1. Notifique o usuário do Quick de que os arquivos agora estão disponíveis para uso.

## Configurando o Quick Sight para acessar arquivos do Amazon S3 em outra conta AWS
<a name="setup-quicksight-to-access-S3-in-a-different-account"></a>

Use esta seção para aprender como configurar o Quick Sight para que você possa acessar arquivos do Amazon S3 em outra AWS conta. Para obter informações sobre como permitir que outra pessoa acesse seus arquivos do Amazon S3 a partir de sua conta Quick, consulte. [Configurando o Amazon S3 para permitir o acesso de uma conta Quick diferente](#setup-S3-to-allow-access-from-a-different-quicksight-account)

Use o procedimento a seguir para acessar os arquivos Amazon S3 de outra conta a partir do Quick Sight. Antes de usar esse procedimento, os usuários na outra conta da AWS precisam compartilhar com você os arquivos no bucket do Amazon S3 deles.

**Para acessar os arquivos Amazon S3 de outra conta a partir do Quick Sight**

1. Verifique se o usuário ou usuários da outra AWS conta deram à sua conta permissão de leitura e gravação no bucket do S3 em questão. 

1. Escolha o ícone do seu perfil e escolha **Gerenciar o Quick Sight**.

1. Escolha **Security & permissions (Segurança e permissões)**.

1. Em **Acesso aos AWS serviços do Quick Sight**, escolha **Gerenciar**.

1. Escolha **Selecionar buckets do S3**.

1. Na tela **Selecionar buckets do Amazon S3**, selecione a guia **Buckets do S3 que você pode acessar na AWS**.

   A guia padrão é chamada de **buckets do S3 vinculados à conta do Quick Sight**. Ele mostra todos os buckets aos quais sua conta Quick tem acesso. 

1. Execute um destes procedimentos:
   + Para adicionar todos os buckets que você tem permissão para usar, selecione **Escolher buckets acessíveis de outras contas da AWS **. 
   + Se você tiver um ou mais buckets do Amazon S3 que deseja adicionar, insira os nomes. Cada um deve corresponder exatamente ao nome exclusivo do bucket do Amazon S3.

     Se você não tiver as permissões apropriadas, verá a mensagem de erro "Não é possível se conectar a esse bucket do S3. Certifique-se de que todos os buckets do S3 que você especificar estejam associados à AWS conta usada para criar essa conta rápida.” Essa mensagem de erro aparece se você não tiver permissões de conta ou permissões do Quick Sight.
**nota**  
Para usar o Amazon Athena, o Quick Sight precisa acessar os buckets do Amazon S3 que o Athena usa.   
Você pode adicioná-los aqui, um por um, ou usar a opção **Escolher compartimentos acessíveis de outras AWS contas**.

1. Escolha **Selecionar buckets** para confirmar sua seleção. 

1. Crie um conjunto de dados baseado no Amazon S3 e carregue o arquivo manifesto. Para obter mais informações sobre conjuntos de dados do Amazon S3, consulte [Como criar um conjunto de dados usando arquivos do Amazon S3](create-a-data-set-s3.md).