As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Como criar conjuntos de dados usando novas fontes de dados
<a name="creating-data-sets-new"></a>

Quando você cria um conjunto de dados com base em um AWS serviço como Amazon RDS, Amazon Redshift ou Amazon EC2, as taxas de transferência de dados podem ser aplicadas ao consumir dados dessa fonte. Essas cobranças também podem variar dependendo se esse AWS recurso está na casa Região da AWS que você escolheu para sua conta Amazon Quick. Para obter detalhes sobre preços, consulte a página de preços do serviço em questão.

Ao criar um novo conjunto de dados do banco de dados, você pode selecionar uma tabela, juntar várias tabelas ou criar uma consulta SQL para recuperar os dados que desejar. Você também pode alterar se o conjunto de dados usa uma consulta direta ou, então, armazena dados no [SPICE](spice.md).

**Para criar um novo conjunto de dados**

1. Para criar um conjunto de dados, escolha **Novo conjunto de dados** na página **Dados**. Em seguida, você pode criar um conjunto de dados com base em um conjunto de dados ou uma fonte de dados existente, bem como se conectar a uma nova fonte de dados e basear o conjunto de dados nisso.

1. Forneça as informações de conexão para a fonte de dados:
   + Para arquivos de texto local ou do Microsoft Excel, você pode simplesmente identificar o local do arquivo e fazer o carregamento dele.
   + Para o Amazon S3, forneça um manifesto identificando os arquivos ou buckets que deseja usar e as configurações de importação para os arquivos de destino.
   + Para o Amazon Athena, todos os bancos de dados do Athena da sua AWS conta são devolvidos. Nenhuma credencial adicional é necessária.
   + Para Salesforce, forneça credenciais para se conectar.
   + Para o Amazon Redshift, o Amazon RDS, o Amazon EC2 ou outras fontes de dados do banco de dados, forneça informações sobre o servidor e o banco de dados que hospedam os dados. Forneça também credenciais válidas para essa instância de banco de dados.

# Como criar um conjunto de dados usando um banco de dados
<a name="create-a-database-data-set"></a>

Os procedimentos a seguir orientam você a conectar-se com fontes de dados do banco de dados e a criar conjuntos de dados. Para criar conjuntos de dados a partir de fontes de AWS dados que sua conta Amazon Quick descobriu automaticamente, use. [Como criar um conjunto de dados de um cluster do Amazon Redshift ou instância do Amazon RDS detectados automaticamente](#create-a-data-set-autodiscovered) Para criar conjuntos de dados de qualquer outra fonte de dados de banco de dados, use [Como criar um conjunto de dados usando um banco de dados não detectado automaticamente](#create-a-data-set-database). 

## Como criar um conjunto de dados de um cluster do Amazon Redshift ou instância do Amazon RDS detectados automaticamente
<a name="create-a-data-set-autodiscovered"></a>

Use o procedimento a seguir para criar uma conexão com uma fonte de dados da AWS detectada automaticamente.

**Para criar uma conexão com uma fonte de AWS dados descoberta automaticamente**

1. Marque [Cotas de fonte de dados](data-source-limits.md) para garantir que sua tabela ou consulta de destino não exceda as cotas de fonte de dados.

1. Confirme se as credenciais do banco de dados que você planeja usar tem as permissões adequadas, conforme descrito em [Permissões obrigatórias](required-permissions.md). 

1. Certifique-se de ter configurado o cluster ou a instância para o Amazon Quick Access seguindo as instruções em[Requisitos de configuração de rede e banco de dados](configure-access.md).

1. Na página de início rápido da Amazon, escolha **Dados**.

1. Escolha **Criar** e, em seguida, escolha **Novo conjunto de dados.**

1. Escolha o ícone de descoberta automática do **RDS** ou do **Redshift**, dependendo do serviço AWS ao qual você deseja se conectar.

1. Insira as informações de conexão para a fonte de dados da seguinte forma:
   + Para **Data source name (Nome da fonte de dados)**, digite um nome para a fonte de dados.
   + Em **Instance ID (ID da instância)**, selecione o nome da instância ou o cluster ao qual você deseja se conectar.
   + **Database name** mostra o banco de dados padrão para o cluster ou instância do **Instance ID**. Para usar um banco de dados diferente no cluster ou na instância, digite os nomes.
   + Para **UserName**, insira o nome de usuário de uma conta de usuário que tenha permissões para fazer o seguinte: 
     + Acesse o banco de dados de destino. 
     + Leia (execute uma instrução em `SELECT`) quaisquer tabelas nesse banco de dados que você deseja usar.
   + Em **Senha**, digite a senha da conta inserida.

1. Escolha **Validate connection** para verificar se as informações da sua conexão estão corretas.

1. Se a conexão for validada, escolha **Create data source**. Caso contrário, corrija as informações de conexão e tente novamente a validação.
**nota**  
O Amazon Quick protege automaticamente as conexões com instâncias do Amazon RDS e clusters do Amazon Redshift usando Secure Sockets Layer (SSL). Você não precisa fazer nada para ativar esse recurso.

1. Escolha uma das seguintes opções:
   + **SQL personalizado**

     Na próxima tela, você poderá optar por escrever uma consulta usando a opção **Use custom SQL (Usar SQL personalizado)**. Isso exibirá uma tela chamada **Enter custom SQL query (Inserir consulta SQL personalizada)**, onde você poderá inserir um nome para sua consulta e, em seguida, inserir o SQL. Para resultados melhores, componha a consulta em um editor SQL e, em seguida, cole-o na janela. Depois de nomear e inserir a consulta, você poderá escolher **Edit/Preview data (Editar/visualizar dados)** ou **Confirm query (Confirmar consulta)**. Escolha **Edit/Preview data (Editar/visualizar dados)** para ir imediatamente para a preparação de dados. Escolha **Confirm query (Confirmar consulta)** para validar o SQL e verificar se há erros.
   + **Escolher tabelas**

     Para se conectar a tabelas específicas, em **Esquema: contém conjuntos de tabelas**, escolha **Selecionar** e, depois, um esquema. Em alguns casos, quando houver um único esquema no banco de dados, esse esquema será automaticamente escolhido e a opção de seleção de esquema não será exibida.

     Para preparar os dados antes de criar uma análise, selecione **Edit/Preview data** para abrir a preparação de dados. Use essa opção se você quiser se juntar para mais tabelas.

     Caso contrário, depois de escolher uma mesa, escolha **Select (Selecionar)**.

1. Escolha uma das seguintes opções:
   + Prepare os dados antes da criação da análise. Para isso, selecione **Edit/Preview data (Editar/visualizar dados)** para abrir a preparação de dados para a tabela selecionada. Para obter mais informações sobre preparação de dados, consulte [Preparar exemplos de conjuntos de dados](preparing-data-sets.md).
   + Crie um conjunto de dados e uma análise usando os dados da tabela no estado em que se encontram para importar os dados do conjunto de dados ao SPICE a fim de melhorar o desempenho (recomendado). Para isso, verifique o tamanho da tabela e o indicador do SPICE para saber se você tem capacidade suficiente.

     Se você tiver capacidade suficiente no SPICE, selecione **Importar para o SPICE para agilizar o analytics** e crie uma análise selecionando **Visualizar**.
**nota**  
Se quiser usar SPICE e não tiver espaço suficiente, escolha **Editar ou visualizar dados**. Na preparação de dados, você pode remover campos do conjunto de dados para diminuir o tamanho. Você também pode aplicar um filtro ou gravar uma consulta SQL que reduz o número de linhas ou colunas retornadas. Para obter mais informações sobre preparação de dados, consulte [Preparar exemplos de conjuntos de dados](preparing-data-sets.md).
   + Para criar um conjunto de dados e uma análise usando os dados da tabela na forma como se encontram, e para que esses dados sejam consultados diretamente pelo banco de dados, selecione a opção **Consultar diretamente seus dados**. Em seguida, crie uma análise escolhendo **Visualize (Visualizar)**.

## Como criar um conjunto de dados usando um banco de dados não detectado automaticamente
<a name="create-a-data-set-database"></a>

Use o procedimento a seguir para criar uma conexão com qualquer banco de dados diferente de um cluster do Amazon Redshift ou instância do Amazon RDS detectados automaticamente. Esses bancos de dados incluem clusters do Amazon Redshift e instâncias do Amazon RDS que estão em uma conta diferente Região da AWS ou estão associadas a uma conta diferente. AWS Também incluem instâncias do MariaDB, Microsoft SQL Server, MySQL, Oracle e PostgreSQL que estão on-premises, no Amazon EC2 ou em outro ambiente acessível.

**Para criar uma conexão com um banco de dados que não seja um cluster do Amazon Redshift ou uma instância do RDS detectados automaticamente**

1. Marque [Cotas de fonte de dados](data-source-limits.md) para garantir que sua tabela ou consulta de destino não exceda as cotas de fonte de dados.

1. Confirme se as credenciais do banco de dados que você planeja usar tem as permissões adequadas, conforme descrito em [Permissões obrigatórias](required-permissions.md). 

1. Certifique-se de ter configurado o cluster ou a instância para o Amazon Quick Access seguindo as instruções em[Requisitos de configuração de rede e banco de dados](configure-access.md).

1. Na página de início rápido da Amazon, escolha **Gerenciar dados**.

1. Escolha **Criar** e, em seguida, escolha **Novo conjunto de dados**.

1. Escolha o ícone de **conexão manual do Redshift** se quiser se conectar a um cluster do Amazon Redshift em Região da AWS outra conta ou associado a uma conta diferente. AWS Como alternativa, escolha o ícone do sistema de gerenciamento de banco de dados apropriado para se conectar a uma instância do Amazon Aurora, MariaDB, Microsoft SQL Server, MySQL, Oracle ou PostgreSQL.

1. Insira as informações de conexão para a fonte de dados da seguinte forma:
   + Para **Data source name (Nome da fonte de dados)**, digite um nome para a fonte de dados.
   + Em **Database server (Servidor de banco de dados)**, insira um dos seguintes valores:
     + Para um cluster do Amazon Redshift ou uma instância do Amazon RDS, insira o endpoint do cluster ou da instância sem o número da porta. Por exemplo, se o valor do endpoint for `clustername.1234abcd.us-west-2.redshift.amazonaws.com:1234`, insira `clustername.1234abcd.us-west-2.redshift.amazonaws.com`. Você pode obter o valor do endpoint no campo **Endpoint** na página de detalhes do cluster ou da instância no AWS console.
     + Para uma instância no Amazon EC2 do MariaDB, Microsoft SQL Server, MySQL, Oracle ou PostgreSQL, insira o endereço DNS público. Você pode obter o valor de DNS público no campo **DNS público**, no painel de detalhes da instância no console do Amazon EC2.
     + Para uma instância do MariaDB, Microsoft SQL Server, MySQL, Oracle ou PostgreSQL que não seja do Amazon EC2, insira o nome de host ou endereço IP público do servidor do banco de dados. Se você estiver usando o Secure Sockets Layer (SSL) para uma conexão segura (recomendado), provavelmente será preciso fornecer o nome do host de acordo com as informações necessárias pelo certificado SSL. Para obter uma lista de certificados aceitos, consulte [Certificados Amazon Quick SSL e CA](configure-access.md#ca-certificates).
   + Para **Port (Porta)**, digite a porta que o cluster ou a instância usam para conexões.
   + Para **Database name (Nome do banco de dados)**, digite o nome do banco de dados que deseja usar.
   + Para **UserName**, insira o nome de usuário de uma conta de usuário que tenha permissões para fazer o seguinte: 
     + Acesse o banco de dados de destino. 
     + Leia (execute uma instrução em `SELECT`) quaisquer tabelas nesse banco de dados que você deseja usar.
   + Em **Senha**, digite a senha associada à conta inserida.

1. (Opcional) Se estiver se conectando a algo que não seja um cluster do Amazon Redshift e *não* quiser uma conexão segura, certifique-se de desmarcar **Habilitar SSL**. *É altamente recomendável deixar essa opção marcada*, pois uma conexão desprotegida pode ficar aberta a violações. 

   Para obter mais informações sobre como a instância de destino usa SSL para proteger conexões, consulte a documentação do sistema de gerenciamento de banco de dados do destino. O Amazon Quick não aceita certificados SSL autoassinados como válidos. Para obter uma lista de certificados aceitos, consulte [Certificados Amazon Quick SSL e CA](configure-access.md#ca-certificates).

   O Amazon Quick protege automaticamente as conexões com os clusters do Amazon Redshift usando SSL. Você não precisa fazer nada para ativar esse recurso.

   Alguns bancos de dados, como o Presto e o Apache Spark, devem atender a requisitos adicionais antes que o Amazon Quick possa se conectar. Para obter mais informações, consulte [Como criar uma fonte de dados usando Presto](create-a-data-source-presto.md) ou [Como criar uma fonte de dados usando o Apache Spark](create-a-data-source-spark.md).

1. (Opcional) Escolha **Validate connection** para verificar se as informações da sua conexão estão corretas.

1. Se a conexão for validada, escolha **Create data source**. Caso contrário, corrija as informações de conexão e tente novamente a validação.

1. Escolha uma das seguintes opções:
   + **SQL personalizado**

     Na próxima tela, você poderá optar por escrever uma consulta usando a opção **Use custom SQL (Usar SQL personalizado)**. Isso exibirá uma tela chamada **Enter custom SQL query (Inserir consulta SQL personalizada)**, onde você poderá inserir um nome para sua consulta e, em seguida, inserir o SQL. Para resultados melhores, componha a consulta em um editor SQL e, em seguida, cole-o na janela. Depois de nomear e inserir a consulta, você poderá escolher **Edit/Preview data (Editar/visualizar dados)** ou **Confirm query (Confirmar consulta)**. Escolha **Edit/Preview data (Editar/visualizar dados)** para ir imediatamente para a preparação de dados. Escolha **Confirm query (Confirmar consulta)** para validar o SQL e verificar se há erros.
   + **Escolher tabelas**

     Para se conectar a tabelas específicas, em **Esquema: contém conjuntos de tabelas**, escolha **Selecionar** e, depois, um esquema. Em alguns casos, quando houver um único esquema no banco de dados, esse esquema será automaticamente escolhido e a opção de seleção de esquema não será exibida.

     Para preparar os dados antes de criar uma análise, selecione **Edit/Preview data** para abrir a preparação de dados. Use essa opção se você quiser se juntar para mais tabelas.

     Caso contrário, depois de escolher uma mesa, escolha **Select (Selecionar)**.

1. Escolha uma das seguintes opções:
   + Prepare os dados antes da criação da análise. Para isso, selecione **Edit/Preview data (Editar/visualizar dados)** para abrir a preparação de dados para a tabela selecionada. Para obter mais informações sobre preparação de dados, consulte [Preparar exemplos de conjuntos de dados](preparing-data-sets.md).
   + Crie um conjunto de dados e uma análise usando os dados da tabela no estado em que se encontram e importe os dados do conjunto de dados para SPICE a fim de melhorar o desempenho (recomendado). Para isso, verifique o tamanho da tabela e o indicador do SPICE para saber se você tem espaço suficiente.

     Se você tiver capacidade suficiente no SPICE, selecione **Importar para o SPICE para agilizar a análise** e crie uma análise selecionando **Visualizar**.
**nota**  
Se quiser usar SPICE e não tiver espaço suficiente, escolha **Editar ou visualizar dados**. Na preparação de dados, você pode remover campos do conjunto de dados para diminuir o tamanho. Você também pode aplicar um filtro ou gravar uma consulta SQL que reduz o número de linhas ou colunas retornadas. Para obter mais informações sobre preparação de dados, consulte [Preparar exemplos de conjuntos de dados](preparing-data-sets.md).
   + Crie um conjunto de dados e uma análise usando os dados da tabela no estado em que se encontram, e os dados serão consultados diretamente do banco de dados. Para fazer isso, escolha a opção **Directly query your data (Consultar diretamente seus dados)** . Em seguida, crie uma análise escolhendo **Visualize (Visualizar)**.