Exportar dados do cluster de banco de dados para o Amazon S3 - Amazon Aurora

Exportar dados do cluster de banco de dados para o Amazon S3

É possível exportar dados de um cluster de banco de dados do Amazon Aurora para um bucket do Amazon S3. O processo de exportação é executado em segundo plano e não afeta a performance do cluster de banco de dados ativo.

Por padrão, todos os dados no cluster de banco de dados são exportados. No entanto, você pode optar por exportar conjuntos específicos de bancos de dados, esquemas ou tabelas.

O Amazon Aurora clona o cluster de banco de dados, extrai dados do clone e armazena-os em um bucket do Amazon S3. Os dados são armazenados em um formato Apache Parquet que é compactado e consistente. Em geral, os arquivos Parquet individuais têm cerca de 1 a 10 MB de tamanho.

A performance mais rápida que você pode obter com a exportação de dados de snapshot para o Aurora MySQL versão 2 e versão 3 não se aplica à exportação de dados de cluster de banco de dados. Para ter mais informações, consulte Exportar dados de snapshot de cluster de banco de dados para o Amazon S3.

Você recebe cobrança pela exportação de todo o cluster de banco de dados, independentemente de exportar todos os dados ou parte deles. Para ter mais informações, consulte a página Definição de preço do Amazon Aurora.

Depois que os dados são exportados, você pode analisar os dados exportados diretamente por meio de ferramentas, como Amazon Athena ou Amazon Redshift Spectrum. Para ter mais informações sobre como usar o Athena para ler os dados do Parquet, consulte Parquet SerDe no Guia do usuário do Amazon Athena. Para ter mais informações sobre como usar o Redshift Spectrum para ler os dados do Parquet, consulte COPY de formatos de dados colunares no Guia do desenvolvedor de banco de dados do Amazon Redshift.

A disponibilidade e a compatibilidade de recursos variam entre versões específicas de cada mecanismo de banco de dados e entre Regiões da AWS. Para ter mais informações sobre a disponibilidade de versões e regiões para a exportação de dados de cluster de banco de dados para o S3, consulte Regiões e mecanismos de banco de dados do Aurora compatíveis com a exportação de dados de cluster para o Amazon S3.

Use o seguinte processo para exportar dados de cluster de banco de dados para um bucket do Amazon S3. Para obter mais detalhes, consulte as seções a seguir.

Visão geral da exportação de dados do cluster de banco de dados
  1. Identifique o cluster de banco de dados cujos dados você deseja exportar.

  2. Configure o acesso ao bucket do Amazon S3.

    Um bucket é um contêiner de objetos ou arquivos do Amazon S3. Para fornecer informações para acesso a um bucket, execute as seguintes etapas:

    1. Identifique o bucket do S3 para os dados do cluster de banco de dados devem ser exportados. O bucket do S3 deve estar na mesma região da AWS que o cluster de banco de dados. Para ter mais informações, consulte Identificar o bucket do Amazon S3 para exportar.

    2. Crie um perfil do AWS Identity and Access Management (IAM) que conceda à tarefa de exportação de cluster de banco de dados acesso ao bucket do S3. Para ter mais informações, consulte Fornecer acesso a um bucket do Amazon S3 usando um perfil do IAM.

  3. Crie uma criptografia simétrica do AWS KMS key para a criptografia do lado do servidor. A chave do KMS é usada pela tarefa de exportação de cluster para configurar a criptografia do lado do servidor do AWS KMS ao gravar dados de exportação no S3.

    A política de chave do KMS deve incluir as permissões kms:CreateGrant e kms:DescribeKey. Para ter mais informações sobre o uso de chaves do KMS no Amazon Aurora, consulte Gerenciamento de AWS KMS key.

    Além disso, se você tiver uma instrução de negação na política de chaves do KMS, exclua explicitamente a entidade principal de serviço da AWS export.rds.amazonaws.com.

    Você pode utilizar uma chave do KMS na sua conta do AWS ou pode utilizar uma chave do KMS entre contas. Para ter mais informações, consulte Utilizar uma conta cruzada AWS KMS key.

  4. Exporte o cluster de banco de dados para o Amazon S3 usando o console ou o comando start-export-task da CLI. Para ter mais informações, consulte Criar tarefas de exportação do cluster de banco de dados.

  5. Para acessar os seus dados exportados no bucket do Amazon S3, consulte Como carregar, baixar e gerenciar objetos no Guia do usuário do Amazon Simple Storage Service.

Aprenda a configurar, exportar, monitorar, cancelar e solucionar problemas em tarefas de exportação de cluster de banco de dados nas seções a seguir.