Selecione suas preferências de cookies

Usamos cookies essenciais e ferramentas semelhantes que são necessárias para fornecer nosso site e serviços. Usamos cookies de desempenho para coletar estatísticas anônimas, para que possamos entender como os clientes usam nosso site e fazer as devidas melhorias. Cookies essenciais não podem ser desativados, mas você pode clicar em “Personalizar” ou “Recusar” para recusar cookies de desempenho.

Se você concordar, a AWS e terceiros aprovados também usarão cookies para fornecer recursos úteis do site, lembrar suas preferências e exibir conteúdo relevante, incluindo publicidade relevante. Para aceitar ou recusar todos os cookies não essenciais, clique em “Aceitar” ou “Recusar”. Para fazer escolhas mais detalhadas, clique em “Personalizar”.

Pré-requisitos para uso das tabelas do Apache Iceberg como destino

Modo de foco
Pré-requisitos para uso das tabelas do Apache Iceberg como destino - Amazon Data Firehose

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Escolha entre as opções a seguir para preencher os pré-requisitos necessários.

Pré-requisitos para entrega em tabelas Iceberg no Amazon S3

Antes de começar, conclua os pré-requisitos a seguir.

  • Crie um bucket do Amazon S3: você deve criar um bucket do Amazon S3 para adicionar o caminho do arquivo de metadados durante a criação das tabelas. Para obter mais informações, consulte Criação de um bucket do S3.

  • Crie um perfil do IAM com as permissões necessárias: o Firehose precisa de um perfil do IAM com permissões específicas para acessar as tabelas do AWS Glue e gravar dados no Amazon S3. A mesma função é usada para conceder AWS Glue acesso aos buckets do Amazon S3. Você precisa dessa função do IAM ao criar uma tabela Iceberg e um stream do Firehose. Para obter mais informações, consulte Concessão ao Firehose de acesso a um destino de tabelas do Apache Iceberg.

  • Crie tabelas do Apache Iceberg: se você estiver configurando chaves exclusivas no fluxo do Firehose para atualizações e exclusões, o Firehose as validará se a tabela e as chaves exclusivas existirem como parte da criação do fluxo. Para esse cenário, você deve criar tabelas antes de criar o fluxo do Firehose. Você pode usar AWS Glue para criar tabelas Apache Iceberg. Para obter mais informações, consulte Criar tabelas do Apache Iceberg. Se você não estiver configurando chaves exclusivas no fluxo do Firehose, não precisará criar tabelas do Iceberg antes de criar um fluxo do Firehose.

    nota

    O Firehose oferece suporte à versão e formato de tabela a seguir para tabelas do Apache Iceberg.

    • Versão de formato de tabela: o Firehose oferece suporte apenas ao formato de tabela V2. Não crie tabelas no formato V1, caso contrário, você receberá um erro e, em vez disso, os dados serão entregues ao bucket de erros do S3.

    • Formato de armazenamento de dados: o Firehose grava dados nas tabelas do Apache Iceberg no formato Parquet.

    • Operação em nível de linha — O Firehose suporta o modo Merge-on-Read (MOR) de gravação de dados nas tabelas Apache Iceberg.

Pré-requisitos para entrega nas tabelas do Amazon S3

Para entregar dados aos buckets de tabela do Amazon S3, preencha os seguintes pré-requisitos.

  • Crie uma função do IAM com as permissões necessárias — O Firehose precisa de uma função do IAM com permissões específicas para acessar AWS Glue tabelas e gravar dados em tabelas em um bucket de tabelas do Amazon S3. Para gravar em tabelas em um bucket de tabelas do S3, você também deve fornecer à função do IAM as permissões necessárias em AWS Lake Formation. Você configura essa função do IAM ao criar um stream do Firehose. Para obter mais informações, consulte Conceder ao Firehose acesso às tabelas do Amazon S3.

  • Crie um bucket do S3 Table, namespace, tabelas no bucket da tabela e outras etapas de integração descritas em Integração de tabelas do Amazon S3 com serviços de análise. AWS

    nota

    Nas etapas descritas, conceda AWS Lake Formation DESCRIBE permissão ao papel do IAM que você criou anteriormente.

    Você usará os nomes dos links de recursos para banco de dados e tabela criados como parte dos pré-requisitos como nome do banco de dados e da tabela na configuração do stream do Firehose para fins de roteamento. Você pode usá-las na seção Chave exclusiva da configuração do stream do Firehose se estiver roteando para uma única tabela ou enviá-las como parte dos dados de entrada para o Firehose rotear para a tabela correta usando expressões de consulta JSON.

    Para obter mais formas de criar links de recursos, consulte Criação de um link de recurso para uma tabela compartilhada do Catálogo de Dados ou Criação de um link de recurso para um banco de dados compartilhado do Catálogo de Dados no guia do usuário do Lake Formation.

PrivacidadeTermos do sitePreferências de cookies
© 2025, Amazon Web Services, Inc. ou suas afiliadas. Todos os direitos reservados.