Consultar dados do S3 Express One Zone
A classe de armazenamento Amazon S3 Express One Zone é uma classe de armazenamento do Amazon S3 com alta performance que fornece tempos de resposta abaixo de dez milissegundos. Dessa forma, essa classe é útil para aplicações que acessam dados frequentemente com centenas de milhares de solicitações por segundo.
A classe S3 Express One Zone replica e armazena dados na mesma zona de disponibilidade para otimizar a velocidade e os custos. Isso difere das classes de armazenamento regionais do Amazon S3, que replicam automaticamente os dados em, no mínimo, três zonas de disponibilidade da AWS em uma Região da AWS.
Para obter mais informações, consulte What is S3 Express One Zone? no Guia do usuário do Amazon S3.
Pré-requisitos
Confirme se as seguintes condições foram atendidas antes de começar a usar:
-
Versão 3 do mecanismo Athena: para usar a classe S3 Express One Zone com o Athena SQL, o grupo de trabalho deve estar configurado para usar a versão 3 do mecanismo Athena.
-
Permissões do S3 Express One Zone: quando a classe S3 Express One Zone chama uma ação como
GET
,LIST
ouPUT
em um objeto do Amazon S3, a classe de armazenamento chamaCreateSession
em seu nome. Por esse motivo, a política do IAM deve permitir a açãos3express:CreateSession
, que possibilita ao Athena invocar a operação de API correspondente.
Considerações e limitações
Ao consultar a classe S3 Express One Zone com o Athena, considere os pontos apresentados a seguir.
-
Os buckets do S3 Express One Zone oferecem suporte as criptografias
SSE_S3
eSSE-KMS
. Os resultados da consulta do Athena são gravados usando a criptografiaSSE_S3
, independentemente da opção escolhida por você nas configurações do grupo de trabalho para criptografar os resultados da consulta. Essa limitação inclui todos os cenários em que o Athena grava dados em buckets da classe S3 Express One Zone, incluindo instruçõesCREATE TABLE AS
(CTAS) eINSERT INTO
. -
Não há suporte para o crawler do AWS Glue para a criação de tabelas em dados do S3 Express One Zone.
-
Não há suporte para a instrução
MSCK REPAIR TABLE
. Como solução alternativa, use ALTER TABLE ADD PARTITION. -
Nenhuma instrução DDL de modificação de tabela para o Apache Iceberg (ou seja, nenhuma instrução
ALTER TABLE
) é compatível com o S3 Express One Zone. -
O Lake Formation não é compatível com os buckets do S3 Express One Zone.
-
Não há suporte ou o suporte é limitado para os formatos de arquivos e de tabelas apresentados a seguir. Se os formatos não estiverem listados, mas forem compatíveis com o Athena (como Parquet, ORC e JSON), eles também terão suporte para uso com o armazenamento do S3 Express One Zone.
Formato de arquivo ou de tabela Limitação Apache Avro Sem compatibilidade Logs do CloudTrail Sem compatibilidade Apache Hudi Sem compatibilidade Amazon Ion Sem compatibilidade Logs do Logstash Sem compatibilidade Logs do Apache WebServer Sem compatibilidade Delta Lake Não há suporte para DDL. Para obter informações sobre como criar uma tabela do Delta Lake usando um esquema fictício, consulte Sincronizar metadados do Delta Lake. Há suporte para consultas SELECT
na tabela.
Conceitos básicos
Consultar dados da classe S3 Express One Zone com o Athena é simples. Para começar a usar, siga o procedimento apresentado a seguir.
Como usar o Athena SQL para consultar dados da classe S3 Express One Zone
-
Faça a transição dos seus dados para o armazenamento do S3 Express One Zone. Para obter mais informações, consulte Configurar a classe de armazenamento de um objeto no Guia do usuário do Amazon S3.
-
Use uma instrução CREATE TABLE no Athena para catalogar seus dados no AWS Glue Data Catalog. Para obter informações sobre como criar tabelas no Athena, consulte Criar tabelas no Athena e a instrução CREATE TABLE.
-
(Opcional) Configure a localização do resultado da consulta do grupo de trabalho do Athena para usar um bucket de diretório do Amazon S3. Os buckets de diretório do Amazon S3 têm uma performance aprimorada quando comparados aos buckets gerais e são projetados para workloads ou aplicações críticas à performance que requerem latência consistente abaixo de dez milissegundos. Para obter mais informações, consulte Directory buckets overview no Guia do usuário do Amazon S3.