Consideraciones y limitaciones de las consultas SQL en Amazon Athena - Amazon Athena

Consideraciones y limitaciones de las consultas SQL en Amazon Athena

Al ejecutar consultas en Athena, tenga en cuenta las siguientes consideraciones y limitaciones:

  • Procedimientos almacenados: no se admiten los procedimientos almacenados.

  • Número máximo de particiones: el número máximo de particiones que se pueden crear con las instrucciones CREATE TABLE AS SELECT (CTAS) es 100. Para obtener más información, consulte CREATE TABLE AS. Para obtener una solución alternativa, consulte Uso de CTAS e INSERT INTO para evitar el límite de 100 particiones.

  • Instrucciones no compatibles: entre las instrucciones no compatibles se incluyen las siguientes. Para ver una lista de las instrucciones DDL no compatibles en Athena, consulte DDL no admitido.

    • CREATE TABLE LIKE no se admite.

    • DESCRIBE INPUT y DESCRIBE OUTPUT no son compatibles.

    • La instrucción MERGE solo se admite para formatos de tablas transaccionales. Para obtener más información, consulte MERGE INTO.

    • No se admiten las instrucciones UPDATE.

    • DELETE FROM no se admite.

  • Conectores de Trino y Presto: no se admiten los conectores de Trino ni de Presto. Utilice la consulta federada de Amazon Athena para conectar orígenes de datos. Para obtener más información, consulte Uso de consulta federada de Amazon Athena.

  • Tiempos de espera en tablas con muchas particiones: Athena puede agotar el tiempo de espera al consultar una tabla que tiene muchos miles de particiones. Esto puede ocurrir cuando la tabla tiene muchas particiones que no son de tipo string. Cuando utiliza el tipo string, Athena elimina las particiones en el nivel de metaalmacén. Sin embargo, cuando utiliza otros tipos de datos, Athena elimina las particiones en el lado del servidor. Cuantas más particiones tenga, más tardará este proceso y más probable será que se agote el tiempo de espera de las consultas. Para resolver este problema, establezca el tipo de partición en string de modo que Athena elimine las particiones en el nivel de metaalmacén. Esto reduce la sobrecarga y evita que se agote el tiempo de espera de las consultas.

  • Compatibilidad con S3 Glacier: para obtener información sobre cómo consultar objetos restaurados de Amazon S3 Glacier, consulte Consulta de objetos de Amazon S3 Glacier restaurados.

  • Archivos tratados como ocultos: Athena trata los archivos de origen que comienzan con un guion bajo (_) o un punto (.) como ocultos. Para evitar esta limitación, cambie el nombre de los archivos.

  • Limitación de tamaño de fila o columna: el tamaño de una sola fila o sus columnas no puede superar los 32 megabytes. Este límite se puede superar cuando, por ejemplo, una fila en un archivo CSV o JSON contiene una sola columna de 300 megabytes. Exceder este límite también puede generar el mensaje de error Línea demasiado larga en el archivo de texto. Para evitar esta limitación, asegúrese de que la suma de los datos de las columnas de cualquier fila sea inferior a 32 MB.

  • Máximo de la cláusula LIMIT: el número máximo de filas que se puede especificar para la cláusula LIMIT es

    9223372036854775807. Cuando se utiliza ORDER BY, el número máximo de filas admitidas para la cláusula LIMIT es 2147483647. Si se excede este límite, se produce un mensaje de error NOT_SUPPORTED: ORDER BY LIMIT > 2 147 483 647 no es compatible.

  • esquema_information: hacer una consulta a information_schema es más eficaz si tiene una cantidad de pequeña a moderada demetadatos de AWS Glue. Si tiene una gran cantidad de metadatos, pueden producirse errores. Para obtener información sobre la consulta de la base de datos deinformation_schema para metadatos de AWS Glue, consulte el Consulta de AWS Glue Data Catalog.

  • Inicializaciones de matriz: debido a una limitación en Java, no es posible inicializar una matriz en Athena que tenga más de 254 argumentos.

  • Columnas de metadatos ocultas: las columnas de metadatos ocultas de Hive o Iceberg $bucket, $file_modified_time, $file_size y $partition no son compatibles con las vistas. Para obtener información sobre el uso de la columna de metadatos $path en Athena, consulte Obtención de las ubicaciones de archivos para los datos de origen en Simple Storage Service (Amazon S3) .

Para obtener información sobre la longitud máxima de la cadena de consulta, las cuotas para los tiempos de espera de las consultas y las cuotas para el número activo de consultas DML, consulte Service Quotas.