基于多个 Amazon S3 文件的数据集 - Amazon QuickSight

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

基于多个 Amazon S3 文件的数据集

您可以使用以下几种方法之一在亚马逊内部合并或合并来自 Amazon S3 的文件 QuickSight:

  • 使用清单组合文件 – 在这种情况下,这些文件必须具有相同数量的字段(列)。文件的相同位置中的字段必须具有匹配的数据类型。例如,每个文件中的第一个字段必须具有相同的数据类型。第二个字段、第三个字段以及后续字段也是如此。Amaz QuickSight on 从第一个文件中获取字段名称。

    必须在清单中明确列出这些文件。不过,它们不必位于同一 S3 存储桶中。

    此外,这些文件还必须遵循支持的 Amazon S3 清单文件格式中所述的规则。

    有关使用清单组合文件的更多详细信息,请参阅使用 Amazon S3 文件创建数据集

  • 不使用清单合并文件 – 要将多个文件合并为一个文件而不必在清单中单独列出这些文件,您可以使用 Athena。在使用这种方法时,您只需查询您的文本文件,就像它们位于数据库的表中一样。有关更多信息,请参阅大数据博客中的 Analyzing data in Amazon S3 using Athena

  • 在导入之前使用脚本附加文件 – 在上传之前,您可以使用用于组合文件的脚本。