Athena 支持多个 SerDe(序列化器/反序列化器)库,这些库可以解析各种数据格式的数据。在 Athena 中创建表时,可以指定与数据格式对应的 SerDe。Athena 不支持自定义 SerDes。
Athena 可以使用 SerDe 库从 CSV、TSV、自定义分隔符和 JSON 格式;Hadoop 相关格式(ORC、Apache Avro 和 Parquet)的数据;Logstash 日志、AWS CloudTrail 日志和 Apache WebServer 日志创建表。每种数据格式都有一个或多个序列化器-反序列化器(SerDe)库,Athena 可以使用这些库来解析数据。
注意
本节中列出的格式由 Athena 用于读取数据。有关 Athena 在运行 CTAS 查询时用于写入数据的格式,请参阅 从查询结果创建表(CTAS)。