产品和服务集成 - AWS Glue DataBrew

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

产品和服务集成

使用本部分了解哪些产品和服务与哪些产品和服务集成 DataBrew。

DataBrew 可与以下联网、管理和治理 AWS 服务配合使用:

DataBrew 适用于以下 AWS 数据湖和数据存储:

DataBrew 支持以下文件格式和扩展名用于上传数据。

格式 文件扩展名(可选) 压缩文件的扩展名(必填)

逗号分隔的值

.csv

.gz

.snappy

.lz4

.bz2

.deflate

Micrososoft

.xlsx

不支持压缩

JSON(JSON 文档和 JSON 行)

.json, .jsonl

.gz

.snappy

.lz4

.bz2

.deflate

Apache ORC

.orc

.zlib

.snappy

Apache Parquet

.parquet

.gz

.snappy

.lz4

DataBrew 将输出文件写入 Amazon S3,并支持以下文件格式和扩展名。

格式 文件扩展名(未压缩) 文件扩展名(压缩)

逗号分隔的值

.csv .csv.snappy, .csv.gz, .csv.lz4, csv.bz2, .csv.deflate, csv.br

制表符分隔的值

.csv .tsv.snappy, .tsv.gz, .tsv.lz4, tsv.bz2, .tsv.deflate, tsv.br
Apache Parquet .parquet .parquet.snappy, .parquet.gz, .parquet.lz4, .parquet.lzo, .parquet.br
AWS Glue Parq 不支持 .glue.parquet.snappy
Apache Avro .avro .avro.snappy, .avro.gz, .avro.lz4, .avro.bz2, .avro.deflate, .avro.br
Apache ORC .orc .orc.snappy, .orc.lzo, .orc.zlib
XML .xml .xml.snappy, .xml.gz, .xml.lz4, .xml.bz2, .xml.deflate, .xml.br
JSON(仅限 JSON 行格式) .json .json.snappy, .json.gz, .json.lz4, json.bz2, .json.deflate, .json.br
Tableaau 不支持 不适用