本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
产品和服务集成
使用本部分了解哪些产品和服务与哪些产品和服务集成 DataBrew。
DataBrew 可与以下联网、管理和治理 AWS 服务配合使用:
DataBrew 适用于以下 AWS 数据湖和数据存储:
DataBrew 支持以下文件格式和扩展名用于上传数据。
格式 | 文件扩展名(可选) | 压缩文件的扩展名(必填) |
---|---|---|
逗号分隔的值 |
|
|
Micrososoft |
|
不支持压缩 |
JSON(JSON 文档和 JSON 行) |
|
|
Apache ORC |
|
|
Apache Parquet |
|
|
DataBrew 将输出文件写入 Amazon S3,并支持以下文件格式和扩展名。
格式 | 文件扩展名(未压缩) | 文件扩展名(压缩) |
---|---|---|
逗号分隔的值 |
.csv |
.csv.snappy , .csv.gz ,
.csv.lz4 , csv.bz2 ,
.csv.deflate , csv.br |
制表符分隔的值 |
.csv |
.tsv.snappy , .tsv.gz ,
.tsv.lz4 , tsv.bz2 ,
.tsv.deflate , tsv.br |
Apache Parquet | .parquet |
.parquet.snappy , .parquet.gz ,
.parquet.lz4 , .parquet.lzo ,
.parquet.br |
AWS Glue Parq | 不支持 | .glue.parquet.snappy |
Apache Avro | .avro |
.avro.snappy , .avro.gz ,
.avro.lz4 , .avro.bz2 ,
.avro.deflate , .avro.br |
Apache ORC | .orc |
.orc.snappy , .orc.lzo ,
.orc.zlib |
XML | .xml |
.xml.snappy , .xml.gz ,
.xml.lz4 , .xml.bz2 ,
.xml.deflate , .xml.br |
JSON(仅限 JSON 行格式) |
.json
|
.json.snappy , .json.gz ,
.json.lz4 , json.bz2 ,
.json.deflate , .json.br |
Tableaau | 不支持 | 不适用 |