Output - AWS Glue DataBrew

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Output

表示选项,用于指定在 Amazon S3 中如何以及在何处 DataBrew 写入由配方任务或配置文件任务生成的输出。

内容

注意

下表中,首先描述的是必需参数。

Location

作业在 Amazon S3 中写入输出的位置。

类型:S3Location 对象

必需:是

CompressionFormat

用于压缩作业输出文本的压缩算法。

类型:字符串

有效值:GZIP | LZ4 | SNAPPY | BZIP2 | DEFLATE | LZO | BROTLI | ZSTD | ZLIB

必需:否

Format

作业输出的数据格式。

类型:字符串

有效值:CSV | JSON | PARQUET | GLUEPARQUET | AVRO | ORC | XML | TABLEAUHYPER

必需:否

FormatOptions

表示定义如何 DataBrew 格式化作业输出文件的选项。

类型:OutputFormatOptions 对象

必需:否

MaxOutputFiles

作业生成并写入输出文件夹的最大文件数。对于按列分区的输出,该 MaxOutputFiles 值为每个分区的最大文件数。

类型:整数

有效范围:最小值为 1。最大值为 999。

必需:否

Overwrite

一个值,如果为 true,则表示为输出指定位置的任何数据将被新输出覆盖。

类型:布尔值

必需:否

PartitionColumns

作业输出的一个或多个分区列的名称。

类型:字符串数组

数组成员:最多 200 项。

长度约束:最小长度为 1。最大长度为 255。

必需:否

另请参阅

有关在特定语言的 AWS SDK 中使用此 API 的更多信息,请参阅以下内容: