本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Output
表示选项,用于指定在 Amazon S3 中如何以及在何处 DataBrew 写入由配方任务或配置文件任务生成的输出。
内容
注意
下表中,首先描述的是必需参数。
- Location
-
作业在 Amazon S3 中写入输出的位置。
类型:S3Location 对象
必需:是
- CompressionFormat
-
用于压缩作业输出文本的压缩算法。
类型:字符串
有效值:
GZIP | LZ4 | SNAPPY | BZIP2 | DEFLATE | LZO | BROTLI | ZSTD | ZLIB
必需:否
- Format
-
作业输出的数据格式。
类型:字符串
有效值:
CSV | JSON | PARQUET | GLUEPARQUET | AVRO | ORC | XML | TABLEAUHYPER
必需:否
- FormatOptions
-
表示定义如何 DataBrew 格式化作业输出文件的选项。
类型:OutputFormatOptions 对象
必需:否
- MaxOutputFiles
-
作业生成并写入输出文件夹的最大文件数。对于按列分区的输出,该 MaxOutputFiles 值为每个分区的最大文件数。
类型:整数
有效范围:最小值为 1。最大值为 999。
必需:否
- Overwrite
-
一个值,如果为 true,则表示为输出指定位置的任何数据将被新输出覆盖。
类型:布尔值
必需:否
- PartitionColumns
-
作业输出的一个或多个分区列的名称。
类型:字符串数组
数组成员:最多 200 项。
长度约束:最小长度为 1。最大长度为 255。
必需:否
另请参阅
有关在特定语言的 AWS SDK 中使用此 API 的更多信息,请参阅以下内容: