本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
准备输入数据
按照要执行的作业操作类型所需的架构,将输入数据格式化为 Apache Parq
输入架构概述
您的输入数据必须符合您要运行的特定作业操作类型的架构。每种操作类型都定义了自己的一组必填字段和可选字段。
所有输入架构都支持可选Id字段。使用此字段为每条输入记录分配一个标识符。如果您提供一个Id值,则该值将显示Input_Id在输出中,从而允许您将输出记录与其对应的输入关联起来。
有关地址验证输入架构的详细信息,请参阅地址验证输入架构。
文件大小限制
输入文件有以下限制:
-
最大文件大小:每个文件 10 GB
-
Parquet 行组最大大小:1 GB
-
每个输入前缀的最大文件数:1000