加载耗时过长 - Amazon Redshift

加载耗时过长

由于以下原因,您的加载操作可能需要太长时间。我们建议采用以下故障排除方法。

COPY 从单个文件中加载数据

将加载数据拆分为多个文件。如果从一个大型文件加载所有数据,Amazon Redshift 必须执行序列化加载,这样速度很慢。文件数应为集群中切片数量的倍数,且文件大小应大致相同,压缩后介于 1 MB 和 1 GB 之间。有关更多信息,请参阅 设计查询的 Amazon Redshift 最佳实践

加载操作使用多个 COPY 命令

如果您使用多个并发 COPY 命令从多个文件加载一个表,会强制 Amazon Redshift 执行序列化加载,这样速度慢得多。在这种情况下,请使用单个 COPY 命令。