本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
元数据复制者 AWS DataSync
在传输过程中如何AWS DataSync处理文件或对象元数据取决于您使用的存储系统。
注意
DataSync不复制系统级设置。例如,在复制对象时,DataSync不会复制存储系统的加密设置。如果您从 SMB 共享进行复制,则DataSync不会复制您在文件系统级别配置的权限。
在具有相似元数据结构的系统之间复制的元数据
DataSync在具有相似元数据结构的存储系统之间保留元数据。
NFS 传输
下表描述了在使用网络文件系统 (NFS) 的位置之间DataSync可以复制哪些元数据。
在这些位置之间复制时 | DataSync可以复制 |
---|---|
|
|
中小型企业转账
下表描述了在使用服务器消息块 (SMB) 的位置之间DataSync可以复制哪些元数据。
在这些位置之间复制时 | DataSync可以复制 |
---|---|
|
|
HDFS
下表描述了当传输涉及 Hadoop D DataSync istributributributed System(HDFS)位置的。
从此位置复制时 | 到这些地点之一 | DataSync可以复制 |
---|---|---|
|
|
HDFS 使用字符串来存储文件和文件夹的用户和组所有权,而不是数字标识符(例如 UID 和 GID)。UID 和 GID 的默认值应用于目标文件系统。有关默认值的更多信息,请参阅了解何时以及如何DataSync应用默认 POSIX 元数据。 |
Amazon S3
下表描述了传输涉及 Amazon S3 位置时DataSync可以复制哪些元数据。
到Amazon S3
从这些位置之一进行复制时 | 到这个位置 | DataSync可以复制 |
---|---|---|
|
|
以下是 Amazon S3 用户元数据:
存储在 Amazon S3 用户元数据中的文件元数据可通过以下方式与文件网关上的 NFS 共享进行互操作。AWS Storage Gateway文件网关支持从本地网络对复制到 Amazon S3 的数据进行低延迟访问。DataSync此元数据还可以与 Lustre 的 FsX 互操作。 当 DataSync 将包含此元数据的对象复制回 NFS 服务器时,系统将还原文件元数据。恢复元数据需要向 NFS 服务器授予更高的权限。有关更多信息,请参阅配置来自 NFS 文件服务器的AWS DataSync传输: |
在 HDAmazon S3
在这些位置之间复制时 | DataSync可以复制 |
---|---|
|
以下是 Amazon S3 用户元数据:
|
在对象存储和 Amazon S3 之间
在这些位置之间复制时 | DataSync可以复制 |
---|---|
|
DataSync不复制其他对象元数据,例如对象访问控制列表 (ACL) 或以前的对象版本。 重要提示:如果您要从 Google Cloud Storage 存储分区转移对象,则复制对象标签可能会导致DataSync任务失败。为防止出现这种情况,请在配置任务设置时取消选择 “复制对象标签” 选项。有关更多信息,请参阅管理文件、对象和元数据的AWS DataSync传输方式: |
在具有不同元数据结构的系统之间复制的元数据
在不具有相似元数据结构的存储系统之间进行复制时,使用以下规则DataSync处理元数据。
从这些位置之一进行复制时 | 到这些地点之一 | DataSync可以复制 |
---|---|---|
|
|
目标文件系统上的所有文件和文件夹或目标 S3 存储桶中对象的@@ 默认 POSIX 元数据。该方法包括使用默认 POSIX 用户 ID 和组 ID 值。 不保留基于 Windows 的元数据(例如 ACL)。 |
|
|
源位置的文件和文件夹时间戳。文件或文件夹所有者是根据您在创建 HDFS 位置时指定的 HDFS 用户或 Kerberos 主体设置的。Hadoop 集群上的组映射配置决定了群组。 |
|
|
源位置的文件和文件夹时间戳。所有权是根据在中DataSync指定访问亚马逊 FSx 或 SMB 共享的 Windows 用户设置的。权限继承自父目录。 |
了解何时以及如何DataSync应用默认 POSIX 元数据
DataSync在以下情况下应用默认 POSIX 元数据:
-
当您的转账的来源和目标位置没有相似的元数据结构时
-
当源位置缺少元数据时
下表描述了在这些类型的传输过程中如何DataSync应用默认 POSIX 元数据:
源 | 目标位置 | 文件权限 | 文件夹权限 | UID | GID |
---|---|---|---|---|---|
|
|
0755 |
0755 |
65534 |
65534 |
|
|
0644 |
0755 |
0 |
0 |
|
|
0644 |
0755 |
0 |
0 |
1 如果对象没有先前应用过的元数据DataSync。
注意
HDFS 使用字符串而不是数字标识符(例如 UID 和 GID)存储文件和文件夹的用户和组所有权。如果源位置上没有等效的元数据,则文件和文件夹所有权将根据您在创建位置时指定的 HDFS 用户或 Kerberos 主体进行设置。DataSyncHadoop 集群上的组映射配置决定了群组。