在 Amazon S3 Glacier 中下载文件库清单 - Amazon S3 Glacier

此页面仅适用于使用保管库的 S3 Glacier 服务的现有客户以及 2012 年以RESTAPI来的原始客户。

如果您正在寻找档案存储解决方案,我们建议您在亚马逊 S3、S3 Glacier 即时检索、S3 Glacier 灵活检索和 S3 Glacier Deep Archive Dee p Archive 中使用 S3 Glacier 存储类。要了解有关这些存储选项的更多信息,请参阅 Amazon S3 用户指南中的 S3 Glacier 存储类和使用 S3 Glacier 存储类的长期数据存储。这些存储类别使用 Amazon S3API,适用于所有区域,并且可以在 Amazon S3 控制台中进行管理。它们提供存储成本分析、存储镜头、高级可选加密功能等功能。

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在 Amazon S3 Glacier 中下载文件库清单

您向您的文件库上传第一个档案后,Amazon S3 Glacier(S3 Glacier)会自动创建文件库清单,然后大约每天更新它一次。S3 Glacier 创建第一份清单后,通常需要经过半天(最多一天)时间,该清单才可供检索。您可以通过以下流程(该流程分为两个步骤)从 S3 Glacier 检索文件库清单:

  1. 使用 启动 Job(POST作业) 操作启动清单检索任务。

    重要

    数据检索策略可能导致您启动检索作业的请求失败,并发生 PolicyEnforcedException 异常。有关数据检索策略的更多信息,请参阅S3 Glacier 数据检索策略。有关 PolicyEnforcedException 异常的更多信息,请参阅错误响应

  2. 在任务完成后,使用 获取任务输出(获取输出) 操作下载字节。

例如,检索档案或文件库清单的操作要求您首先启动检索任务。任务请求会异步运行。当您启动检索任务时,S3 Glacier 会创建任务并在响应中返回任务 ID。S3 Glacier 完成任务时,您可以获取任务输出(档案字节或文件库清单数据)。

任务必须先完成,然后,您才能获取其输出。要确定任务的状态,您有以下选择:

  • 等待任务完成通知-您可以指定一个亚马逊简单通知服务 (AmazonSNS) 主题,S3 Glacier 可以在任务完成后向该主题发布通知。您可以使用以下方法指定 Amazon SNS 主题:

    • 按任务指定一个 Amazon SNS 主题。

      启动任务时,您可以选择指定一个 Amazon SNS 主题。

    • 设置文件库的通知配置。

      您可以设置文件库的特定事件的通知配置(参阅在 Amazon S3 Glacier 中配置文件库通知)。每当特定事件发生时,S3 Glacier 都会向指定SNS主题发送一条消息。

    如果您在文件库中设置了通知配置,并且在启动任务时还指定了 Amazon SNS 主题,则 S3 Glacier 会向这两个主题发送任务完成消息。

    您可以将SNS主题配置为通过电子邮件通知您,或者将消息存储在应用程序可以轮询的亚马逊简单队列服务 (AmazonSQS) 中。当该队列中出现消息时,您可以检查任务是否已成功完成,然后下载任务输出。

  • 显式请求任务信息—S3 Glacier 也提供了描述任务操作 (描述任务(获取任务 ID)),该操作可让您轮询任务信息。您可以定期发送此请求,以获取任务信息。但是,建议使用Amazon SNS 通知。

注意

你通过SNS通知获得的信息与你通过调用 Describe Job 获得的信息相同。

关于库存

从您首次将档案上传到文件库之日起,S3 Glacier 每天至少更新一次文件库清单。如果在上次清单盘点后没有对文件库执行过添加或删除档案的操作,则不会更新库存日期。当您启动文件库清单任务时,S3 Glacier 会返回其生成的最后一个清单,即 point-in-time 快照而不是实时数据。请注意,S3 Glacier 为文件库创建第一份清单后,通常需要经过半天(最多一天)时间,该清单才可用于检索操作。

您可能没有发现为每个档案上传操作检索文件库清单有什么好处。但是,假设您在客户端维护数据库,且该客户端关联了您上传到 S3 Glacier 的档案的元数据。此时,您可能会发现,文件库库存对于根据需要将您数据库中的信息与实际文件库库存进行协调很有用。您可以通过筛选存档创建日期或设置配额,来限制检索的清单项目数。有关限制清单检索的更多信息,请参阅确定清单检索范围

库存可以用两种格式返回:逗号分隔值 (CSV) 或。JSON启动清单任务时,您可以选择性地指定格式。默认格式为JSON。有关清单任务输出中返回的数据字段的更多信息,请参阅 响应正文 Get Job O utput API