本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
调整容量
注意
功能支持因索引类型和使用的搜索 API 而异。要查看您使用的索引类型和搜索 API 是否支持此功能,请参阅索引类型。
Amazon Kendra 以容量单位为索引提供资源。每个容量单位都为索引提供了额外的资源。文档和查询的存储有单独的容量单位。您只能向 GenAI 企业版和 Amazon Kendra 企业版索引添加容量单位。无法向开发者版本索引添加容量。
文档存储容量单位为您的索引提供了以下额外存储空间。
-
亚马逊 Kendra GenAI 企业版 — 20,000 份文档或 200MB 的提取文本。
-
亚马逊 Kendra 企业版 — 100,000 份文档或 30 GB 存储空间。
查询容量单位为您的索引提供以下额外查询。每秒查询次数在检索和查询 API 之间共享。
-
亚马逊 Kendra GenAI 企业版 — 每秒 0.1 个查询或每天大约 8,000 个查询。
-
亚马逊 Kendra 企业版 — 每秒 0.1 个查询或每天大约 8,000 个查询。
每个索引的基本容量等于 1 个容量单位(30 GB/200MB 的存储空间和每秒 0.1 个查询)。每增加一个容量单位都需要支付额外费用。有关详细信息,请参阅 Amazon Kendra
定价
您最多可以添加 100 个额外容量单位到存储中,并查询索引的资源。如果您需要更多设备,只需联系支持团队
为了适应您的使用要求,您每天最多可以将容量单位提高 5 倍。您不能将文档存储容量减少到索引中存储的文档数量以下。例如,如果您要存储 150,000 个文档,则不能将存储容量减少到 1 个额外单位以下。
您可以在控制台中查看索引正在使用的资源,方法是选择索引名称以打开索引设置和其他信息,也可以使用 DescribeIndexAPI。
Amazon Kendra 当超过索引容量时,也会返回异常。当所有文档的提取总大小超过索引的限制时,您会得到 ServiceQuotaExceededException
。当文档数量超过索引限制时,每个文档都会得到一个 InvalidRequest
。如果每秒的查询数量超出限制,则会得到 ThrottlingException
。有关限制的更多信息,请参阅 Amazon Kendra的限额。
累积的查询将持续长达 24 小时。
查看容量
通过选择索引名称来访问详细信息,即可在 Amazon Kendra 控制台中查看索引正在使用的资源。控制台还提供使用情况图表,因此您可以确定索引使用的存储空间和查询容量。您可以使用此信息来帮助您计划何时添加更多容量。
要查看文档存储和查询,请使用(控制台)
-
登录 AWS Management Console 并在家中打开https://console.aws.amazon.com/kendra/主 Amazon Kendra
机。 -
从索引列表中选择要访问的索引。
-
滚动至设置部分,查看当前的文档存储总量和查询容量。
要使用 Amazon Kendra API 查看容量,请使用 DescribeIndexAPI 中的CapacityUnits
参数。
添加和删除容量
如果您需要为索引增加容量,可以使用控制台或 Amazon Kendra API 进行添加。
添加或删除存储或查询容量(控制台)
-
登录 AWS Management Console 并在家中打开https://console.aws.amazon.com/kendra/主 Amazon Kendra
机。 -
从索引列表中选择要访问的索引。
-
选择编辑,或者从操作下拉列表中选择编辑。
-
选择下一步以进入配置详细信息页面。
-
添加或移除文档存储和/或查询容量单位。
-
继续选择下一步以进入评论页面,然后选择更新以保存您的更改。
在更新索引的容量后,您所做的更改可能需要几分钟才能生效。
要使用 Amazon Kendra API 添加或移除容量,请使用 UpdateIndexAPI 中的CapacityUnits
参数。
Amazon Kendra 智能排名容量
容量单位每秒为重新评分执行计划提供以下额外的重新评分请求。重新评分执行计划是用于配置重新评分 API 的资源。
-
每秒 0.01 个请求
每个重新评分执行计划都附带一个等于 1 个容量单位(每秒 0.01 个请求)的基本容量。每增加一个容量单位都需要支付额外费用。有关详细信息,请参阅 Amazon Kendra
定价
您最多可以添加 1000 个额外容量单位来执行重新评分执行计划。如果您需要更多设备,只需联系支持团队
查询建议容量
使用查询建议时,基本查询容量为每秒 2.5 次GetQuerySuggestions调用。GetQuerySuggestions
容量是索引预置查询容量的五倍,或每秒 2.5 个调用的基本容量,以较高者为准。例如,索引的基本容量为每秒 0.1 个查询,GetQuerySuggestions
容量的基本容量为每秒 2.5 个调用。如果您在索引每秒共 0.2 个查询的基础上再添加 0.1 个查询,GetQuerySuggestions
容量为每秒 2.5 个调用(比每秒 0.2 个查询的五倍还要高)。
Amazon Kendra 经验容量
搜索体验容量
Amazon Kendra 开始限制你的 Amazon Kendra 体验 Query
QuerySuggestions
,SubmitFeedback
每秒 15 个请求,每秒 40 个请求用于查询爆发。对于查询容量单位超过 150 的索引,这些限制仍然适用。
例如,您的索引的查询容量单位为 150,因此您的搜索体验应用程序每秒可以处理 15 个请求。但是,如果您扩展到 200 个查询容量单位,那么您的搜索体验应用程序每秒仍只能处理 15 个请求。如果您将索引限制为 100 个查询容量单位,则您的搜索体验应用程序每秒只能处理 10 个请求。
自适应查询暴增
Amazon Kendra 预配置的基本容量为 1 个查询容量单位。您每天使用 8000 个查询,最低吞吐量为每秒 0.1 个查询(每个查询容量单位)。累积的查询将持续长达 24 小时,并且可以容纳大量流量。允许的突发量会有所不同,因为它取决于集群在任何给定时间的负载。预配置足够的查询容量单位来处理您的峰值负载水平。
处理超出预配置吞吐量的意外突发流量的一种自适应方法是内置 Amazon Kendra的自适应查询爆发。 Amazon Kendra的企业版提供了自适应查询突发功能。
自适应查询突发是一项内置功能,允许您应用未使用的查询容量来处理意外流量。 Amazon Kendra 以每秒预配置的查询速率累积未使用的查询,最多不超过您为索引预配置的最大查询数。 Amazon Kendra 这些累积的查询用于超出分配容量的意外流量。自适应查询突发的最佳性能可能会有所不同,具体取决于多个因素,例如索引总大小、查询复杂性、累积的未使用查询以及索引的总体负载。建议您自行进行负载测试,以准确测量容量暴增。