本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
删除数据来源
如果要从 Amazon Kendra 索引中删除数据源中包含的信息,则可以删除该数据源。例如,在以下情况下删除数据来源:
-
数据来源配置不正确。删除数据来源,等待数据来源完成删除,然后重新创建。
-
您将文档从一个数据来源迁移到另一个数据来源。删除原始数据来源并在新位置重新创建。
-
您已达到索引的数据来源数限制。删除一个现有数据来源并添加一个新数据来源。有关可创建的数据来源数量的更多信息,请参阅限额。
要删除数据源,请使用控制台、 AWS Command Line Interface (AWS CLI)、DeleteDataSource
API 或 AWS CloudFormation 脚本。删除数据来源会从索引中移除有关该数据来源的所有信息。如果您只想停止同步数据来源,请将数据来源的同步计划更改为“按需运行”。
删除数据来源是一项异步操作。开始删除数据来源时,数据来源状态将更改为 DELETING
。在删除与数据来源相关的信息之前,它一直处于 DELETING
状态。删除数据源后,该数据源将不再出现在调用 ListDataSourcesAPI 的结果中。如果您使用已删除数据源的标识符调用 DescribeDataSourceAPI,则会收到ResourceNotFound
异常。
注意
从数据来源中删除特定文档后,删除整个数据来源或重新同步索引可能需要一小时或更长时间,具体取决于要删除的文档数量。
删除数据来源(控制台)
-
登录 AWS Management Console 并打开 Amazon Kendra 控制台,网址为https://console.aws.amazon.com/kendra/
。 -
在导航窗格中,选择索引,然后选择包含要删除的数据来源的索引。
-
在导航窗格中,选择 Data sources(数据来源)。
-
选择要移除的数据来源。
-
选择删除以删除数据来源。
删除数据来源(CLI)
-
在中 AWS Command Line Interface,使用以下命令。该命令针对 Linux 和 macOS 编排了格式。如果您使用 Windows,请将 Unix 行继续符(\)替换为脱字号(^)。
aws kendra delete-data-source \ --id
data-source-id
\ --index-idindex-id
删除数据源时, Amazon Kendra 会删除有关该数据源的所有存储信息。 Amazon Kendra 删除索引中存储的所有文档数据,以及与数据源关联的所有运行历史记录和指标。删除数据来源并不会从存储中移除原始文档。
Amazon Kendra 删除数据源时,数据源中的文档可能会包含在 DescribeIndex
API 返回的文档数量中。当 Amazon Kendra
删除数据来源时,数据来源中的文档可能会出现在搜索结果中。
Amazon Kendra 只要您在控制台中调用 DeleteDataSource
API 或选择删除数据源,就会立即释放该数据源的资源。如果您要删除数据来源以将数据来源数量减少到限制以下,则可以立即创建新的数据来源。
如果您要删除一个数据来源,然后为该文档数据创建另一个数据来源,请等待第一个数据来源删除完成,然后同步新的数据来源。
您可以删除正在与 Amazon Kendra同步的数据源。同步已停止,数据来源已删除。如果在删除数据来源时尝试启动同步,则会出现 ConflictException
异常。
如果关联的索引处于 DELETING
状态,则无法删除数据来源。如果删除索引,则会删除该索引的所有数据来源。当索引的数据来源处于 DELETING
状态时,您可以开始删除该索引。
如果您有两个数据源指向相同的文档,例如两个数据源指向同一个 Amazon S3 存储桶,则删除其中一个数据源时,索引中的文档可能会不一致。当两个数据来源引用相同的文档时,索引中仅存储文档数据的一个副本。移除一个数据来源会移除文档的索引数据。另一个数据源不知道文档已被删除,因此下次同步时 Amazon Kendra 不会正确地重新索引文档。当有两个数据来源指向同一个文档位置时,您应删除这两个数据来源,然后重新创建一个数据来源。