能力 2. 为生成式 AI RAG 技术提供安全的访问、使用和实现

下图说明了为生成式 AI 账户推荐的用于检索增强生成 (RAG) 功能的AWS服务。此场景的范围是保护RAG功能。

Generative AI 账户包括将嵌入内容存储在矢量数据库中、为用户存储对话和维护即时存储所需的服务，以及一套实现安全护栏和集中式安全治理所需的安全服务。您应该为VPC环境配置为访问的 Amazon S3 中的模型调用日志、提示存储和知识库数据源存储桶创建 Amazon S3 网关终端节点。您还应该为VPC环境配置为访问的 CloudWatch 日志创建 Logs 网关端点。 CloudWatch

理由

Retrie@@ ve Augented Generation (RAG) 是一种生成式人工智能技术，用于系统通过在生成答案之前从外部权威知识库中检索信息来增强其响应。此过程FMs通过允许他们访问特定于上下文的数据来 up-to-date帮助克服局限性，从而提高所生成响应的准确性和相关性。此用例指的是生成式 AI 安全范围矩阵的范围 3。在 Scope 3 中，您的组织使用预先训练的 FM（例如 Amazon Bedrock 中提供的那些 FM）来构建生成式 AI 应用程序。在此范围内，您可以控制您的应用程序和应用程序使用的任何客户数据，而FM提供商则控制预先训练的模型及其训练数据。

在向用户提供访问 Amazon Bedrock 知识库的权限时，您应考虑以下关键安全注意事项：

安全访问模型调用、知识库、对话历史记录和提示存储库
对对话、提示存储和知识库进行加密
针对潜在安全风险（例如及时注入或敏感信息泄露）发出警报

下一节将讨论这些安全注意事项和生成式 AI 功能。

设计注意事项

我们建议您避免使用敏感数据自定义 FM（请参阅本指南后面的生成式 AI 模型自定义部分）。相反，使用该RAG技术与敏感信息进行交互。这种方法有几个优点：

更严格的控制和可见性。通过将敏感数据与模型分开，您可以对敏感信息进行更好的控制和可见性。可以根据需要轻松编辑、更新或删除数据，这有助于确保更好的数据治理。
缓解敏感信息泄露。 RAG允许在模型调用期间与敏感数据进行更可控的交互。这有助于降低敏感信息意外泄露的风险，如果将数据直接整合到模型的参数中，可能会发生这种情况。
灵活性和适应性。将敏感数据与模型分开可以提高灵活性和适应性。随着数据要求或法规的变化，可以更新或修改敏感信息，而无需重新训练或重建整个语言模型。

Amazon Bedrock 知识库

您可以使用 Amazon Bedrock 知识库通过安全高效FMs地连接自己的数据源来构建RAG应用程序。此功能使用 Amazon OpenSearch Serverless 作为矢量存储，可以高效地从您的数据中检索相关信息。然后，FM使用这些数据来生成响应。您的数据将从 Amazon S3 同步到知识库，并生成嵌入内容以实现高效检索。

安全性注意事项

生成式 AI RAG 工作负载面临着独特的风险，包括数据源RAG的数据泄露以及威胁行为者的即时注入或恶意软件导致RAG数据源中毒。Amazon Bedrock 知识库为数据保护、访问控制、网络安全、日志和监控以及输入/输出验证提供了强大的安全控制，有助于降低这些风险。

补救措施

数据保护

使用您创建、拥有和管理的AWS密钥管理服务 (AWSKMS) 客户托管密钥对知识库数据进行静态加密。在为知识库配置数据摄取任务时，请使用客户管理的密钥对作业进行加密。如果您选择让 Amazon Bedrock 在亚马逊 OpenSearch 服务中为您的知识库创建矢量存储，Amazon Bedrock 可以将您选择的AWSKMS密钥传递给亚马逊 OpenSearch 服务进行加密。

您可以对通过使用密AWSKMS钥查询知识库生成响应的会话进行加密。您将知识库的数据源存储在 S3 存储桶中。如果您使用客户托管密钥对 Amazon S3 中的数据源进行加密，请将策略附加到您的知识库服务角色。如果包含您的知识库的矢量存储配置了 Secr AWS ets Manager 密钥，请使用客户管理的密钥对密钥进行加密。

有关更多信息和要使用的策略，请参阅 Amazon Bedrock 文档中的知识库资源加密。

身份和访问管理

遵循最低权限原则，为 Amazon Bedrock 的知识库创建自定义服务角色。创建允许 Amazon Bedrock 担任此角色的信任关系，并创建和管理知识库。将以下身份策略附加到自定义知识库服务角色：

访问 Amazon Bedrock 模型的权限
访问您在 Amazon S3 中的数据源的权限
在 S OpenSearch ervice 中访问您的矢量数据库的权限
访问您的亚马逊 Aurora 数据库集群的权限（可选）
访问配置了 Secrets Manager AWS 密钥的矢量数据库的权限（可选）
AWS在数据摄取期间管理用于临时数据存储的AWSKMS密钥的权限
与您的文档聊天的权限
管理来自其他用户AWS账户的数据源的权限（可选）。AWS

知识库支持安全配置，用于为您的知识库设置数据访问策略，为您的私有 Amazon OpenSearch Serverless 知识库设置网络访问策略。有关更多信息，请参阅 Amazon Bedrock 文档中的创建知识库和服务角色。

输入和输出验证

输入验证对于 Amazon Bedrock 知识库至关重要。在将文件上传到数据源之前，使用 Amazon S3 中的恶意软件防护来扫描文件中是否存在恶意内容。有关更多信息，请参阅AWS博客文章《使用适用于 Amazon S3 的防病毒软件将恶意软件扫描集成到您的数据摄取管道中》。

识别并筛选出用户上传到知识库数据源时可能出现的提示注入。此外，检测和编辑个人身份信息 (PII)，将其作为数据摄取管道中的另一个输入验证控件。Amazon Comprehend 可以帮助检测PII和编辑用户上传到知识库数据源中的数据。有关更多信息，请参阅 Amazon Comprehend 文档中的检测PII实体。

我们还建议您使用 Amazon Macie 来检测知识库数据源中的潜在敏感数据并生成警报，以增强整体安全性和合规性。实施适用于 Amazon Bedrock 的 Guardrails，以帮助强制执行内容政策，阻止不安全的输入/输出，并根据您的要求帮助控制模型行为。

能力 2. 为生成式 AI RAG 技术提供安全的访问、使用和实现

理由

设计注意事项

安全性注意事项

补救措施

推荐的AWS服务