本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
功能 4。為生成式 AI 模型自訂提供安全存取、使用和實作
下圖說明針對此功能的生成式 AI 帳戶建議的AWS服務。此案例的範圍是保護模型自訂。此使用案例著重於保護模型自訂任務的資源和訓練環境,以及保護自訂模型的調用。
生成式 AI 帳戶包含自訂模型所需的服務,以及實作安全防護和集中式安全管理所需的一組安全服務。您應該在 Amazon S3 中為訓練資料和評估儲存貯體建立 Amazon S3 閘道端點,而私有VPC環境設定為允許私有模型自訂。
理由
模型自訂是為模型提供訓練資料的程序,以改善特定使用案例的效能。在 Amazon Bedrock 中,您可以自訂 Amazon Bedrock 基礎模型 (FMs),以改善其效能,並使用例如持續使用未標記資料進行預先訓練以增強網域知識,以及使用標籤資料微調以最佳化任務特定效能等方法來建立更好的客戶體驗。如果您自訂模型,則必須購買佈建輸送量才能使用。
此使用案例是指生成式 AI 安全範圍矩陣
或者,您可以使用自訂模型匯入功能,在 Amazon Bedrock 中建立自訂模型,以匯入您在其他環境中自訂的模型,例如 Amazon SageMaker。 FMs對於匯入來源 ,我們強烈建議將 Safetensors 用於匯入的模型序列化格式。與 Pickle 不同,Safetensors 只允許您儲存張量資料,而不是任意 Python 物件。這可消除因取消選取不受信任的資料而產生的漏洞。Safetensors 無法執行程式碼:它只能安全地存放和載入張量。
當您讓使用者存取 Amazon Bedrock 中的生成式 AI 模型自訂時,您應該解決這些關鍵安全考量:
-
安全存取模型調用、訓練任務,以及訓練和驗證檔案
-
訓練模型任務、自訂模型以及訓練和驗證檔案的加密
-
潛在安全風險的提醒,例如訓練檔案中的越獄提示或敏感資訊
以下各節討論這些安全考量和生成 AI 功能。
Amazon Bedrock 模型自訂
您可以在 Amazon Bedrock 中以您自己的資料私下安全地自訂基礎模型 (FMs),以建置特定於網域、組織和使用案例的應用程式。透過微調,您可以提供自己的任務特定、標記的訓練資料集,並進一步專用於 ,來提高模型準確度FMs。透過持續的預先訓練,您可以在具有客戶受管金鑰的安全受管環境中使用自己的未標記資料來訓練模型。如需詳細資訊,請參閱 Amazon Bedrock 文件中的自訂模型。
安全考量
生成式 AI 模型自訂工作負載面臨獨特的風險,包括訓練資料的資料外傳、將惡意提示或惡意軟體插入訓練資料的資料中毒,以及在模型推論期間威脅發動者快速注入或外傳資料。在 Amazon Bedrock 中,模型自訂為資料保護、存取控制、網路安全、記錄和監控以及輸入/輸出驗證提供了強大的安全控制,有助於緩解這些風險。
修復
資料保護
使用AWSKMS您建立、擁有和管理的客戶受管金鑰,加密模型自訂任務、模型自訂任務的輸出檔案 (訓練和驗證指標),以及產生的自訂模型。當您使用 Amazon Bedrock 執行模型自訂任務時,您可以將輸入 (訓練和驗證資料) 檔案存放在 S3 儲存貯體中。當任務完成時,Amazon Bedrock 會將輸出指標檔案存放在您建立任務時指定的 S3 儲存貯體中,並將產生的自訂模型成品存放在由 控制的 S3 儲存貯體中AWS。依預設,輸入和輸出檔案會使用AWS受管金鑰,以 Amazon S3 SSE-S3 伺服器端加密。您也可以選擇使用客戶受管金鑰來加密這些檔案。
身分與存取管理
遵循最低權限原則,為模型自訂或模型匯入建立自訂服務角色。對於模型自訂服務角色 , 建立信任關係,允許 Amazon Bedrock 擔任此角色並執行模型自訂任務。連接政策,以允許角色存取您的訓練和驗證資料,以及您要寫入輸出資料的儲存貯體。對於模型匯入服務角色 , 建立信任關係,允許 Amazon Bedrock 擔任此角色並執行模型匯入任務。附加政策,以允許角色存取 S3 儲存貯體中的自訂模型檔案。 S3 如果您的模型自訂任務在 中執行VPC,請將VPC許可連接至模型自訂角色 。
網路安全
若要控制對資料的存取,請使用虛擬私有雲端 (VPC) 搭配 Amazon VPC。建立 時VPC,建議您使用端點路由表的DNS預設設定,以便標準 Amazon S3 URLs解析。
如果您在沒有網際網路存取VPC的情況下設定 ,則需要建立 Amazon S3 VPC端點,以允許模型自訂任務存取存放訓練和驗證資料的 S3 儲存貯體,並將存放模型成品。
完成設定 VPC和 端點後,您需要將許可連接至模型自訂IAM角色 。設定 VPC和所需角色和許可後,您可以建立使用此 的模型自訂任務VPC。透過為訓練資料建立VPC具有關聯 S3 VPC端點的無網際網路存取權的 ,您可以使用私有連線 (無需任何網際網路暴露) 執行模型自訂任務。
建議AWS的服務
Amazon Simple Storage Service (Amazon S3)
當您執行模型自訂任務時,任務會存取您的 S3 儲存貯體,以下載輸入資料並上傳任務指標。當您在 Amazon Bedrock 主控台或 上提交模型自訂任務時,您可以選擇微調或繼續預先訓練作為模型類型API。模型自訂任務完成後,您可以透過檢視您在提交任務時指定的輸出 S3 儲存貯體中的檔案,或檢視模型的詳細資訊來分析訓練程序的結果。使用客戶受管金鑰加密這兩個儲存貯體。若要進行額外的網路安全強化,您可以為VPC環境設定為存取的 S3 儲存貯體建立閘道端點。應該記錄並監控存取。使用版本控制進行備份。您可以使用資源型政策來更緊密地控制對 Amazon S3 檔案的存取。
Amazon Macie
Macie 可協助識別 Amazon S3 訓練和驗證資料集中的敏感資料。如需安全性最佳實務,請參閱本指南中的先前的 Macie 章節。 Amazon S3
Amazon EventBridge
您可以使用 Amazon EventBridge 來設定 Amazon SageMaker ,以自動回應 Amazon Bedrock 中的模型自訂任務狀態變更。來自 Amazon Bedrock 的事件會以 EventBridge 近乎即時的方式交付至 Amazon。當事件符合規則時,您可以撰寫簡單的規則來自動化動作。
AWS KMS
我們建議您使用客戶受管金鑰來加密模型自訂任務、來自模型自訂任務的輸出檔案 (訓練和驗證指標)、產生的自訂模型,以及託管訓練、驗證和輸出資料的 S3 儲存貯體。如需詳細資訊,請參閱 Amazon Bedrock 文件中的模型自訂任務和成品加密。
金鑰政策是AWSKMS金鑰的資源政策。金鑰政策是控制KMS金鑰存取的主要方式。您也可以使用IAM政策和授予來控制對KMS金鑰的存取,但每個KMS金鑰都必須有一個金鑰政策。使用 akey 政策為角色提供許可,以存取使用客戶受管金鑰加密的自訂模型。這可讓指定的角色使用自訂模型進行推論。
使用 Amazon CloudWatch、Amazon CloudTrail、Amazon OpenSearch Serverless、Amazon S3 和 Amazon Comprehend,如先前功能章節所述。