Fähigkeit 4. Bereitstellung von sicherem Zugriff, Nutzung und Implementierung für die Anpassung generativer KI-Modelle - AWS Präskriptive Leitlinien

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Fähigkeit 4. Bereitstellung von sicherem Zugriff, Nutzung und Implementierung für die Anpassung generativer KI-Modelle

Das folgende Diagramm zeigt die AWS Dienste, die für das Generative AI-Konto für diese Funktion empfohlen werden. Der Umfang dieses Szenarios besteht darin, die Anpassung des Modells sicherzustellen. Dieser Anwendungsfall konzentriert sich auf die Sicherung der Ressourcen und der Schulungsumgebung für eine Modellanpassung sowie auf die Sicherung des Aufrufs eines benutzerdefinierten Modells.

AWSDienste, die für das Generative AI-Konto zur Modellanpassung empfohlen werden.

Das Generative AI-Konto umfasst Dienste, die für die Anpassung eines Modells erforderlich sind, sowie eine Reihe erforderlicher Sicherheitsdienste zur Implementierung von Sicherheitsleitplanken und zentraler Sicherheitssteuerung. Sie sollten Amazon S3-Gateway-Endpunkte für die Trainingsdaten und Evaluierungs-Buckets in Amazon S3 erstellen, für deren Zugriff eine private VPC Umgebung konfiguriert ist, um die Anpassung des privaten Modells zu ermöglichen. 

Begründung

Bei der Modellanpassung werden einem Modell Trainingsdaten zur Verfügung gestellt, um dessen Leistung für bestimmte Anwendungsfälle zu verbessern. In Amazon Bedrock können Sie Amazon Bedrock Foundation-Modelle (FMs) anpassen, um ihre Leistung zu verbessern und ein besseres Kundenerlebnis zu schaffen, indem Sie Methoden wie kontinuierliche Vorschulungen mit unmarkierten Daten verwenden, um Ihr Fachwissen zu erweitern, und Feinabstimmungen mit beschrifteten Daten durchführen, um die aufgabenspezifische Leistung zu optimieren. Wenn Sie ein Modell anpassen, müssen Sie Provisioned Throughput erwerben, um es verwenden zu können. 

Dieser Anwendungsfall bezieht sich auf Scope 4 der Generative AI Security Scoping Matrix. In Scope 4 passen Sie ein FM, wie es beispielsweise in Amazon Bedrock angeboten wird, mit Ihren Daten an, um die Leistung des Modells für eine bestimmte Aufgabe oder Domäne zu verbessern. In diesem Bereich kontrollieren Sie die Anwendung, alle Kundendaten, die von der Anwendung verwendet werden, die Trainingsdaten und das benutzerdefinierte Modell, wohingegen der FM-Anbieter das vortrainierte Modell und seine Trainingsdaten kontrolliert. 

Alternativ können Sie ein benutzerdefiniertes Modell in Amazon Bedrock erstellen, indem Sie die Importfunktion für benutzerdefinierte Modelle verwenden, um FMs das zu importieren, das Sie in anderen Umgebungen wie Amazon SageMaker angepasst haben. Für die Importquelle empfehlen wir dringend, Safetensors für das Serialisierungsformat des importierten Modells zu verwenden. Im Gegensatz zu Pickle können Sie mit Safetensors nur Tensordaten speichern, keine beliebigen Python-Objekte. Dadurch werden Sicherheitslücken beseitigt, die durch das Entpacken nicht vertrauenswürdiger Daten entstehen. Safetensoren können keinen Code ausführen — sie speichern und laden nur Tensoren sicher.

Wenn Sie Benutzern Zugriff auf die generative Anpassung von KI-Modellen in Amazon Bedrock gewähren, sollten Sie die folgenden wichtigen Sicherheitsaspekte berücksichtigen: 

  • Sicherer Zugriff auf Modellaufrufe, Schulungsaufträge sowie Schulungs- und Validierungsdateien

  • Verschlüsselung des Trainingsmodell-Jobs, des benutzerdefinierten Modells und der Trainings- und Validierungsdateien

  • Warnungen vor potenziellen Sicherheitsrisiken wie Jailbreak-Eingabeaufforderungen oder vertraulichen Informationen in Trainingsdateien 

In den folgenden Abschnitten werden diese Sicherheitsüberlegungen und die generative KI-Funktionalität erörtert.  

Anpassung des Amazon Bedrock-Modells

Sie können Foundation-Modelle (FMs) privat und sicher mit Ihren eigenen Daten in Amazon Bedrock anpassen, um Anwendungen zu erstellen, die für Ihre Domain, Organisation und Ihren Anwendungsfall spezifisch sind. Durch die Feinabstimmung können Sie die Modellgenauigkeit erhöhen, indem Sie Ihren eigenen aufgabenspezifischen Trainingsdatensatz mit Bezeichnung bereitstellen und Ihren Trainingsdatensatz weiter spezialisieren. FMs Mit fortlaufenden Vorschulungen können Sie Modelle anhand Ihrer eigenen, unbeschrifteten Daten in einer sicheren und verwalteten Umgebung mit vom Kunden verwalteten Schlüsseln trainieren. Weitere Informationen finden Sie unter Benutzerdefinierte Modelle in der Amazon Bedrock-Dokumentation.

Sicherheitsüberlegungen

Workloads zur generativen Anpassung von KI-Modellen sind besonderen Risiken ausgesetzt, darunter Datenexfiltration von Trainingsdaten, Datenvergiftung durch das Einfügen bösartiger Eingabeaufforderungen oder Malware in Trainingsdaten und sofortige Injektion oder Datenexfiltration durch Bedrohungsakteure bei der Modellinferenz. In Amazon Bedrock bietet die Modellanpassung robuste Sicherheitskontrollen für Datenschutz, Zugriffskontrolle, Netzwerksicherheit, Protokollierung und Überwachung sowie Eingabe-/Ausgabevalidierung, die zur Minderung dieser Risiken beitragen können.  

Abhilfemaßnahmen

Datenschutz

Verschlüsseln Sie den Modellanpassungsjob, die Ausgabedateien (Trainings- und Validierungsmetriken) des Modellanpassungsjobs und das daraus resultierende benutzerdefinierte Modell mithilfe eines vom Kunden verwalteten Schlüssels AWSKMS, den Sie selbst erstellen, besitzen und verwalten. Wenn Sie Amazon Bedrock verwenden, um einen Modellanpassungsjob auszuführen, speichern Sie die Eingabedateien (Trainings- und Validierungsdaten) in Ihrem S3-Bucket. Wenn der Job abgeschlossen ist, speichert Amazon Bedrock die Ausgabe-Metrikdateien in dem S3-Bucket, den Sie bei der Erstellung des Jobs angegeben haben, und speichert die resultierenden benutzerdefinierten Modellartefakte in einem S3-Bucket, der von AWS gesteuert wird. Standardmäßig werden die Eingabe- und Ausgabedateien mit der serverseitigen Amazon S3 SSE S3-Verschlüsselung unter Verwendung eines AWS verwalteten Schlüssels verschlüsselt. Sie können diese Dateien auch mit einem vom Kunden verwalteten Schlüssel verschlüsseln.

Verwalten von Identitäten und Zugriff

Erstellen Sie eine benutzerdefinierte Servicerolle für die Modellanpassung oder den Modellimport, indem Sie dem Prinzip der geringsten Rechte folgen. Richten Sie für die Rolle des Modelanpassungsdienstes eine Vertrauensbeziehung ein, die es Amazon Bedrock ermöglicht, diese Rolle zu übernehmen und die Modellanpassung durchzuführen. Fügen Sie eine Richtlinie hinzu, die der Rolle den Zugriff auf Ihre Schulungs- und Validierungsdaten und den Bucket, in den Sie Ihre Ausgabedaten schreiben möchten, ermöglicht. Richten Sie für die Modellimport-Servicerolle eine Vertrauensbeziehung ein, die es Amazon Bedrock ermöglicht, diese Rolle zu übernehmen und den Modellimportjob auszuführen. Fügen Sie eine Richtlinie hinzu, damit die Rolle auf die benutzerdefinierten Modelldateien in Ihrem S3-Bucket zugreifen kann. Wenn Ihr Job zur Modellanpassung in einer ausgeführt wirdVPC, fügen Sie einer Modellanpassungsrolle VPC Berechtigungen hinzu

Netzwerksicherheit

Verwenden Sie eine virtuelle private Cloud (VPC) mit Amazon, um den Zugriff auf Ihre Daten zu kontrollierenVPC. Wenn Sie Ihre erstellenVPC, empfehlen wir Ihnen, die DNS Standardeinstellungen für Ihre Endpunkt-Routing-Tabelle zu verwenden, damit die standardmäßige Amazon URLs S3-Auflösung gewährleistet ist. 

Wenn Sie Ihr VPC Gerät ohne Internetzugang konfigurieren, müssen Sie einen Amazon S3 VPC S3-Endpunkt erstellen, damit Ihre Modellierungsanpassungsjobs auf die S3-Buckets zugreifen können, in denen Ihre Trainings- und Validierungsdaten gespeichert sind und in denen die Modellartefakte gespeichert werden.

Nachdem Sie die Einrichtung Ihres VPC Endpunkts abgeschlossen haben, müssen Sie Ihrer IAMRolle für die Modellanpassung Berechtigungen zuweisen. Nachdem Sie die VPC und die erforderlichen Rollen und Berechtigungen konfiguriert haben, können Sie einen Job zur Modellanpassung erstellen, der diese Rollen verwendet VPC. Indem Sie einen ohne Internetzugang VPC mit einem zugehörigen VPC S3-Endpunkt für die Trainingsdaten erstellen, können Sie Ihren Modellierungsanpassungsjob mit privater Konnektivität (ohne Internetzugriff) ausführen. 

Empfohlene AWS Dienste

Amazon S3

Wenn Sie einen Job zur Modellanpassung ausführen, greift der Job auf Ihren S3-Bucket zu, um die Eingabedaten herunterzuladen und Job-Metriken hochzuladen. Sie können als Modelltyp Feinabstimmung oder kontinuierliche Vorschulung wählen, wenn Sie Ihren Auftrag zur Modellanpassung auf der Amazon Bedrock-Konsole einreichen oder. API Nach Abschluss eines Auftrags zur Modellanpassung können Sie die Ergebnisse des Trainingsprozesses analysieren, indem Sie sich die Dateien im Ausgabe-S3-Bucket ansehen, den Sie bei der Einreichung des Jobs angegeben haben, oder Details zum Modell einsehen. Verschlüsseln Sie beide Buckets mit einem vom Kunden verwalteten Schlüssel. Um die Netzwerksicherheit weiter zu erhöhen, können Sie einen Gateway-Endpunkt für die S3-Buckets erstellen, für deren Zugriff die VPC Umgebung konfiguriert ist. Der Zugriff sollte protokolliert und überwacht werden. Verwenden Sie die Versionierung für Backups. Sie können ressourcenbasierte Richtlinien verwenden, um den Zugriff auf Ihre Amazon S3 S3-Dateien genauer zu kontrollieren. 

Amazon Macie

Macie kann Ihnen helfen, sensible Daten in Ihren Amazon S3 S3-Trainings- und Validierungsdatensätzen zu identifizieren. Bewährte Sicherheitsmethoden finden Sie im vorherigen Abschnitt Macie in dieser Anleitung.

Amazon EventBridge

Sie können Amazon verwenden EventBridge, um Amazon so SageMaker zu konfigurieren, dass es automatisch auf eine Änderung des Auftragsstatus zur Modellanpassung in Amazon Bedrock reagiert. Ereignisse von Amazon Bedrock werden nahezu EventBridge in Echtzeit an Amazon übermittelt. Sie können einfache Regeln schreiben, um Aktionen zu automatisieren, wenn ein Ereignis mit einer Regel übereinstimmt.

AWS KMS 

Wir empfehlen, dass Sie einen vom Kunden verwalteten Schlüssel verwenden, um den Modellanpassungsjob, die Ausgabedateien (Trainings- und Validierungsmetriken) des Modellanpassungsjobs, das daraus resultierende benutzerdefinierte Modell und die S3-Buckets zu verschlüsseln, die die Trainings-, Validierungs- und Ausgabedaten hosten. Weitere Informationen finden Sie unter Verschlüsselung von Modellanpassungsaufträgen und Artefakten in der Amazon Bedrock-Dokumentation.

Eine Schlüsselrichtlinie ist eine Ressourcenrichtlinie für einen AWS KMS Schlüssel. Schlüsselrichtlinien sind die wichtigste Methode zur Steuerung des Zugriffs auf KMS Schlüssel. Sie können auch IAM Richtlinien und Genehmigungen verwenden, um den Zugriff auf KMS Schlüssel zu kontrollieren, aber für jeden KMS Schlüssel muss eine Schlüsselrichtlinie gelten. Verwenden Sie eine Schlüsselrichtlinie, um einer Rolle Berechtigungen für den Zugriff auf das benutzerdefinierte Modell zu gewähren, das mit dem vom Kunden verwalteten Schlüssel verschlüsselt wurde. Auf diese Weise können bestimmte Rollen ein benutzerdefiniertes Modell für Inferenzen verwenden.

Verwenden Sie Amazon CloudWatch, Amazon CloudTrail, Amazon OpenSearch Serverless, Amazon S3 und Amazon Comprehend, wie in den vorherigen Funktionsabschnitten beschrieben.