Leitfaden zur Kompatibilität von Datenformaten - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Leitfaden zur Kompatibilität von Datenformaten

In diesem Handbuch werden die Datenformattypen beschrieben, die mit SageMaker Clarif-Verarbeitungsaufträgen kompatibel sind. Zu den unterstützten Datenformattypen gehören die Dateierweiterungen, die Datenstruktur und spezifische Anforderungen oder Einschränkungen für Tabellen-, Bild- und Zeitreihendatensätze. In diesem Leitfaden erfahren Sie auch, wie Sie überprüfen können, ob Ihr Datensatz diesen Anforderungen entspricht.

Auf einer höheren Ebene folgt der Verarbeitungsauftrag SageMaker Clarify dem Eingabe-Prozess-Ausgabe-Modell zur Berechnung von Messwerten und Merkmalsattributionen. Einzelheiten finden Sie in den folgenden Beispielen.

Die Eingabe für den Verarbeitungsauftrag SageMaker Clarify besteht aus folgenden Komponenten:

Während der Verarbeitungsphase berechnet SageMaker Clarify Messwerte für Verzerrungen und Feature-Attributionen. Der SageMaker Clarify-Verarbeitungsjob schließt die folgenden Schritte im Backend ab:

  • Der SageMaker Clarif-Verarbeitungsjob analysiert Ihre Analysekonfiguration und lädt Ihren Datensatz.

  • Um Messwerte und Featureszuschreibungen nach dem Training zu berechnen, benötigt der Auftrag Modellvorhersagen aus Ihrem Modell. Der Verarbeitungsjob SageMaker Clarify serialisiert Ihre Daten und sendet sie als Anfrage an Ihr Modell, das auf einem SageMaker Echtzeit-Inferenzendpunkt bereitgestellt wird. Danach extrahiert der SageMaker Clarify-Verarbeitungsjob Prognosen aus der Antwort.

  • Der Verarbeitungsauftrag SageMaker Clarify führt die Verzerrungs- und Erklärbarkeitsanalyse durch und gibt anschließend die Ergebnisse aus.

Weitere Informationen finden Sie unter Wie SageMaker Clarify Processing Jobs funktionieren.

Der Parameter, mit dem Sie das Format der Daten angeben, hängt wie folgt davon ab, wo die Daten im Verarbeitungsablauf verwendet werden:

  • Verwenden Sie für einen Eingabedatensatz den dataset_type Parameter, um das Format oder MIME den Typ anzugeben.

  • Verwenden Sie bei einer Anfrage an einen Endpunkt den content_type Parameter, um das Format anzugeben.

  • Verwenden Sie für eine Antwort von einem Endpunkt den accept_type Parameter, um das Format anzugeben.

Der Eingabedatensatz, die Anfrage und die Antwort an und vom Endpunkt benötigen nicht dasselbe Format. Sie können beispielsweise ein Parquet-Dataset mit einer CSV Anforderungs-Payload und einer JSON Lines-Antwort-Payload unter den folgenden Bedingungen verwenden.

  • Ihre Analyse ist korrekt konfiguriert.

  • Ihr Modell unterstützt die Anforderungs- und Antwortformate.

Anmerkung

Falls content_type oder nicht accept_type angegeben, leitet der Clarify-Container SageMaker den Wert und ab. content_type accept_type