Integration von Amazon SageMaker AI-Modellen mit Amazon QuickSight - Amazon QuickSight

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Integration von Amazon SageMaker AI-Modellen mit Amazon QuickSight

Anmerkung

Sie benötigen keine technische Erfahrung mit maschinellem Lernen (ML), um Analysen und Dashboards zu erstellen, die die ML-gestützten Funktionen von Amazon verwenden. QuickSight

Sie können Ihre Amazon QuickSight Enterprise Edition-Daten mit Amazon SageMaker AI-Modellen für maschinelles Lernen erweitern. Sie können Rückschlüsse auf Daten ziehen, die in gespeichert sind SPICE importiert aus einer beliebigen von Amazon unterstützten Datenquelle QuickSight. Eine vollständige Liste der unterstützten Datenquellen finden Sie unter Unterstützte Datenquellen.

Wenn Sie Amazon QuickSight mit SageMaker KI-Modellen verwenden, können Sie Zeit sparen, die Sie sonst für die Verwaltung von Datenbewegungen und das Schreiben von Code aufwenden müssten. Die Ergebnisse sind sowohl für die Bewertung des Modells als auch - wenn Sie mit den Ergebnissen zufrieden sind - für die Weitergabe an Entscheidungsträger nützlich. Sie können sofort beginnen, nachdem das Modell erstellt wurde. Dies bringt die vorgefertigten Modelle Ihrer Daten-Wissenschaftler hervor und Sie können diese Wissenschaft auf Ihre Datasets anwenden. Anschließend können Sie diese Erkenntnisse in Ihren prädiktiven Dashboards freigeben. Mit dem QuickSight serverlosen Ansatz von Amazon lässt sich der Prozess nahtlos skalieren, sodass Sie sich keine Gedanken über Inferenz- oder Abfragekapazität machen müssen.

Amazon QuickSight unterstützt SageMaker KI-Modelle, die Regressions- und Klassifizierungsalgorithmen verwenden. Sie können dieses Feature anwenden, um Vorhersagen für beinahe jeden geschäftlichen Anwendungsfall zu erhalten. Einige Beispiele umfassen die Vorhersage der Wahrscheinlichkeit von Kundenabwanderungen oder Mitarbeiterfluktuationen, die Bewertung von Vertriebs-Leads und die Bewertung von Kreditrisiken. Um Amazon zur Bereitstellung von Prognosen verwenden QuickSight zu können, müssen die SageMaker KI-Modelldaten sowohl für die Eingabe als auch für die Ausgabe in tabellarischer Form vorliegen. In Anwendungsfällen mit mehreren Klassen oder Bezeichnungen darf jede Ausgabespalte nur einen einzigen Wert enthalten. Amazon unterstützt QuickSight nicht mehrere Werte in einer einzelnen Spalte.

Wie funktioniert die SageMaker KI-Integration

Im Allgemeinen funktioniert der Prozess folgendermaßen:

  1. Ein QuickSight Amazon-Administrator fügt Amazon Berechtigungen für QuickSight den Zugriff auf SageMaker KI hinzu. Öffnen Sie dazu auf der QuickSight Seite „Verwalten“ die Einstellungen für Sicherheit und Berechtigungen. Gehen Sie zum QuickSightZugriff auf AWS Dienste und fügen Sie SageMaker KI hinzu.

    Wenn Sie diese Berechtigungen hinzufügen, QuickSight wird Amazon einer Rolle AWS Identity and Access Management (IAM) hinzugefügt, die Zugriff auf die Auflistung aller SageMaker KI-Modelle in Ihrem AWS Konto bietet. Es bietet auch Berechtigungen zum Ausführen von SageMaker KI-Jobs, deren Namen ein Präfix ist. quicksight-auto-generated-

  2. Wir empfehlen, dass Sie eine Verbindung zu einem SageMaker KI-Modell herstellen, das über eine Inferenzpipeline verfügt, da dieses automatisch die Datenvorverarbeitung durchführt. Weitere Informationen finden Sie unter Deploy an Inference Pipeline im SageMaker AI Developer Guide.

  3. Nachdem Sie die Daten und das vorgeschulte Modell, das Sie gemeinsam verwenden möchten, identifiziert haben, erstellt der Besitzer des Modells eine Schemadatei und stellt diese bereit. Diese JSON Datei ist ein Vertrag mit SageMaker AI. Sie stellt Metadaten zu den Feldern, Datentypen, Spaltenreihenfolge, Ausgabe und Einstellungen bereit, die das Modell erwartet. Die optionale Einstellungskomponente stellt die Instance-Größe und -Anzahl der für den Auftrag zu verwendenden Datenverarbeitungs-Instances bereit.

    Wenn Sie der Daten-Wissenschaftler sind, der das Modell entwickelt hat, erstellen Sie diese Schemadatei in dem nachfolgend dokumentierten Format. Wenn Sie ein Nutzer des Modells sind, rufen Sie die Schemadatei vom Besitzer des Modells ab.

  4. In Amazon QuickSight erstellen Sie zunächst einen neuen Datensatz mit den Daten, für die Sie Vorhersagen treffen möchten. Wenn Sie eine Datei hochladen, können Sie das SageMaker KI-Modell auf dem Bildschirm mit den Upload-Einstellungen hinzufügen. Andernfalls fügen Sie das Modell auf der Seite der Datenvorbereitung hinzu.

    Bevor Sie fortfahren, überprüfen Sie die Zuweisungen zwischen dem Dataset und dem Modell.

  5. Nachdem die Daten in den Datensatz importiert wurden, enthalten die Ausgabefelder die von SageMaker AI zurückgegebenen Daten. Diese Felder können genauso wie andere Felder im Rahmen der unter Richtlinien für die Verwendung beschriebenen Richtlinien verwendet werden.

    Wenn Sie die SageMaker KI-Integration ausführen, QuickSight leitet Amazon eine Anfrage an SageMaker AI weiter, um Batch-Transformationsjobs mit Inferenz-Pipelines auszuführen. Amazon QuickSight beginnt mit der Bereitstellung und Bereitstellung der in Ihrem AWS Konto benötigten Instances. Wenn die Verarbeitung abgeschlossen ist, werden diese Instances heruntergefahren und beendet. Die Rechenkapazität verursacht nur bei der Verarbeitung von Modellen Kosten.

    Um Ihnen die Identifizierung zu erleichtern, QuickSight benennt Amazon alle seine SageMaker KI-Jobs mit dem Präfixquicksight-auto-generated-.

  6. Die Ausgabe der Inferenz wird gespeichert in SPICE und an den Datensatz angehängt. Sobald die Inferenz abgeschlossen ist, können Sie das Dataset verwenden, um Visualisierungen und Dashboards mithilfe der Vorhersagedaten zu erstellen.

  7. Die Datenaktualisierung wird jedes Mal, wenn Sie das Dataset speichern, gestartet. Sie können den Datenaktualisierungsprozess manuell starten, indem Sie den SPICE Datensatz, oder Sie können ihn so planen, dass er in regelmäßigen Intervallen ausgeführt wird. Bei jeder Datenaktualisierung ruft das System automatisch die SageMaker AI-Batchtransformation auf, um die Ausgabefelder mit neuen Daten zu aktualisieren.

    Sie können den Amazon benutzen QuickSight SPICE APIAufnahmevorgänge zur Steuerung des Datenaktualisierungsprozesses. Weitere Informationen zur Verwendung dieser API Operationen finden Sie in der QuickSight APIAmazon-Referenz.

Anfallende Kosten (keine zusätzlichen Kosten bei Integration selbst)

Für die Nutzung dieses Feature fällt an sich keine zusätzliche Gebühr an. Ihre Kosten beinhalten Folgendes:

  • Die Kosten für die Modellbereitstellung mithilfe von SageMaker KI, die nur anfallen, wenn das Modell läuft. Durch das Speichern eines Datensatzes - nachdem er entweder erstellt oder bearbeitet wurde - oder dessen Daten aktualisiert wurden, wird der Datenaufnahmeprozess gestartet. Dieser Prozess beinhaltet den Aufruf von SageMaker KI, wenn der Datensatz abgeleitete Felder enthält. Die Kosten fallen auf demselben AWS Konto an, auf dem sich Ihr QuickSight Abonnement befindet.

  • Ihre QuickSight Abonnementkosten sind wie folgt:

    • Die Kosten für das Speichern Ihrer Daten in der In-Memory-Berechnungsengine in QuickSight (SPICE). Wenn Sie neue Daten hinzufügen zu SPICE, müssen Sie möglicherweise genug kaufen SPICE Kapazität, es unterzubringen.

    • QuickSight Abonnements für die Autoren oder Administratoren, die die Datensätze erstellen.

    • Pay-per-session Gebühren für Zuschauer (Leser) für den Zugriff auf interaktive Dashboards.

Richtlinien für die Verwendung

Bei Amazon QuickSight gelten die folgenden Nutzungsrichtlinien für diese Enterprise Edition-Funktion:

  • Die Verarbeitung des Modells erfolgt in SPICEDaher kann es nur für Datasets gelten, die in gespeichert sind. SPICE. Der Prozess unterstützt derzeit bis zu 500 Millionen Zeilen pro Datensatz.

  • Nur QuickSight Administratoren oder Autoren können Datensätze mit ML-Modellen erweitern. Leser können die Ergebnisse nur anzeigen, wenn sie Teil eines Dashboards sind.

  • Jedes Dataset kann mit nur einem einzigen ML-Modell arbeiten.

  • Ausgabefelder können nicht zum Berechnen neuer Felder verwendet werden.

  • Datasets können nicht nach Feldern gefiltert werden, die in das Modell integriert sind. Mit anderen Worten: Wenn das Dataset-Feld derzeit dem ML-Modell zugeordnet ist, können Sie nicht nach diesem Feld filtern.

In SageMaker KI gelten die folgenden Nutzungsrichtlinien für ein vortrainiertes Modell, das Sie mit Amazon QuickSight verwenden:

  • Wenn Sie das Modell erstellen, verknüpfen Sie es mit dem Amazon-Ressourcennamen (ARN) für die entsprechende IAM Rolle. Die IAM Rolle für das SageMaker KI-Modell muss Zugriff auf den Amazon S3 S3-Bucket haben, den Amazon QuickSight verwendet.

  • Stellen Sie sicher, dass Ihr Modell CSV-Dateien sowohl für die Eingabe als auch für die Ausgabe unterstützt. Stellen Sie sicher, dass die Daten in einer Tabelle vorliegen.

  • Stellen Sie eine Schemadatei bereit, die Metadaten zum Modell enthält, einschließlich der Liste der Eingabe- und Ausgabefelder. Derzeit müssen Sie diese Schemadatei manuell erstellen.

  • Berücksichtigen Sie die Zeit, die zum Abschließen der Inferenz benötigt wird. Diese hängt von einer Reihe von Faktoren ab. Dazu gehören die Komplexität des Modells, die Datenmenge und die definierte Rechenkapazität. Das Abschließen der Inferenz kann einige Minuten bis mehrere Stunden dauern. Amazon QuickSight begrenzt alle Datenaufnahme- und Inferenzaufträge auf maximal 10 Stunden. Um die Zeit zu verkürzen, die zum Ausführen einer Inferenz erforderlich ist, sollten Sie erwägen, die Instance-Größe oder die Anzahl der Instances zu erhöhen.

  • Derzeit können Sie für die Integration mit SageMaker KI nur Batch-Transformationen verwenden, keine Echtzeitdaten. Sie können keinen SageMaker KI-Endpunkt verwenden.

Definieren der Schemadatei

Bevor Sie ein SageMaker KI-Modell mit QuickSight Amazon-Daten verwenden, erstellen Sie die JSON Schemadatei, die die Metadaten enthält, die Amazon zur Verarbeitung des Modells QuickSight benötigt. Der QuickSight Amazon-Autor oder -Administrator lädt die Schemadatei bei der Konfiguration des Datensatzes hoch.

Die Schemafelder sind wie folgt definiert. Alle Felder sind erforderlich, sofern nicht in der folgenden Beschreibung angegeben. Bei Attributen wird zwischen Groß- und Kleinschreibung unterschieden.

inputContentType

Der Inhaltstyp, den dieses SageMaker KI-Modell für die Eingabedaten erwartet. Der einzige unterstützte Wert dafür ist"text/csv". QuickSight enthält keinen der Header-Namen, die Sie der Eingabedatei hinzufügen.

outputContentType

Der Inhaltstyp der Ausgabe, die von dem SageMaker KI-Modell erzeugt wird, das Sie verwenden möchten. Der einzige unterstützte Wert hierfür ist "text/csv".

input

Eine Liste der Funktionen, die das Modell in den Eingabedaten erwartet. QuickSight erzeugt die Eingabedaten in genau derselben Reihenfolge. Diese Liste enthält die folgenden Attribute:

  • name – Der Name der Spalte. Wenn möglich, geben Sie diesem Namen den Namen der entsprechenden Spalte im QuickSight Datensatz an. Dieses Attribut ist auf 100 Zeichen begrenzt.

  • type – Der Datentyp dieser Spalte. Dieses Attribut akzeptiert die Werte "INTEGER", "STRING" und "DECIMAL".

  • type – (Optional) Die NULL-Zulässigkeit des Feldes. Der Standardwert ist true. Wenn Sie nullable auf setzenfalse, werden QuickSight Zeilen gelöscht, die diesen Wert nicht enthalten, bevor SageMaker AI aufgerufen wird. Auf diese Weise wird verhindert, dass SageMaker KI bei fehlenden erforderlichen Daten ausfällt.

output

Eine Liste der Ausgabespalten, die das SageMaker KI-Modell erzeugt. QuickSighterwartet diese Felder in genau derselben Reihenfolge. Diese Liste enthält die folgenden Attribute:

  • name — Dieser Name wird zum Standardnamen für die entsprechende neue Spalte, die in erstellt wird QuickSight. Sie können den hier in angegebenen Namen überschreiben QuickSight. Dieses Attribut ist auf 100 Zeichen begrenzt.

  • type – Der Datentyp dieser Spalte. Dieses Attribut akzeptiert die Werte "INTEGER", "STRING" und "DECIMAL".

instanceTypes

Eine Liste der ML-Instanztypen, die SageMaker KI für die Ausführung des Transformationsjobs bereitstellen kann. Die Liste wird dem QuickSight Benutzer zur Auswahl zur Verfügung gestellt. Diese Liste ist auf die von SageMaker KI unterstützten Typen beschränkt. Weitere Informationen zu den unterstützten Typen finden Sie TransformResourcesim SageMaker AI Developer Guide.

defaultInstanceType

(Optional) Der Instanztyp, der im SageMaker AI-Assistenten unter als Standardoption dargestellt wird QuickSight. Fügen Sie diesen Instance-Typ in instanceTypes ein.

instanceCount

(Optional) Die Anzahl der Instanzen definiert, wie viele der ausgewählten Instanzen von SageMaker AI zur Ausführung des Transformationsjobs bereitgestellt werden sollen. Der Wert muss eine positive Ganzzahl sein.

description

Dieses Feld bietet der Person, der das SageMaker KI-Modell gehört, die Möglichkeit, mit der Person zu kommunizieren, in der dieses Modell verwendet wird QuickSight. Verwenden Sie dieses Feld, um Hinweise zur erfolgreichen Verwendung dieses Modells bereitzustellen. Dieses Feld kann z. B. Informationen zur Auswahl eines effektiven Instance-Typs enthalten, der aus der Liste in instanceTypes auszuwählen ist, basierend auf der Größe des Datasets. Dieses Feld ist auf 1.000 Zeichen beschränkt.

Version

Die Version des Schemas, zum Beispiel "1.0".

Das folgende Beispiel zeigt die Struktur von JSON in der Schemadatei.

{ "inputContentType": "CSV", "outputContentType": "CSV", "input": [ { "name": "buying", "type": "STRING" }, { "name": "maint", "type": "STRING" }, { "name": "doors", "type": "INTEGER" }, { "name": "persons", "type": "INTEGER" }, { "name": "lug_boot", "type": "STRING" }, { "name": "safety", "type": "STRING" } ], "output": [ { "name": "Acceptability", "type": "STRING" } ], "description": "Use ml.m4.xlarge instance for small datasets, and ml.m4.4xlarge for datasets over 10 GB", "version": "1.0", "instanceCount": 1, "instanceTypes": [ "ml.m4.xlarge", "ml.m4.4xlarge" ], "defaultInstanceType": "ml.m4.xlarge" }

Die Struktur der Schemadatei hängt von der Art des Modells ab, das in den von SageMaker AI bereitgestellten Beispielen verwendet wird.

Hinzufügen eines SageMaker KI-Modells zu Ihrem QuickSight Datensatz

Mit dem folgenden Verfahren können Sie Ihrem Datensatz ein vortrainiertes SageMaker KI-Modell hinzufügen, sodass Sie prädiktive Daten in Analysen und Dashboards verwenden können.

Bevor Sie beginnen, sollten Sie Folgendes verfügbar haben:

  • Die Daten, die Sie zum Erstellen des Datasets verwenden möchten

  • Der Name des SageMaker KI-Modells, das Sie zur Erweiterung des Datensatzes verwenden möchten.

  • Das Schema des Modells. Dieses Schema umfasst Feldnamenzuweisungen und Datentypen. Es ist hilfreich, wenn es auch empfohlene Einstellungen für den Instance-Typ und die Anzahl der zu verwendenden Instances enthält.

Um Ihren QuickSight Amazon-Datensatz mit SageMaker KI zu erweitern
  1. Erstellen Sie auf der Startseite ein neues Dataset, indem Sie Datasets (Datensatz) und dann New data set (Neues Dataset) auswählen.

    Sie können auch ein vorhandenes Dataset bearbeiten.

  2. Wählen Sie SageMaker auf dem Bildschirm zur Datenvorbereitung die Option Erweitern mit.

  3. Wählen Sie unter Select your model (Modell auswählen) die folgenden Einstellungen aus:

    • Modell — Wählen Sie das SageMaker KI-Modell aus, das zum Ableiten von Feldern verwendet werden soll.

    • Name – Geben Sie einen aussagekräftigen Namen für das Modell an.

    • Schema — Laden Sie die für das Modell bereitgestellte JSON Schemadatei hoch.

    • Erweiterte Einstellungen — QuickSight empfiehlt die ausgewählten Standardwerte auf der Grundlage Ihres Datensatzes. Sie können bestimmte Laufzeiteinstellungen verwenden, um die Geschwindigkeit und die Kosten Ihres Auftrags auszugleichen. Geben Sie dazu die SageMaker AI ML-Instanztypen für Instanztyp und die Anzahl der Instanzen für Count ein.

    Wählen Sie Next (Weiter), um fortzufahren.

  4. Überprüfen Sie unter Eingaben überprüfen die Felder, die Ihrem Datensatz zugeordnet sind. QuickSight versucht, die Felder in Ihrem Schema automatisch den Feldern in Ihrem Datensatz zuzuordnen. Sie können hier Änderungen vornehmen, wenn die Zuweisung angepasst werden muss.

    Wählen Sie Next (Weiter), um fortzufahren.

  5. Prüfen Sie unter Review outputs (Ausgaben überprüfen) die Felder, die Ihrem Dataset hinzugefügt werden.

    Wählen Sie Save and prepare data (Speichern und Daten vorbereiten) aus, um Ihre Auswahl zu bestätigen.

  6. Um die Daten zu aktualisieren, wählen Sie das Dataset aus, um Details anzuzeigen. Wählen Sie dann entweder Refresh Now (Jetzt aktualisieren) aus, um die Daten manuell zu aktualisieren, oder wählen Sie Schedule refresh (Aktualisierung planen) aus, um ein regelmäßiges Aktualisierungsintervall einzurichten. Bei jeder Datenaktualisierung führt das System automatisch den SageMaker AI-Batch-Transformationsjob aus, um die Ausgabefelder mit neuen Daten zu aktualisieren.