Schritte für den Datenfluss bearbeiten - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Schritte für den Datenfluss bearbeiten

In Amazon SageMaker Canvas können Sie einzelne Schritte in Ihren Datenflüssen bearbeiten, um Ihren Datensatz zu transformieren, ohne einen neuen Datenfluss erstellen zu müssen. Auf der folgenden Seite wird beschrieben, wie Sie die Schritte zum Zusammenfügen und Verketten sowie die Schritte zur Datenquelle bearbeiten.

Bearbeiten Sie die Schritte zum Verbinden und Verketten

Innerhalb Ihrer Datenflüsse haben Sie die Flexibilität, Ihre Schritte zum Verbinden und Verketten zu bearbeiten. Sie können die erforderlichen Anpassungen an Ihrem Datenverarbeitungsablauf vornehmen und so sicherstellen, dass Ihre Daten ordnungsgemäß kombiniert und transformiert werden, ohne dass Sie Ihren gesamten Datenfluss wiederholen müssen.

Gehen Sie wie folgt vor, um einen Join- oder Verkettungsschritt in Ihrem Datenfluss zu bearbeiten:

  1. Öffnen Sie Ihren Datenfluss.

  2. Wählen Sie das Plussymbol (+) neben dem Join- oder Concatenate-Node, den Sie bearbeiten möchten.

  3. Klicken Sie im Kontextmenü auf Edit (Bearbeiten).

  4. Ein Seitenbereich wird geöffnet, in dem Sie die Details Ihrer Verknüpfung oder Verkettung bearbeiten können. Ändern Sie Ihre Schrittfelder, z. B. die Art der Verknüpfung. Um einen Datenknoten auszutauschen und einen anderen zum Verbinden oder Verketten auszuwählen, klicken Sie auf das Löschsymbol neben dem Knoten und wählen dann in der Datenflussansicht den neuen Knoten aus, den Sie in Ihre Transformation einbeziehen möchten.

    Anmerkung

    Wenn Sie während des Bearbeitungsvorgangs einen Knoten austauschen, können Sie nur Schritte auswählen, die vor dem Zusammenfügen oder Verketten ausgeführt wurden. Sie können entweder den linken oder den rechten Knoten austauschen, aber Sie können jeweils nur einen Knoten austauschen. Außerdem können Sie keinen Quellknoten als Ersatz auswählen.

  5. Wählen Sie Vorschau, um das Ergebnis des Kombinationsvorgangs anzuzeigen.

  6. Wählen Sie Aktualisieren aus, um Ihre Änderungen zu speichern.

Ihr Datenfluss sollte jetzt aktualisiert sein.

Bearbeiten oder ersetzen Sie einen Datenquellenschritt

Möglicherweise müssen Sie Änderungen an Ihrer Datenquelle oder Ihrem Datensatz vornehmen, ohne die Transformationen und Datenflussschritte zu löschen, die auf Ihre Originaldaten angewendet wurden. In Data Wrangler können Sie Ihre Datenquellenkonfiguration bearbeiten oder ersetzen und dabei die Schritte Ihres Datenflusses beibehalten. Wenn Sie eine Datenquelle bearbeiten, können Sie die Importeinstellungen ändern, z. B. die Stichprobengröße oder -methode und alle erweiterten Einstellungen. Sie können auch weitere Dateien mit demselben Schema hinzufügen oder für abfragebasierte Datenquellen wie Amazon Athena die Abfrage bearbeiten. Wenn Sie eine Datenquelle ersetzen, haben Sie die Möglichkeit, einen anderen Datensatz auszuwählen oder die Daten sogar aus einer anderen Datenquelle zu importieren, sofern das Schema der neuen Daten mit den Originaldaten übereinstimmt.

Gehen Sie wie folgt vor, um eine Datenquellenkonfiguration zu bearbeiten:

  1. Gehen Sie in der Canvas-Anwendung zur Data Wrangler-Seite.

  2. Wählen Sie Ihren Datenfluss aus, um ihn anzuzeigen.

  3. Suchen Sie auf der Registerkarte Datenfluss, auf der Ihre Datenflussschritte angezeigt werden, den Quellknoten, den Sie bearbeiten möchten.

  4. Wählen Sie das Ellipsensymbol neben dem Quellknoten aus.

  5. Klicken Sie im Kontextmenü auf Edit (Bearbeiten).

  6. Für Amazon S3 S3-Datenquellen und lokalen Upload haben Sie die Möglichkeit, mehr Dateien mit demselben Schema wie Ihre Originaldaten auszuwählen oder hochzuladen. Für abfragebasierte Datenquellen wie Amazon Athena können Sie verschiedene Tabellen im Visual Query Builder entfernen und auswählen, oder Sie können die SQL Abfrage direkt bearbeiten. Wählen Sie abschließend Weiter.

  7. Nehmen Sie für die Importeinstellungen die gewünschten Änderungen vor.

  8. Wenn Sie fertig sind, wählen Sie Änderungen speichern.

Ihre Datenquelle sollte jetzt aktualisiert sein.

Gehen Sie wie folgt vor, um eine Datenquelle zu ersetzen:

  1. Rufen Sie in der Canvas-Anwendung die Data Wrangler-Seite auf.

  2. Wählen Sie Ihren Datenfluss aus, um ihn anzuzeigen.

  3. Suchen Sie auf der Registerkarte Datenfluss, auf der Ihre Datenflussschritte angezeigt werden, den Quellknoten, den Sie bearbeiten möchten.

  4. Wählen Sie das Ellipsensymbol neben dem Quellknoten aus.

  5. Wählen Sie im Kontextmenü die Option Ersetzen aus.

  6. Gehen Sie die Schritte zum Erstellen eines Datenflusses durch, um eine andere Datenquelle und Daten auszuwählen.

  7. Wenn Sie Ihre Daten ausgewählt haben und bereit sind, den Quellknoten zu aktualisieren, wählen Sie Speichern aus.

Sie sollten jetzt sehen, dass der Quellknoten in Ihrem Datenfluss aktualisiert wurde.