Schritt 2: Erstellen einer Schulungsdatenquelle - Amazon Machine Learning

Wir aktualisieren den Amazon Machine Learning Learning-Service nicht mehr und akzeptieren keine neuen Benutzer mehr dafür. Diese Dokumentation ist für bestehende Benutzer verfügbar, wir aktualisieren sie jedoch nicht mehr. Weitere Informationen finden Sie unterWas Amazon Machine Learning.

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Schritt 2: Erstellen einer Schulungsdatenquelle

Nachdem Sie das hochgeladen habenbanking.csv-Datensatz an Ihren Amazon Simple Storage Service (Amazon S3) -Speicherort (Amazon S3), erstellen Sie damit eine Schulungsdatenquelle. Eine Datenquelle ist ein Amazon Machine Learning (Amazon ML) -Objekt, das den Speicherort Ihrer Input-Daten sowie wichtige Metadaten zu Ihren Input-Daten enthält. Amazon ML verwendet die Datenquelle für Operationen wie die ML-Modellschulung und -evaluierung.

Geben Sie Folgendes an, um eine Datenquelle zu erstellen:

  • Den Amazon S3 S3-Speicherort Ihrer Daten und die Berechtigung für den Zugriff auf die Daten

  • Das Schema, das die Namen der Attribute in den Daten und den Typ der einzelnen Attribute (numerisch, Text, kategorisch oder Binary) enthält

  • Den Namen des Attributs, das die Antwort enthält, deren Voraussage Amazon ML lernen soll, also das Zielattribut

Anmerkung

Die Datenquelle speichert Ihre Daten nicht, sondern verweist nur darauf. Vermeiden Sie es, die in Amazon S3 gespeicherten Dateien zu verschieben oder zu ändern Wenn Sie sie verschieben oder ändern, kann Amazon ML nicht auf sie zugreifen, um ein ML-Modell zu erstellen, Evaluierungen zu generieren oder Voraussagen zu machen.

Vorgehensweise zum Erstellen der Schulungsdatenquelle
  1. Öffnen Sie die Amazon Machine Learning Konsole unterhttps://console.aws.amazon.com/machinelearning/aus.

  2. Wählen Sie Get started.

    Anmerkung

    In diesem Tutorial wird davon ausgegangen, dass Sie zum ersten Mal Amazon ML verwenden. Wenn Sie bereits Amazon ML verwendet haben, können Sie dieErstellen eines neuen...Dropdownliste auf dem Amazon ML -Dashboard, um eine neue Datenquelle zu erstellen.

  3. Auf derErste Schritte mit Amazon Machine Learning-Seite, wählenstartenaus.

    Amazon Machine Learning interface with "Launch" button highlighted for standard setup.
  4. Stellen Sie auf der Seite Eingabedaten sicher, dass bei Where is your data located? (Wo befinden sich Ihre Daten?) die Option S3 ausgewählt ist.

    Radio button selection between S3 and Redshift options, with S3 selected.
  5. FürS3-Speicherort, geben Sie den vollständigen Standort desbanking.csv Datei aus Schritt 1: Vorbereiten der Daten. Beispiel:Ihr Bucket/banking.csvaus. Amazon ML stellt Ihrem Bucket-Namen s3://voran.

  6. Geben Sie bei Datenquellenname den WertBanking Data 1 ein.

    S3 location input field and Datasource name field for entering banking data information.
  7. Wählen Sie Überprüfen.

  8. Klicken Sie im Dialogfeld S3 permissions (S3-Berechtigungen) auf Ja.

    Dialog box asking to grant Amazon Machine Learning read permission for S3 location.
  9. Wenn Amazon ML auf die Datendatei am S3-Speicherort zugreifen und diese lesen kann, wird Ihnen eine Seite wie die folgende angezeigt. Überprüfen Sie die Eigenschaften und wählen Sie dann Weiter aus.

    Validation success message with datasource details including name, location, and file information.

Als Nächstes erstellen Sie ein Schema. EINSchemastellt die Informationen dar, die Amazon ML zur Deutung der Input-Daten für ein ML-Modell benötigt, einschließlich Attributnamen und ihre zugeordneten Datentypen sowie die Namen besonderer Attribute. Es gibt zwei Möglichkeiten, Amazon ML ein Schema bereitzustellen:

  • Stellen Sie eine separate Schemadatei bereit, wenn Sie Ihre Amazon S3 S3-Daten hochladen.

  • Erlauben Sie es Amazon ML, die Attributtypen abzuleiten und ein Schema für Sie zu erstellen.

In diesem Tutorial werden wir Amazon ML ein Schema ableiten lassen.

Weitere Informationen zum Erstellen einer separaten Schemadatei finden Sie unter Das Erstellen eines Datenschemas für Amazon ML.

So erlauben Sie es Amazon ML, das Ableiten eines Schemas
  1. Auf derSchema-Seite zeigt Amazon ML Ihnen das abgeleitete Schema. Überprüfen Sie die Datentypen, die Amazon ML für die Attribute abgeleitet hat. Es ist wichtig, dass Attribute dem richtigen Datentyp zugeordnet sind, damit Amazon ML die Daten richtig aufnehmen kann und eine ordnungsgemäße Funktionsverarbeitung für die Attribute ermöglicht wird.

    • Attribute, für die es nur zwei mögliche Status gibt wie "Ja" oder "Nein", sollten als Binary markiert werden.

    • Attribute, die Zahlen oder Zeichenfolgen zur Kennzeichnung einer Kategorie sind, sollten als Categorical markiert werden.

    • Attribute, die numerischen Mengen sind und bei denen die Reihenfolge wichtig ist, sollten als Numeric markiert werden.

    • Attribute, die Zeichenfolgen sind und als durch Leerzeichen getrennte Wörter gehandhabt werden sollen, sollten als Text markiert werden.

    Data table showing fields like age, campaign, and contact with their data types and sample values.
  2. In diesem Tutorial hat Amazon ML die Datentypen für alle Attribute richtig identifiziert, also klicken wir aufContinueaus.

Wählen Sie als Nächstes ein Zielattribut aus.

Denken Sie daran, dass das Zielattribut das Attribut ist, dessen Voraussage das ML-Modell lernen soll. Attribut y gibt an, ob eine Person in der Vergangenheit eine Kampagne abonniert hat: 1 (Ja) oder 0 (Nein).

Anmerkung

Wählen Sie ein Zielattribut nur aus, wenn Sie die Datenquelle für die Schulung und Evaluierung von ML-Modellen verwenden werden.

Vorgehensweise zum Auswählen von y als Zielattribut
  1. Klicken Sie unten rechts in der Tabelle auf den einzelnen Pfeil, um zur letzten Seite der Tabelle zu gelangen, auf der das Attribut y angezeigt wird.

    Navigation buttons for a paginated table, with the last page arrow highlighted.
  2. Wählen Sie in der Spalte Ziel den Wert y aus.

    Checkbox in Target column next to variable 'y' with Binary data type.

    Amazon ML bestätigt, dassywird als Ziel ausgewählt.

  3. Klicken Sie auf Continue.

  4. Vergewissern Sie sich, dass auf der Seite Zeilen-ID bei Does your data contain an identifier? (Enthalten Ihre Daten eine ID?) die Standardeinstellung Nein ausgewählt ist.

  5. Klicken Sie auf Review und dann auf Continue.

Nun, da Sie eine Schulungsdatenquelle haben, können Sie Ihr Modell erstellen.