Wir aktualisieren den Amazon Machine Learning Learning-Service nicht mehr und akzeptieren keine neuen Benutzer mehr dafür. Diese Dokumentation ist für bestehende Benutzer verfügbar, wir aktualisieren sie jedoch nicht mehr. Weitere Informationen finden Sie unterWas Amazon Machine Learning.
Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Schritt 2: Erstellen einer Schulungsdatenquelle
Nachdem Sie das hochgeladen habenbanking.csv
-Datensatz an Ihren Amazon Simple Storage Service (Amazon S3) -Speicherort (Amazon S3), erstellen Sie damit eine Schulungsdatenquelle. Eine Datenquelle ist ein Amazon Machine Learning (Amazon ML) -Objekt, das den Speicherort Ihrer Input-Daten sowie wichtige Metadaten zu Ihren Input-Daten enthält. Amazon ML verwendet die Datenquelle für Operationen wie die ML-Modellschulung und -evaluierung.
Geben Sie Folgendes an, um eine Datenquelle zu erstellen:
-
Den Amazon S3 S3-Speicherort Ihrer Daten und die Berechtigung für den Zugriff auf die Daten
-
Das Schema, das die Namen der Attribute in den Daten und den Typ der einzelnen Attribute (numerisch, Text, kategorisch oder Binary) enthält
-
Den Namen des Attributs, das die Antwort enthält, deren Voraussage Amazon ML lernen soll, also das Zielattribut
Anmerkung
Die Datenquelle speichert Ihre Daten nicht, sondern verweist nur darauf. Vermeiden Sie es, die in Amazon S3 gespeicherten Dateien zu verschieben oder zu ändern Wenn Sie sie verschieben oder ändern, kann Amazon ML nicht auf sie zugreifen, um ein ML-Modell zu erstellen, Evaluierungen zu generieren oder Voraussagen zu machen.
Vorgehensweise zum Erstellen der Schulungsdatenquelle
Öffnen Sie die Amazon Machine Learning Konsole unterhttps://console.aws.amazon.com/machinelearning/
aus. -
Wählen Sie Get started.
Anmerkung
In diesem Tutorial wird davon ausgegangen, dass Sie zum ersten Mal Amazon ML verwenden. Wenn Sie bereits Amazon ML verwendet haben, können Sie dieErstellen eines neuen...Dropdownliste auf dem Amazon ML -Dashboard, um eine neue Datenquelle zu erstellen.
-
Auf derErste Schritte mit Amazon Machine Learning-Seite, wählenstartenaus.
-
Stellen Sie auf der Seite Eingabedaten sicher, dass bei Where is your data located? (Wo befinden sich Ihre Daten?) die Option S3 ausgewählt ist.
-
FürS3-Speicherort, geben Sie den vollständigen Standort des
banking.csv
Datei aus Schritt 1: Vorbereiten der Daten. Beispiel:Ihr Bucket
/banking.csv
aus. Amazon ML stellt Ihrem Bucket-Namen s3://voran. -
Geben Sie bei Datenquellenname den Wert
Banking Data 1
ein. -
Wählen Sie Überprüfen.
-
Klicken Sie im Dialogfeld S3 permissions (S3-Berechtigungen) auf Ja.
-
Wenn Amazon ML auf die Datendatei am S3-Speicherort zugreifen und diese lesen kann, wird Ihnen eine Seite wie die folgende angezeigt. Überprüfen Sie die Eigenschaften und wählen Sie dann Weiter aus.
Als Nächstes erstellen Sie ein Schema. EINSchemastellt die Informationen dar, die Amazon ML zur Deutung der Input-Daten für ein ML-Modell benötigt, einschließlich Attributnamen und ihre zugeordneten Datentypen sowie die Namen besonderer Attribute. Es gibt zwei Möglichkeiten, Amazon ML ein Schema bereitzustellen:
-
Stellen Sie eine separate Schemadatei bereit, wenn Sie Ihre Amazon S3 S3-Daten hochladen.
-
Erlauben Sie es Amazon ML, die Attributtypen abzuleiten und ein Schema für Sie zu erstellen.
In diesem Tutorial werden wir Amazon ML ein Schema ableiten lassen.
Weitere Informationen zum Erstellen einer separaten Schemadatei finden Sie unter Das Erstellen eines Datenschemas für Amazon ML.
So erlauben Sie es Amazon ML, das Ableiten eines Schemas
-
Auf derSchema-Seite zeigt Amazon ML Ihnen das abgeleitete Schema. Überprüfen Sie die Datentypen, die Amazon ML für die Attribute abgeleitet hat. Es ist wichtig, dass Attribute dem richtigen Datentyp zugeordnet sind, damit Amazon ML die Daten richtig aufnehmen kann und eine ordnungsgemäße Funktionsverarbeitung für die Attribute ermöglicht wird.
-
Attribute, für die es nur zwei mögliche Status gibt wie "Ja" oder "Nein", sollten als Binary markiert werden.
-
Attribute, die Zahlen oder Zeichenfolgen zur Kennzeichnung einer Kategorie sind, sollten als Categorical markiert werden.
-
Attribute, die numerischen Mengen sind und bei denen die Reihenfolge wichtig ist, sollten als Numeric markiert werden.
-
Attribute, die Zeichenfolgen sind und als durch Leerzeichen getrennte Wörter gehandhabt werden sollen, sollten als Text markiert werden.
-
-
In diesem Tutorial hat Amazon ML die Datentypen für alle Attribute richtig identifiziert, also klicken wir aufContinueaus.
Wählen Sie als Nächstes ein Zielattribut aus.
Denken Sie daran, dass das Zielattribut das Attribut ist, dessen Voraussage das ML-Modell lernen soll. Attribut y gibt an, ob eine Person in der Vergangenheit eine Kampagne abonniert hat: 1 (Ja) oder 0 (Nein).
Anmerkung
Wählen Sie ein Zielattribut nur aus, wenn Sie die Datenquelle für die Schulung und Evaluierung von ML-Modellen verwenden werden.
Vorgehensweise zum Auswählen von y als Zielattribut
-
Klicken Sie unten rechts in der Tabelle auf den einzelnen Pfeil, um zur letzten Seite der Tabelle zu gelangen, auf der das Attribut
y
angezeigt wird. -
Wählen Sie in der Spalte Ziel den Wert
y
aus.Amazon ML bestätigt, dassywird als Ziel ausgewählt.
-
Klicken Sie auf Continue.
-
Vergewissern Sie sich, dass auf der Seite Zeilen-ID bei Does your data contain an identifier? (Enthalten Ihre Daten eine ID?) die Standardeinstellung Nein ausgewählt ist.
-
Klicken Sie auf Review und dann auf Continue.
Nun, da Sie eine Schulungsdatenquelle haben, können Sie Ihr Modell erstellen.